niobures commited on Oct 23, 2025

Commit

3514ce4

verified ·

1 Parent(s): bc4180d

DPRNN (code, models, paper)

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +1 -0
Dual-Path Transformer Network. Direct Context-Aware Modeling for End-to-End Monaural Speech Separation.pdf +3 -0
code/DPTNet [Anyuan96] +1 Dual-Path-Transformer-Network-PyTorch.zip +3 -0
code/Dual-Path-Transformer-Network-PyTorch [ramincre] +4.zip +3 -0
code/Dual-Path-Transformer-Network-PyTorch.zip +3 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/.gitattributes +28 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/README.md +251 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_stats_8k/train/feats_stats.npz +3 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/96epoch.pth +3 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/RESULTS.md +20 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/config.yaml +147 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/backward_time.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/forward_time.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/gpu_max_cached_mem_GB.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/iter_time.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/loss.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/optim0_lr0.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/optim_step_time.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/si_snr.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/train_time.png +0 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/meta.yaml +8 -0
models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/source.txt +1 -0
models/DPRNNTasNet-ks16_WHAM_sepclean/.gitattributes +8 -0
models/DPRNNTasNet-ks16_WHAM_sepclean/README.md +107 -0
models/DPRNNTasNet-ks16_WHAM_sepclean/pytorch_model.bin +3 -0
models/DPRNNTasNet-ks16_WHAM_sepclean/source.txt +1 -0
models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/.gitattributes +8 -0
models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/README.md +82 -0
models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/pytorch_model.bin +3 -0
models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/source.txt +1 -0
models/DPRNNTasNet-ks2_WHAM_sepclean/.gitattributes +8 -0
models/DPRNNTasNet-ks2_WHAM_sepclean/README.md +84 -0
models/DPRNNTasNet-ks2_WHAM_sepclean/pytorch_model.bin +3 -0
models/DPRNNTasNet-ks2_WHAM_sepclean/source.txt +1 -0
models/DPRNNTasNet_LibriMix_sepclean/.gitattributes +35 -0
models/DPRNNTasNet_LibriMix_sepclean/epoch=9-step=1000.ckpt +3 -0
models/DPRNNTasNet_LibriMix_sepclean/source.txt +1 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/.gitattributes +27 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/README.md +251 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_stats_16k/train/feats_stats.npz +3 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/299epoch.pth +3 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/RESULTS.md +20 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/config.yaml +149 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/backward_time.png +0 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/forward_time.png +0 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/gpu_max_cached_mem_GB.png +0 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/iter_time.png +0 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/loss.png +0 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/optim0_lr0.png +0 -0
models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/optim_step_time.png +0 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Dual-Path[[:space:]]Transformer[[:space:]]Network.[[:space:]]Direct[[:space:]]Context-Aware[[:space:]]Modeling[[:space:]]for[[:space:]]End-to-End[[:space:]]Monaural[[:space:]]Speech[[:space:]]Separation.pdf filter=lfs diff=lfs merge=lfs -text

Dual-Path Transformer Network. Direct Context-Aware Modeling for End-to-End Monaural Speech Separation.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ff7d3877cae709c58afa97a92fa7acc5b8529b68e6aebdc171625c3021008044
+size 478343

code/DPTNet [Anyuan96] +1 Dual-Path-Transformer-Network-PyTorch.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce7da2cfb5c0e372222d04289ab7433c9ffbc1359e6615862141ea6b82704d78
+size 4735940

code/Dual-Path-Transformer-Network-PyTorch [ramincre] +4.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1b173491858a88fcdb3e10c971e060005f543ba74ee5c75ec77b4908489e5c0f
+size 5964111

code/Dual-Path-Transformer-Network-PyTorch.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:721fae34b2ba68815ab05c4bd3dc3c7fa9c882e9f092f43748b15d22cfe7178d
+size 4735712

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/.gitattributes ADDED Viewed

	@@ -0,0 +1,28 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zstandard filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/README.md ADDED Viewed

	@@ -0,0 +1,251 @@

+---
+tags:
+- espnet
+- audio
+- audio-to-audio
+language: en
+datasets:
+- wsj0_2mix
+license: cc-by-4.0
+---
+## ESPnet2 ENH model
+### `lichenda/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet`
+This model was trained by LiChenda using wsj0_2mix recipe in [espnet](https://github.com/espnet/espnet/).
+Imported from [zenodo](https://zenodo.org/record/4688000).
+### Demo: How to use in ESPnet2
+```bash
+cd espnet
+git checkout 54919e2529d6f58f4550d4a72960f57b83f66dc9
+pip install -e .
+cd egs2/wsj0_2mix/enh1
+./run.sh --skip_data_prep false --skip_train true --download_model lichenda/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet
+```
+<!-- Generated by ./scripts/utils/show_enh_score.sh -->
+# RESULTS
+## Environments
+- date: `Thu Apr 15 00:03:19 CST 2021`
+- python version: `3.7.10 (default, Feb 26 2021, 18:47:35)  [GCC 7.3.0]`
+- espnet version: `espnet 0.9.8`
+- pytorch version: `pytorch 1.5.0`
+- Git hash: `2aa2f151b5929dc9ffa4df39a8d8c26ca4dbdb85`
+  - Commit date: `Tue Mar 30 09:08:27 2021 +0900`
+## enh_train_enh_dprnn_tasnet_raw
+config: conf/tuning/train_enh_dprnn_tasnet.yaml
+|dataset|STOI|SAR|SDR|SIR|
+|---|---|---|---|---|
+|enhanced_cv_min_8k|0.960037|19.0476|18.5438|29.1591|
+|enhanced_tt_min_8k|0.968376|18.8209|18.2925|28.929|
+## ENH config
+<details><summary>expand</summary>
+```
+config: conf/tuning/train_enh_dprnn_tasnet.yaml
+print_config: false
+log_level: INFO
+dry_run: false
+iterator_type: chunk
+output_dir: exp/enh_train_enh_dprnn_tasnet_raw
+ngpu: 1
+seed: 0
+num_workers: 4
+num_att_plot: 3
+dist_backend: nccl
+dist_init_method: env://
+dist_world_size: 4
+dist_rank: 0
+local_rank: 0
+dist_master_addr: localhost
+dist_master_port: 45126
+dist_launcher: null
+multiprocessing_distributed: true
+unused_parameters: false
+sharded_ddp: false
+cudnn_enabled: true
+cudnn_benchmark: false
+cudnn_deterministic: true
+collect_stats: false
+write_collected_feats: false
+max_epoch: 150
+patience: 4
+val_scheduler_criterion:
+- valid
+- loss
+early_stopping_criterion:
+- valid
+- loss
+- min
+best_model_criterion:
+-   - valid
+    - si_snr
+    - max
+-   - valid
+    - loss
+    - min
+keep_nbest_models: 1
+grad_clip: 5.0
+grad_clip_type: 2.0
+grad_noise: false
+accum_grad: 1
+no_forward_run: false
+resume: true
+train_dtype: float32
+use_amp: false
+log_interval: null
+use_tensorboard: true
+use_wandb: false
+wandb_project: null
+wandb_id: null
+detect_anomaly: false
+pretrain_path: null
+init_param: []
+freeze_param: []
+num_iters_per_epoch: null
+batch_size: 4
+valid_batch_size: null
+batch_bins: 1000000
+valid_batch_bins: null
+train_shape_file:
+- exp/enh_stats_8k/train/speech_mix_shape
+- exp/enh_stats_8k/train/speech_ref1_shape
+- exp/enh_stats_8k/train/speech_ref2_shape
+valid_shape_file:
+- exp/enh_stats_8k/valid/speech_mix_shape
+- exp/enh_stats_8k/valid/speech_ref1_shape
+- exp/enh_stats_8k/valid/speech_ref2_shape
+batch_type: folded
+valid_batch_type: null
+fold_length:
+- 80000
+- 80000
+- 80000
+sort_in_batch: descending
+sort_batch: descending
+multiple_iterator: false
+chunk_length: 32000
+chunk_shift_ratio: 0.5
+num_cache_chunks: 1024
+train_data_path_and_name_and_type:
+-   - dump/raw/tr_min_8k/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/tr_min_8k/spk1.scp
+    - speech_ref1
+    - sound
+-   - dump/raw/tr_min_8k/spk2.scp
+    - speech_ref2
+    - sound
+valid_data_path_and_name_and_type:
+-   - dump/raw/cv_min_8k/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/cv_min_8k/spk1.scp
+    - speech_ref1
+    - sound
+-   - dump/raw/cv_min_8k/spk2.scp
+    - speech_ref2
+    - sound
+allow_variable_data_keys: false
+max_cache_size: 0.0
+max_cache_fd: 32
+valid_max_cache_size: null
+optim: adam
+optim_conf:
+    lr: 0.001
+    eps: 1.0e-08
+    weight_decay: 0
+scheduler: reducelronplateau
+scheduler_conf:
+    mode: min
+    factor: 0.7
+    patience: 1
+init: xavier_uniform
+model_conf:
+    loss_type: si_snr
+use_preprocessor: false
+encoder: conv
+encoder_conf:
+    channel: 64
+    kernel_size: 2
+    stride: 1
+separator: dprnn
+separator_conf:
+    num_spk: 2
+    layer: 6
+    rnn_type: lstm
+    bidirectional: true
+    nonlinear: relu
+    unit: 128
+    segment_size: 250
+    dropout: 0.1
+decoder: conv
+decoder_conf:
+    channel: 64
+    kernel_size: 2
+    stride: 1
+required:
+- output_dir
+version: 0.9.8
+distributed: true
+```
+</details>
+### Citing ESPnet
+```BibTex
+@inproceedings{watanabe2018espnet,
+  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
+  title={{ESPnet}: End-to-End Speech Processing Toolkit},
+  year={2018},
+  booktitle={Proceedings of Interspeech},
+  pages={2207--2211},
+  doi={10.21437/Interspeech.2018-1456},
+  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
+}
+@inproceedings{ESPnet-SE,
+  author = {Chenda Li and Jing Shi and Wangyou Zhang and Aswin Shanmugam Subramanian and Xuankai Chang and
+  Naoyuki Kamo and Moto Hira and Tomoki Hayashi and Christoph B{"{o}}ddeker and Zhuo Chen and Shinji Watanabe},
+  title = {ESPnet-SE: End-To-End Speech Enhancement and Separation Toolkit Designed for {ASR} Integration},
+  booktitle = {{IEEE} Spoken Language Technology Workshop, {SLT} 2021, Shenzhen, China, January 19-22, 2021},
+  pages = {785--792},
+  publisher = {{IEEE}},
+  year = {2021},
+  url = {https://doi.org/10.1109/SLT48900.2021.9383615},
+  doi = {10.1109/SLT48900.2021.9383615},
+  timestamp = {Mon, 12 Apr 2021 17:08:59 +0200},
+  biburl = {https://dblp.org/rec/conf/slt/Li0ZSCKHHBC021.bib},
+  bibsource = {dblp computer science bibliography, https://dblp.org}
+}
+```
+or arXiv:
+```bibtex
+@misc{watanabe2018espnet,
+  title={ESPnet: End-to-End Speech Processing Toolkit},
+  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
+  year={2018},
+  eprint={1804.00015},
+  archivePrefix={arXiv},
+  primaryClass={cs.CL}
+}
+```

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_stats_8k/train/feats_stats.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d890c44023968991b362b31f39fcecc453f0d619071befb36205d610e8aabb8b
+size 778

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/96epoch.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:338bc12bf9db30b178247f8b0b3ecbc24b1eff7739c4771f01aaaf1d456c5212
+size 10393743

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/RESULTS.md ADDED Viewed

	@@ -0,0 +1,20 @@

+<!-- Generated by ./scripts/utils/show_enh_score.sh -->
+# RESULTS
+## Environments
+- date: `Thu Apr 15 00:03:19 CST 2021`
+- python version: `3.7.10 (default, Feb 26 2021, 18:47:35)  [GCC 7.3.0]`
+- espnet version: `espnet 0.9.8`
+- pytorch version: `pytorch 1.5.0`
+- Git hash: `2aa2f151b5929dc9ffa4df39a8d8c26ca4dbdb85`
+  - Commit date: `Tue Mar 30 09:08:27 2021 +0900`
+## enh_train_enh_dprnn_tasnet_raw
+config: conf/tuning/train_enh_dprnn_tasnet.yaml
+|dataset|STOI|SAR|SDR|SIR|
+|---|---|---|---|---|
+|enhanced_cv_min_8k|0.960037|19.0476|18.5438|29.1591|
+|enhanced_tt_min_8k|0.968376|18.8209|18.2925|28.929|

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/config.yaml ADDED Viewed

	@@ -0,0 +1,147 @@

+config: conf/tuning/train_enh_dprnn_tasnet.yaml
+print_config: false
+log_level: INFO
+dry_run: false
+iterator_type: chunk
+output_dir: exp/enh_train_enh_dprnn_tasnet_raw
+ngpu: 1
+seed: 0
+num_workers: 4
+num_att_plot: 3
+dist_backend: nccl
+dist_init_method: env://
+dist_world_size: 4
+dist_rank: 0
+local_rank: 0
+dist_master_addr: localhost
+dist_master_port: 45126
+dist_launcher: null
+multiprocessing_distributed: true
+unused_parameters: false
+sharded_ddp: false
+cudnn_enabled: true
+cudnn_benchmark: false
+cudnn_deterministic: true
+collect_stats: false
+write_collected_feats: false
+max_epoch: 150
+patience: 4
+val_scheduler_criterion:
+- valid
+- loss
+early_stopping_criterion:
+- valid
+- loss
+- min
+best_model_criterion:
+-   - valid
+    - si_snr
+    - max
+-   - valid
+    - loss
+    - min
+keep_nbest_models: 1
+grad_clip: 5.0
+grad_clip_type: 2.0
+grad_noise: false
+accum_grad: 1
+no_forward_run: false
+resume: true
+train_dtype: float32
+use_amp: false
+log_interval: null
+use_tensorboard: true
+use_wandb: false
+wandb_project: null
+wandb_id: null
+detect_anomaly: false
+pretrain_path: null
+init_param: []
+freeze_param: []
+num_iters_per_epoch: null
+batch_size: 4
+valid_batch_size: null
+batch_bins: 1000000
+valid_batch_bins: null
+train_shape_file:
+- exp/enh_stats_8k/train/speech_mix_shape
+- exp/enh_stats_8k/train/speech_ref1_shape
+- exp/enh_stats_8k/train/speech_ref2_shape
+valid_shape_file:
+- exp/enh_stats_8k/valid/speech_mix_shape
+- exp/enh_stats_8k/valid/speech_ref1_shape
+- exp/enh_stats_8k/valid/speech_ref2_shape
+batch_type: folded
+valid_batch_type: null
+fold_length:
+- 80000
+- 80000
+- 80000
+sort_in_batch: descending
+sort_batch: descending
+multiple_iterator: false
+chunk_length: 32000
+chunk_shift_ratio: 0.5
+num_cache_chunks: 1024
+train_data_path_and_name_and_type:
+-   - dump/raw/tr_min_8k/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/tr_min_8k/spk1.scp
+    - speech_ref1
+    - sound
+-   - dump/raw/tr_min_8k/spk2.scp
+    - speech_ref2
+    - sound
+valid_data_path_and_name_and_type:
+-   - dump/raw/cv_min_8k/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/cv_min_8k/spk1.scp
+    - speech_ref1
+    - sound
+-   - dump/raw/cv_min_8k/spk2.scp
+    - speech_ref2
+    - sound
+allow_variable_data_keys: false
+max_cache_size: 0.0
+max_cache_fd: 32
+valid_max_cache_size: null
+optim: adam
+optim_conf:
+    lr: 0.001
+    eps: 1.0e-08
+    weight_decay: 0
+scheduler: reducelronplateau
+scheduler_conf:
+    mode: min
+    factor: 0.7
+    patience: 1
+init: xavier_uniform
+model_conf:
+    loss_type: si_snr
+use_preprocessor: false
+encoder: conv
+encoder_conf:
+    channel: 64
+    kernel_size: 2
+    stride: 1
+separator: dprnn
+separator_conf:
+    num_spk: 2
+    layer: 6
+    rnn_type: lstm
+    bidirectional: true
+    nonlinear: relu
+    unit: 128
+    segment_size: 250
+    dropout: 0.1
+decoder: conv
+decoder_conf:
+    channel: 64
+    kernel_size: 2
+    stride: 1
+required:
+- output_dir
+version: 0.9.8
+distributed: true

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/backward_time.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/forward_time.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/gpu_max_cached_mem_GB.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/iter_time.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/loss.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/optim0_lr0.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/optim_step_time.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/si_snr.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/exp/enh_train_enh_dprnn_tasnet_raw/images/train_time.png ADDED Viewed

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/meta.yaml ADDED Viewed

	@@ -0,0 +1,8 @@

+espnet: 0.10.7a1
+files:
+  model_file: exp/enh_train_enh_dprnn_tasnet_raw/96epoch.pth
+python: "3.7.11 (default, Jul 27 2021, 14:32:16) \n[GCC 7.5.0]"
+timestamp: 1649682775.265407
+torch: 1.8.1
+yaml_files:
+  train_config: exp/enh_train_enh_dprnn_tasnet_raw/config.yaml

models/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/lichenda/Chenda_Li_wsj0_2mix_enh_dprnn_tasnet

models/DPRNNTasNet-ks16_WHAM_sepclean/.gitattributes ADDED Viewed

	@@ -0,0 +1,8 @@

+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tar.gz filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text

models/DPRNNTasNet-ks16_WHAM_sepclean/README.md ADDED Viewed

	@@ -0,0 +1,107 @@

+---
+tags:
+- audio-to-audio
+- asteroid
+- audio
+- audio-source-separation
+datasets:
+- wham
+- sep_clean
+license: cc-by-sa-4.0
+---
+## Asteroid model `mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean`
+♻️ Imported from https://zenodo.org/record/3903795#.X8pMBRNKjUI
+This model was trained by Manuel Pariente using the wham/DPRNN recipe in [Asteroid](https://github.com/asteroid-team/asteroid). It was trained on the sep_clean task of the WHAM! dataset.
+### Demo: How to use in Asteroid
+```python
+# coming soon
+```
+### Training config
+- data:
+	- mode: min
+	- nondefault_nsrc: None
+	- sample_rate: 8000
+	- segment: 2.0
+	- task: sep_clean
+	- train_dir: data/wav8k/min/tr
+	- valid_dir: data/wav8k/min/cv
+- filterbank:
+	- kernel_size: 16
+	- n_filters: 64
+	- stride: 8
+- main_args:
+	- exp_dir: exp/train_dprnn_ks16/
+	- help: None
+- masknet:
+	- bidirectional: True
+	- bn_chan: 128
+	- chunk_size: 100
+	- dropout: 0
+	- hid_size: 128
+	- hop_size: 50
+	- in_chan: 64
+	- mask_act: sigmoid
+	- n_repeats: 6
+	- n_src: 2
+	- out_chan: 64
+- optim:
+	- lr: 0.001
+	- optimizer: adam
+	- weight_decay: 1e-05
+- positional arguments:
+- training:
+	- batch_size: 6
+	- early_stop: True
+	- epochs: 200
+	- gradient_clipping: 5
+	- half_lr: True
+	- num_workers: 6
+#### Results
+- `si_sdr`: 18.227683982688003
+- `si_sdr_imp`: 18.22883576588251
+- `sdr`: 18.617789605060587
+- `sdr_imp`: 18.466745426438173
+- `sir`: 29.22773720052717
+- `sir_imp`: 29.07669302190474
+- `sar`: 19.116352171914485
+- `sar_imp`: -130.06009796503054
+- `stoi`: 0.9722025377865715
+- `stoi_imp`: 0.23415680987800583
+### Citing Asteroid
+```BibTex
+@inproceedings{Pariente2020Asteroid,
+    title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
+    author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
+            Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
+            Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
+            and Emmanuel Vincent},
+    year={2020},
+    booktitle={Proc. Interspeech},
+}
+```
+Or on arXiv:
+```bibtex
+@misc{pariente2020asteroid,
+      title={Asteroid: the PyTorch-based audio source separation toolkit for researchers},
+      author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
+      year={2020},
+      eprint={2005.04132},
+      archivePrefix={arXiv},
+      primaryClass={eess.AS}
+}
+```

models/DPRNNTasNet-ks16_WHAM_sepclean/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aca83e3a61eb6414f78e87350631cfcd77e04737c2c9bf7844dcde6ac0c576d8
+size 14671835

models/DPRNNTasNet-ks16_WHAM_sepclean/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/julien-c/DPRNNTasNet-ks16_WHAM_sepclean

models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/.gitattributes ADDED Viewed

	@@ -0,0 +1,8 @@

+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tar.gz filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text

models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/README.md ADDED Viewed

	@@ -0,0 +1,82 @@

+---
+tags:
+- asteroid
+- audio
+- DPRNNTasNet
+- audio-to-audio
+datasets:
+- Libri1Mix
+- enh_single
+license: cc-by-sa-4.0
+---
+## Asteroid model `JorisCos/DPRNNTasNet_Libri1Mix_enhsignle_16k`
+Description:
+This model was trained by Joris Cosentino using the librimix recipe in [Asteroid](https://github.com/asteroid-team/asteroid).
+It was trained on the `enh_single` task of the Libri1Mix  dataset.
+Training config:
+```yml
+data:
+  n_src: 1
+  sample_rate: 16000
+  segment: 1
+  task: enh_single
+  train_dir: data/wav16k/min/train-360
+  valid_dir: data/wav16k/min/dev
+filterbank:
+  kernel_size: 2
+  n_filters: 64
+  stride: 1
+masknet:
+  bidirectional: true
+  bn_chan: 128
+  chunk_size: 250
+  dropout: 0
+  hid_size: 128
+  hop_size: 125
+  in_chan: 64
+  mask_act: sigmoid
+  n_repeats: 6
+  n_src: 1
+  out_chan: 64
+optim:
+  lr: 0.001
+  optimizer: adam
+  weight_decay: 1.0e-05
+training:
+  batch_size: 2
+  early_stop: true
+  epochs: 200
+  gradient_clipping: 5
+  half_lr: true
+  num_workers: 4
+```
+Results:
+On Libri1Mix min test set :
+```yml
+si_sdr: 14.7228101708889
+si_sdr_imp: 11.2730288650292
+sdr: 15.35661405197161
+sdr_imp: 11.853951252758595
+sir: Infinity
+sir_imp: NaN
+sar: 15.35661405197161
+sar_imp: 11.853951252758595
+stoi: 0.9300461826351578
+stoi_imp: 0.13412635909461715
+```
+License notice:
+This work "DPRNNTasNet_Libri1Mix_enhsignle_16k" is a derivative of [LibriSpeech ASR corpus](http://www.openslr.org/12) by Vassil Panayotov,
+used under [CC BY 4.0](https://creativecommons.org/licenses/by/4.0/); of The WSJ0 Hipster Ambient Mixtures
+dataset by [Whisper.ai](http://wham.whisper.ai/), used under [CC BY-NC 4.0](https://creativecommons.org/licenses/by-nc/4.0/) (Research only).
+"DPRNNTasNet_Libri1Mix_enhsignle_16k" is licensed under [Attribution-ShareAlike 3.0 Unported](https://creativecommons.org/licenses/by-sa/3.0/) by Joris Cosentino

models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b510c07fae3a3db18473b5749316cb9df8dc4f78164c3cdfbb50d3783ee779d
+size 14595773

models/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/JorisCos/DPRNNTasNet-ks2_Libri1Mix_enhsingle_16k

models/DPRNNTasNet-ks2_WHAM_sepclean/.gitattributes ADDED Viewed

	@@ -0,0 +1,8 @@

+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tar.gz filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text

models/DPRNNTasNet-ks2_WHAM_sepclean/README.md ADDED Viewed

	@@ -0,0 +1,84 @@

+---
+tags:
+- asteroid
+- audio
+- DPRNNTasNet
+- audio-to-audio
+datasets:
+- wham
+- sep_clean
+license: cc-by-sa-4.0
+---
+## Asteroid model `mpariente/DPRNNTasNet-ks2_WHAM_sepclean`
+Imported from [Zenodo](https://zenodo.org/record/3862942)
+### Description:
+This model was trained by Manuel Pariente
+using the wham/DPRNN recipe in [Asteroid](https://github.com/asteroid-team/asteroid).
+It was trained on the `sep_clean` task of the WHAM! dataset.
+### Training config:
+```yaml
+data:
+    mode: min
+    nondefault_nsrc: None
+    sample_rate: 8000
+    segment: 2.0
+    task: sep_clean
+    train_dir: data/wav8k/min/tr
+    valid_dir: data/wav8k/min/cv
+filterbank:
+    kernel_size: 2
+    n_filters: 64
+    stride: 1
+main_args:
+    exp_dir: exp/train_dprnn_new/
+    gpus: -1
+    help: None
+masknet:
+    bidirectional: True
+    bn_chan: 128
+    chunk_size: 250
+    dropout: 0
+    hid_size: 128
+    hop_size: 125
+    in_chan: 64
+    mask_act: sigmoid
+    n_repeats: 6
+    n_src: 2
+    out_chan: 64
+optim:
+    lr: 0.001
+    optimizer: adam
+    weight_decay: 1e-05
+positional arguments:
+training:
+    batch_size: 3
+    early_stop: True
+    epochs: 200
+    gradient_clipping: 5
+    half_lr: True
+    num_workers: 8
+```
+### Results:
+```yaml
+si_sdr: 19.316743490695334
+si_sdr_imp: 19.317895273889842
+sdr: 19.68085347190952
+sdr_imp: 19.5298092932871
+sir: 30.362213998701232
+sir_imp: 30.21116982007881
+sar: 20.15553251343315
+sar_imp: -129.02091762351188
+stoi: 0.97772664309074
+stoi_imp: 0.23968091518217424
+```
+### License notice:
+This work "DPRNNTasNet-ks2_WHAM_sepclean" is a derivative of [CSR-I (WSJ0) Complete](https://catalog.ldc.upenn.edu/LDC93S6A)
+by [LDC](https://www.ldc.upenn.edu/), used under [LDC User Agreement for
+Non-Members](https://catalog.ldc.upenn.edu/license/ldc-non-members-agreement.pdf) (Research only).
+"DPRNNTasNet-ks2_WHAM_sepclean" is licensed under [Attribution-ShareAlike 3.0 Unported](https://creativecommons.org/licenses/by-sa/3.0/)
+by Manuel Pariente.

models/DPRNNTasNet-ks2_WHAM_sepclean/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc1f1fecf24ea3e486521029dc0e1444686bd4b6fdf9715e7757936cbd9ffdf6
+size 14664381

models/DPRNNTasNet-ks2_WHAM_sepclean/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/mpariente/DPRNNTasNet-ks2_WHAM_sepclean

models/DPRNNTasNet_LibriMix_sepclean/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

models/DPRNNTasNet_LibriMix_sepclean/epoch=9-step=1000.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e95100fd3792c3a80ed7f9655e55b85c05eadaf944e31549e05af2910b2fba2d
+size 44009512

models/DPRNNTasNet_LibriMix_sepclean/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/Ehsanshr/DPRNNTasNet_LibriMix_sepclean

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/.gitattributes ADDED Viewed

	@@ -0,0 +1,27 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zstandard filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/README.md ADDED Viewed

	@@ -0,0 +1,251 @@

+---
+tags:
+- espnet
+- audio
+- audio-to-audio
+language: noinfo
+datasets:
+- l3das22
+license: cc-by-4.0
+---
+## ESPnet2 ENH model
+### `espnet/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave`
+This model was trained by neillu23 using l3das22 recipe in [espnet](https://github.com/espnet/espnet/).
+### Demo: How to use in ESPnet2
+```bash
+cd espnet
+git checkout da2266fea920e22bb74471565e1a41a89f4cf62c
+pip install -e .
+cd egs2/l3das22/enh1
+./run.sh --skip_data_prep false --skip_train true --download_model espnet/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave
+```
+<!-- Generated by ./scripts/utils/show_enh_score.sh -->
+# RESULTS
+## Environments
+- date: `Thu Jun 16 09:52:57 UTC 2022`
+- python version: `3.8.13 (default, Mar 28 2022, 11:38:47)  [GCC 7.5.0]`
+- espnet version: `espnet 202204`
+- pytorch version: `pytorch 1.8.1`
+- Git hash: `da2266fea920e22bb74471565e1a41a89f4cf62c`
+  - Commit date: `Wed Jun 15 11:46:35 2022 +0000`
+## enh_train_enh_dprnntac_fasnet_raw
+config: conf/tuning/train_enh_dprnntac_fasnet.yaml
+|dataset|STOI|SAR|SDR|SIR|SI_SNR|
+|---|---|---|---|---|---|
+|enhanced_dev_multich|73.58|3.52|3.52|0.00|-3.47|
+|enhanced_test_multich|73.93|2.83|2.83|0.00|-4.79|
+## ENH config
+<details><summary>expand</summary>
+```
+config: conf/tuning/train_enh_dprnntac_fasnet.yaml
+print_config: false
+log_level: INFO
+dry_run: false
+iterator_type: chunk
+output_dir: exp/enh_train_enh_dprnntac_fasnet_raw
+ngpu: 1
+seed: 0
+num_workers: 4
+num_att_plot: 3
+dist_backend: nccl
+dist_init_method: env://
+dist_world_size: 2
+dist_rank: 0
+local_rank: 0
+dist_master_addr: localhost
+dist_master_port: 51533
+dist_launcher: null
+multiprocessing_distributed: true
+unused_parameters: false
+sharded_ddp: false
+cudnn_enabled: true
+cudnn_benchmark: false
+cudnn_deterministic: true
+collect_stats: false
+write_collected_feats: false
+max_epoch: 300
+patience: 10
+val_scheduler_criterion:
+- valid
+- loss
+early_stopping_criterion:
+- valid
+- loss
+- min
+best_model_criterion:
+-   - valid
+    - si_snr
+    - max
+-   - valid
+    - loss
+    - min
+keep_nbest_models: 1
+nbest_averaging_interval: 0
+grad_clip: 5.0
+grad_clip_type: 2.0
+grad_noise: false
+accum_grad: 1
+no_forward_run: false
+resume: true
+train_dtype: float32
+use_amp: false
+log_interval: null
+use_matplotlib: true
+use_tensorboard: true
+use_wandb: false
+wandb_project: null
+wandb_id: null
+wandb_entity: null
+wandb_name: null
+wandb_model_log_interval: -1
+detect_anomaly: false
+pretrain_path: null
+init_param: []
+ignore_init_mismatch: false
+freeze_param: []
+num_iters_per_epoch: null
+batch_size: 24
+valid_batch_size: null
+batch_bins: 1000000
+valid_batch_bins: null
+train_shape_file:
+- exp/enh_stats_16k/train/speech_mix_shape
+- exp/enh_stats_16k/train/speech_ref1_shape
+valid_shape_file:
+- exp/enh_stats_16k/valid/speech_mix_shape
+- exp/enh_stats_16k/valid/speech_ref1_shape
+batch_type: folded
+valid_batch_type: null
+fold_length:
+- 80000
+- 80000
+sort_in_batch: descending
+sort_batch: descending
+multiple_iterator: false
+chunk_length: 32000
+chunk_shift_ratio: 0.5
+num_cache_chunks: 1024
+train_data_path_and_name_and_type:
+-   - dump/raw/train_multich/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/train_multich/spk1.scp
+    - speech_ref1
+    - sound
+valid_data_path_and_name_and_type:
+-   - dump/raw/dev_multich/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/dev_multich/spk1.scp
+    - speech_ref1
+    - sound
+allow_variable_data_keys: false
+max_cache_size: 0.0
+max_cache_fd: 32
+valid_max_cache_size: null
+optim: adam
+optim_conf:
+    lr: 0.001
+    eps: 1.0e-08
+    weight_decay: 0
+scheduler: steplr
+scheduler_conf:
+    step_size: 2
+    gamma: 0.98
+init: xavier_uniform
+model_conf:
+    stft_consistency: false
+    loss_type: mask_mse
+    mask_type: null
+criterions:
+-   name: si_snr
+    conf:
+        eps: 1.0e-07
+    wrapper: fixed_order
+    wrapper_conf:
+        weight: 1.0
+use_preprocessor: false
+encoder: same
+encoder_conf: {}
+separator: fasnet
+separator_conf:
+    enc_dim: 64
+    feature_dim: 64
+    hidden_dim: 128
+    layer: 6
+    segment_size: 24
+    num_spk: 1
+    win_len: 16
+    context_len: 16
+    sr: 16000
+    fasnet_type: fasnet
+    dropout: 0.2
+decoder: same
+decoder_conf: {}
+required:
+- output_dir
+version: '202204'
+distributed: true
+```
+</details>
+### Citing ESPnet
+```BibTex
+@inproceedings{watanabe2018espnet,
+  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
+  title={{ESPnet}: End-to-End Speech Processing Toolkit},
+  year={2018},
+  booktitle={Proceedings of Interspeech},
+  pages={2207--2211},
+  doi={10.21437/Interspeech.2018-1456},
+  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
+}
+@inproceedings{ESPnet-SE,
+  author = {Chenda Li and Jing Shi and Wangyou Zhang and Aswin Shanmugam Subramanian and Xuankai Chang and
+  Naoyuki Kamo and Moto Hira and Tomoki Hayashi and Christoph B{"{o}}ddeker and Zhuo Chen and Shinji Watanabe},
+  title = {ESPnet-SE: End-To-End Speech Enhancement and Separation Toolkit Designed for {ASR} Integration},
+  booktitle = {{IEEE} Spoken Language Technology Workshop, {SLT} 2021, Shenzhen, China, January 19-22, 2021},
+  pages = {785--792},
+  publisher = {{IEEE}},
+  year = {2021},
+  url = {https://doi.org/10.1109/SLT48900.2021.9383615},
+  doi = {10.1109/SLT48900.2021.9383615},
+  timestamp = {Mon, 12 Apr 2021 17:08:59 +0200},
+  biburl = {https://dblp.org/rec/conf/slt/Li0ZSCKHHBC021.bib},
+  bibsource = {dblp computer science bibliography, https://dblp.org}
+}
+```
+or arXiv:
+```bibtex
+@misc{watanabe2018espnet,
+  title={ESPnet: End-to-End Speech Processing Toolkit},
+  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
+  year={2018},
+  eprint={1804.00015},
+  archivePrefix={arXiv},
+  primaryClass={cs.CL}
+}
+```

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_stats_16k/train/feats_stats.npz ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f92b851bbc9340886cd3cb2a322006ca939d3221047336847ff2093861f7db9
+size 826

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/299epoch.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ef3ddd09d01e8fa6903e5a879c0635b7dcf3c9b4847233cc2a43efc022ee12b
+size 16366144

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/RESULTS.md ADDED Viewed

	@@ -0,0 +1,20 @@

+<!-- Generated by ./scripts/utils/show_enh_score.sh -->
+# RESULTS
+## Environments
+- date: `Thu Jun 16 09:52:57 UTC 2022`
+- python version: `3.8.13 (default, Mar 28 2022, 11:38:47)  [GCC 7.5.0]`
+- espnet version: `espnet 202204`
+- pytorch version: `pytorch 1.8.1`
+- Git hash: `da2266fea920e22bb74471565e1a41a89f4cf62c`
+  - Commit date: `Wed Jun 15 11:46:35 2022 +0000`
+## enh_train_enh_dprnntac_fasnet_raw
+config: conf/tuning/train_enh_dprnntac_fasnet.yaml
+|dataset|STOI|SAR|SDR|SIR|SI_SNR|
+|---|---|---|---|---|---|
+|enhanced_dev_multich|73.58|3.52|3.52|0.00|-3.47|
+|enhanced_test_multich|73.93|2.83|2.83|0.00|-4.79|

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/config.yaml ADDED Viewed

	@@ -0,0 +1,149 @@

+config: conf/tuning/train_enh_dprnntac_fasnet.yaml
+print_config: false
+log_level: INFO
+dry_run: false
+iterator_type: chunk
+output_dir: exp/enh_train_enh_dprnntac_fasnet_raw
+ngpu: 1
+seed: 0
+num_workers: 4
+num_att_plot: 3
+dist_backend: nccl
+dist_init_method: env://
+dist_world_size: 2
+dist_rank: 0
+local_rank: 0
+dist_master_addr: localhost
+dist_master_port: 51533
+dist_launcher: null
+multiprocessing_distributed: true
+unused_parameters: false
+sharded_ddp: false
+cudnn_enabled: true
+cudnn_benchmark: false
+cudnn_deterministic: true
+collect_stats: false
+write_collected_feats: false
+max_epoch: 300
+patience: 10
+val_scheduler_criterion:
+- valid
+- loss
+early_stopping_criterion:
+- valid
+- loss
+- min
+best_model_criterion:
+-   - valid
+    - si_snr
+    - max
+-   - valid
+    - loss
+    - min
+keep_nbest_models: 1
+nbest_averaging_interval: 0
+grad_clip: 5.0
+grad_clip_type: 2.0
+grad_noise: false
+accum_grad: 1
+no_forward_run: false
+resume: true
+train_dtype: float32
+use_amp: false
+log_interval: null
+use_matplotlib: true
+use_tensorboard: true
+use_wandb: false
+wandb_project: null
+wandb_id: null
+wandb_entity: null
+wandb_name: null
+wandb_model_log_interval: -1
+detect_anomaly: false
+pretrain_path: null
+init_param: []
+ignore_init_mismatch: false
+freeze_param: []
+num_iters_per_epoch: null
+batch_size: 24
+valid_batch_size: null
+batch_bins: 1000000
+valid_batch_bins: null
+train_shape_file:
+- exp/enh_stats_16k/train/speech_mix_shape
+- exp/enh_stats_16k/train/speech_ref1_shape
+valid_shape_file:
+- exp/enh_stats_16k/valid/speech_mix_shape
+- exp/enh_stats_16k/valid/speech_ref1_shape
+batch_type: folded
+valid_batch_type: null
+fold_length:
+- 80000
+- 80000
+sort_in_batch: descending
+sort_batch: descending
+multiple_iterator: false
+chunk_length: 32000
+chunk_shift_ratio: 0.5
+num_cache_chunks: 1024
+train_data_path_and_name_and_type:
+-   - dump/raw/train_multich/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/train_multich/spk1.scp
+    - speech_ref1
+    - sound
+valid_data_path_and_name_and_type:
+-   - dump/raw/dev_multich/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/dev_multich/spk1.scp
+    - speech_ref1
+    - sound
+allow_variable_data_keys: false
+max_cache_size: 0.0
+max_cache_fd: 32
+valid_max_cache_size: null
+optim: adam
+optim_conf:
+    lr: 0.001
+    eps: 1.0e-08
+    weight_decay: 0
+scheduler: steplr
+scheduler_conf:
+    step_size: 2
+    gamma: 0.98
+init: xavier_uniform
+model_conf:
+    stft_consistency: false
+    loss_type: mask_mse
+    mask_type: null
+criterions:
+-   name: si_snr
+    conf:
+        eps: 1.0e-07
+    wrapper: fixed_order
+    wrapper_conf:
+        weight: 1.0
+use_preprocessor: false
+encoder: same
+encoder_conf: {}
+separator: fasnet
+separator_conf:
+    enc_dim: 64
+    feature_dim: 64
+    hidden_dim: 128
+    layer: 6
+    segment_size: 24
+    num_spk: 1
+    win_len: 16
+    context_len: 16
+    sr: 16000
+    fasnet_type: fasnet
+    dropout: 0.2
+decoder: same
+decoder_conf: {}
+required:
+- output_dir
+version: '202204'
+distributed: true

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/backward_time.png ADDED Viewed

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/forward_time.png ADDED Viewed

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/gpu_max_cached_mem_GB.png ADDED Viewed

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/iter_time.png ADDED Viewed

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/loss.png ADDED Viewed

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/optim0_lr0.png ADDED Viewed

models/Yen-Ju_Lu_l3das22_enh_train_dprnntac_fasnet_valid.loss.ave/exp/enh_train_enh_dprnntac_fasnet_raw/images/optim_step_time.png ADDED Viewed