niobures commited on Oct 22, 2025

Commit

f3afeb5

verified ·

1 Parent(s): fbcad20

DCCRN, Distil-DCCRN

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +6 -0
DCCRN/A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement.pdf +3 -0
DCCRN/AIAP Final Project.pdf +3 -0
DCCRN/DCCRN. Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement.pdf +3 -0
DCCRN/Performance comparison evaluation of speech enhancement using various loss functions.pdf +3 -0
DCCRN/code/DCCRN [Context-Aware-Character-TTS-System].zip +3 -0
DCCRN/code/DCCRN [Wang-Jingrun].zip +3 -0
DCCRN/code/DCCRN [maggie0830].zip +3 -0
DCCRN/code/DCCRN [mahshid1378].zip +3 -0
DCCRN/code/DCCRN [shaoyuanyu].zip +3 -0
DCCRN/code/DCCRN [wangtianrui].zip +3 -0
DCCRN/code/DCCRN [wanliangdaxia].zip +3 -0
DCCRN/code/DCCRN-2.zip +3 -0
DCCRN/code/DCCRN-Trial.zip +3 -0
DCCRN/code/DCCRN-for-DNS5.zip +3 -0
DCCRN/code/DCCRN-small.zip +3 -0
DCCRN/code/DCCRN-with-various-loss-functions.zip +3 -0
DCCRN/code/DCCRN-wncg.zip +3 -0
DCCRN/code/DCCRN_Keras.zip +3 -0
DCCRN/code/DCCRN_Pytorch.zip +3 -0
DCCRN/code/DNN-based-Speech-Enhancement-in-the-frequency-domain.zip +3 -0
DCCRN/code/DeepComplexCRN (original).zip +3 -0
DCCRN/code/I-DCCRN-VAE.zip +3 -0
DCCRN/code/KD_DCCRN.zip +3 -0
DCCRN/code/Knowledge_distillation.zip +3 -0
DCCRN/code/S-DCCRN.zip +3 -0
DCCRN/code/SE-DCCRN.zip +3 -0
DCCRN/code/Spatial-DCCRN.zip +3 -0
DCCRN/code/Speech_Enhancement-DCCRN.zip +3 -0
DCCRN/code/dccrn-plus.zip +3 -0
DCCRN/code/denosising_model [mcaramba563].zip +3 -0
DCCRN/code/hf-dccrn.zip +3 -0
DCCRN/dataset/Speech Enhancement for a Noise-Robust Text-to-Speech Synthesis System Using Deep Recurrent Neural Networks.pdf +3 -0
DCCRN/models/DCCRN (Ada312)/.gitattributes +35 -0
DCCRN/models/DCCRN (Ada312)/epoch=44-step=113895.ckpt +3 -0
DCCRN/models/DCCRN (Ada312)/source.txt +1 -0
DCCRN/models/DCCRN (chenxie95)/.gitattributes +35 -0
DCCRN/models/DCCRN (chenxie95)/epoch=44-step=113895.ckpt +3 -0
DCCRN/models/DCCRN (chenxie95)/source.txt +2 -0
DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/.gitattributes +8 -0
DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/README.md +74 -0
DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/pytorch_model.bin +3 -0
DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/source.txt +1 -0
DCCRN/models/SE-DCCRN/base_model.pth +3 -0
DCCRN/models/SE-DCCRN/lite_v1_model.pth +3 -0
DCCRN/models/SE-DCCRN/lite_v1d_model.pth +3 -0
DCCRN/models/SE-DCCRN/source.txt +1 -0
DCCRN/models/SE-DCCRN/summary.md +9 -0
DCCRN/models/Shaoxiong_Lin_dns_ins20_enh_enh_train_enh_dccrn_raw/.gitattributes +27 -0
DCCRN/models/Shaoxiong_Lin_dns_ins20_enh_enh_train_enh_dccrn_raw/README.md +257 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,9 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+DCCRN/A[[:space:]]Convolutional[[:space:]]Recurrent[[:space:]]Neural[[:space:]]Network[[:space:]]for[[:space:]]Real-Time[[:space:]]Speech[[:space:]]Enhancement.pdf filter=lfs diff=lfs merge=lfs -text
+DCCRN/AIAP[[:space:]]Final[[:space:]]Project.pdf filter=lfs diff=lfs merge=lfs -text
+DCCRN/dataset/Speech[[:space:]]Enhancement[[:space:]]for[[:space:]]a[[:space:]]Noise-Robust[[:space:]]Text-to-Speech[[:space:]]Synthesis[[:space:]]System[[:space:]]Using[[:space:]]Deep[[:space:]]Recurrent[[:space:]]Neural[[:space:]]Networks.pdf filter=lfs diff=lfs merge=lfs -text
+DCCRN/DCCRN.[[:space:]]Deep[[:space:]]Complex[[:space:]]Convolution[[:space:]]Recurrent[[:space:]]Network[[:space:]]for[[:space:]]Phase-Aware[[:space:]]Speech[[:space:]]Enhancement.pdf filter=lfs diff=lfs merge=lfs -text
+DCCRN/Performance[[:space:]]comparison[[:space:]]evaluation[[:space:]]of[[:space:]]speech[[:space:]]enhancement[[:space:]]using[[:space:]]various[[:space:]]loss[[:space:]]functions.pdf filter=lfs diff=lfs merge=lfs -text
+Distil-DCCRN/Distil-DCCRN.[[:space:]]A[[:space:]]Small-footprint[[:space:]]DCCRN[[:space:]]Leveraging[[:space:]]Feature-based[[:space:]]Knowledge[[:space:]]Distillation[[:space:]]in[[:space:]]Speech[[:space:]]Enhancement.pdf filter=lfs diff=lfs merge=lfs -text

DCCRN/A Convolutional Recurrent Neural Network for Real-Time Speech Enhancement.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9a1d013c558e4177c0d68b5e5c39648b30626c430aa7b57fb9c9c018123538e
+size 646378

DCCRN/AIAP Final Project.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ead31849e4c1e86925f5abb2cd3c57fb57eaea280c763c43fa58696fa08afd81
+size 1246642

DCCRN/DCCRN. Deep Complex Convolution Recurrent Network for Phase-Aware Speech Enhancement.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b381ebaadb2b0b94c8d0c498c76878b0a6ae12ba6f686caee5066b4b5cd1cea
+size 844298

DCCRN/Performance comparison evaluation of speech enhancement using various loss functions.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:85df2fe0ebbbec1acb4e06d404ddb465228f8f5063facbea4c6101aee305c227
+size 800355

DCCRN/code/DCCRN [Context-Aware-Character-TTS-System].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7abc519d46cb25068ec23af18367742f18c2bfb3efa4543e2f47943dea69e406
+size 81376722

DCCRN/code/DCCRN [Wang-Jingrun].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e18415b943fc9035b78952a40d09985827b3acc3a80018c7a9033570a9a4f90
+size 116505131

DCCRN/code/DCCRN [maggie0830].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c32593933532b2a5af921bf85f74ef784e9129c139944be4093175950ef49053
+size 573872

DCCRN/code/DCCRN [mahshid1378].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3d4a1cacb0e5ec654048683df723cdb9575571c18693e271cdc42d75a455a0aa
+size 8481588

DCCRN/code/DCCRN [shaoyuanyu].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1ee118fd02ebb77714e2d7328d7f54eae49555ed4208884c5406283e9fbdc8b
+size 2205508

DCCRN/code/DCCRN [wangtianrui].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1cfb8e8ed35d100a1224a3ceb22b46f95252c263c4ed9b61efff7523b80b3e07
+size 2029618

DCCRN/code/DCCRN [wanliangdaxia].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3622ced5e8275edf628c2783d6b4c619ab016d0e64ba41dc0b599d1d91a51bd9
+size 896792

DCCRN/code/DCCRN-2.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d4d8de3e4ec5a0d3036680fa1cf0a0cf94f2e2e6d3b6d71d4dc54ef5e47b2cbb
+size 2208993

DCCRN/code/DCCRN-Trial.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a141df4aaea06fefbab0e154f49ba82216b21d6acb4176dbb8585119883fb764
+size 2262879

DCCRN/code/DCCRN-for-DNS5.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd423940ef0309ce8679e50327955d3a035fdea2d16c615c3b4a3e53014a3838
+size 507473469

DCCRN/code/DCCRN-small.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63c1f0007edebee9f9eea1e3051d0fbf2563cd8a41936180f6c2d2e8dfac3d37
+size 2547481

DCCRN/code/DCCRN-with-various-loss-functions.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95f467976fa3768ad3800ef9cdaa1af8a939a3340c2d65d6ac4b896eb3371e35
+size 33941947

DCCRN/code/DCCRN-wncg.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb50b592c67a578442a1b6cac8e6d232c7502b1c977e96a3ff49e041c96ea80c
+size 232163

DCCRN/code/DCCRN_Keras.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1bbde2340354d31e7fe3d9bd2e554ebda81c0501ed28c61a339dbe47b6453e1f
+size 37331

DCCRN/code/DCCRN_Pytorch.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e685912a3f00fcb8e33fec9b2d99e085fe7aea12e79facfbba0ad3e612d669da
+size 110453

DCCRN/code/DNN-based-Speech-Enhancement-in-the-frequency-domain.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a77d84b30770f6bff0861f7fe1c1cd2578ee8b5a617c5e69f9dffb58cd3c37af
+size 410561

DCCRN/code/DeepComplexCRN (original).zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a4a36dcb653dc234f146b8dbc11595d8f53e43a7a971524a3c505996989dc21
+size 114573010

DCCRN/code/I-DCCRN-VAE.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f15ee047bc618fc54b925a29fc452e2979fec1081f68949f949e031fc5ddf7b9
+size 8232516

DCCRN/code/KD_DCCRN.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:04a654dcbb5b3117d00afd9546f44bd9ee70fc6bdf4b019a2658b2852a722cb9
+size 41431052

DCCRN/code/Knowledge_distillation.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:72e5754b08efa7347fb7a4c37ab06363e055936f5105f11eac900c3cc96d86c2
+size 41170858

DCCRN/code/S-DCCRN.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:040de712eb711e07ca8a038d6d1806420122f8acac89e720c2f7c0d666134ce8
+size 119122675

DCCRN/code/SE-DCCRN.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5e57b621edb6ebd89d5e795ed896d6b099b9171b4fafda1da875358cfea26e42
+size 41207805

DCCRN/code/Spatial-DCCRN.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a0d4b65b8b43f4a8c2f2123eb73d8fdb42bb5f6321a9333145a21e53e37dc92e
+size 74811261

DCCRN/code/Speech_Enhancement-DCCRN.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2a1b2d9f3d3e04466661cdb740eeacaab40fe037497e29abae31f01913fbf13
+size 83347937

DCCRN/code/dccrn-plus.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4e45c2a9acf8e01cdb8de6d6865c69c3106a172bd14f29990503abdbf9233439
+size 82632252

DCCRN/code/denosising_model [mcaramba563].zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eef9ece1e48341e311feb153dcdf2497ddc151a2e93a0a74d92cb45b68f857d7
+size 516491216

DCCRN/code/hf-dccrn.zip ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:68a254da33c961777e5be98ef023f6d149aaaaffb43bf33afbce8b932a7ab619
+size 49593

DCCRN/dataset/Speech Enhancement for a Noise-Robust Text-to-Speech Synthesis System Using Deep Recurrent Neural Networks.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:30806abb77998dfd47fe9d66d9b069f0974921d1f8734c403f1d765df3280989
+size 10158959

DCCRN/models/DCCRN (Ada312)/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

DCCRN/models/DCCRN (Ada312)/epoch=44-step=113895.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63f1a20e51b1194aed4c18c0305a706d386a9e7d8c8bd425e95805ecee94164b
+size 46489036

DCCRN/models/DCCRN (Ada312)/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/Ada312/DCCRN

DCCRN/models/DCCRN (chenxie95)/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

DCCRN/models/DCCRN (chenxie95)/epoch=44-step=113895.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:63f1a20e51b1194aed4c18c0305a706d386a9e7d8c8bd425e95805ecee94164b
+size 46489036

DCCRN/models/DCCRN (chenxie95)/source.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+
2	+ https://huggingface.co/chenxie95/DCCRN

DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/.gitattributes ADDED Viewed

	@@ -0,0 +1,8 @@

+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tar.gz filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text

DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/README.md ADDED Viewed

	@@ -0,0 +1,74 @@

+---
+tags:
+- asteroid
+- audio
+- DCCRNet
+- audio-to-audio
+- speech-enhancement
+datasets:
+- Libri1Mix
+- enh_single
+license: cc-by-sa-4.0
+---
+## Asteroid model `JorisCos/DCCRNet_Libri1Mix_enhsignle_16k`
+Description:
+This model was trained by Joris Cosentino using the librimix recipe in [Asteroid](https://github.com/asteroid-team/asteroid).
+It was trained on the `enh_single` task of the Libri1Mix  dataset.
+Training config:
+```yml
+data:
+  n_src: 1
+  sample_rate: 16000
+  segment: 3
+  task: enh_single
+  train_dir: data/wav16k/min/train-360
+  valid_dir: data/wav16k/min/dev
+filterbank:
+  stft_kernel_size: 400
+  stft_n_filters: 512
+  stft_stride: 100
+masknet:
+  architecture: DCCRN-CL
+  n_src: 1
+optim:
+  lr: 0.001
+  optimizer: adam
+  weight_decay: 1.0e-05
+training:
+  batch_size: 12
+  early_stop: true
+  epochs: 200
+  gradient_clipping: 5
+  half_lr: true
+  num_workers: 4
+```
+Results:
+On Libri1Mix min test set :
+```yml
+si_sdr: 13.329767398333798
+si_sdr_imp: 9.879986092474098
+sdr: 13.87279932997016
+sdr_imp: 10.370136530757103
+sir: Infinity
+sir_imp: NaN
+sar: 13.87279932997016
+sar_imp: 10.370136530757103
+stoi: 0.9140907015623948
+stoi_imp: 0.11817087802185405
+```
+License notice:
+This work "DCCRNet_Libri1Mix_enhsignle_16k" is a derivative of [LibriSpeech ASR corpus](http://www.openslr.org/12) by Vassil Panayotov,
+used under [CC BY 4.0](https://creativecommons.org/licenses/by/4.0/); of The WSJ0 Hipster Ambient Mixtures
+dataset by [Whisper.ai](http://wham.whisper.ai/), used under [CC BY-NC 4.0](https://creativecommons.org/licenses/by-nc/4.0/) (Research only).
+"DCCRNet_Libri1Mix_enhsignle_16k" is licensed under [Attribution-ShareAlike 3.0 Unported](https://creativecommons.org/licenses/by-sa/3.0/) by Joris Cosentino

DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1f519207604649cd90586e85adf2e93c4f4b26b216f0a71635013a90e64d939
+size 16409109

DCCRN/models/DCCRNet_Libri1Mix_enhsingle_16k/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://huggingface.co/JorisCos/DCCRNet_Libri1Mix_enhsingle_16k

DCCRN/models/SE-DCCRN/base_model.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd710915fc1b4897f5ba59de66ee1b185449569a0375dc3175c427632c761d97
+size 14740557

DCCRN/models/SE-DCCRN/lite_v1_model.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b9edf5a6f0c28074f93ef0416dabbe126b2e0fdd480aabdecd14f38bb4f1d69
+size 3731533

DCCRN/models/SE-DCCRN/lite_v1d_model.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a04fc383e680a6fa4df001d2242eec003f8a442e1f15f1292c931b0cf3cbdf7f
+size 3731533

DCCRN/models/SE-DCCRN/source.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ https://github.com/sc0ttms/SE-DCCRN

DCCRN/models/SE-DCCRN/summary.md ADDED Viewed

	@@ -0,0 +1,9 @@

+# summary
+| dataset/model | Params(M) | Flops(G) |      SI-SDR      |       STOI        |     WB_PESQ      |     NB_PESQ      |
+| :-----------: | :-------: | :------: | :--------------: | :---------------: | :--------------: | :--------------: |
+| dataset_train |     -     |    -     | 9.18826423150635 | 0.821936784950485 | 1.73518149405717 | 2.42768483359366 |
+| dataset_valid |     -     |    -     | 9.15858130001896 | 0.820208461517329 | 1.73266624887353 | 2.41471458952858 |
+| dataset_test  |     -     |    -     | 9.33677852833749 | 0.821225098997534 | 1.73727285225124 | 2.42875709109791 |
+|  base_model   |   3.671   |  35.253  | 18.2092751119167 | 0.895062729329303 | 3.02301043262067 | 3.44576535798074 |
+| lite_v1_model |   0.921   |  8.872   | 17.1342839493116 | 0.882091315376406 | 2.81674490229713 | 3.29441381774482 |

DCCRN/models/Shaoxiong_Lin_dns_ins20_enh_enh_train_enh_dccrn_raw/.gitattributes ADDED Viewed

	@@ -0,0 +1,27 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zstandard filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

DCCRN/models/Shaoxiong_Lin_dns_ins20_enh_enh_train_enh_dccrn_raw/README.md ADDED Viewed

	@@ -0,0 +1,257 @@

+---
+tags:
+- espnet
+- audio
+- audio-to-audio
+language: en
+datasets:
+- dns_ins20
+license: cc-by-4.0
+---
+## ESPnet2 ENH model
+### `Johnson-Lsx/Shaoxiong_Lin_dns_ins20_enh_enh_train_enh_dccrn_raw`
+This model was trained by Shaoxiong Lin using dns_ins20 recipe in [espnet](https://github.com/espnet/espnet/).
+### Demo: How to use in ESPnet2
+```bash
+cd espnet
+git checkout 4538462eb7dc6a6b858adcbd3a526fb8173d6f73
+pip install -e .
+cd egs2/dns_ins20/enh1
+./run.sh --skip_data_prep false --skip_train true --download_model Johnson-Lsx/Shaoxiong_Lin_dns_ins20_enh_enh_train_enh_dccrn_raw
+```
+<!-- Generated by ./scripts/utils/show_enh_score.sh -->
+# RESULTS
+## Environments
+- date: `Thu Feb 10 23:11:40 CST 2022`
+- python version: `3.8.12 (default, Oct 12 2021, 13:49:34)  [GCC 7.5.0]`
+- espnet version: `espnet 0.10.5a1`
+- pytorch version: `pytorch 1.9.1`
+- Git hash: `6f66283b9eed7b0d5e5643feb18d8f60118a4afc`
+  - Commit date: `Mon Dec 13 15:30:29 2021 +0800`
+## enh_train_enh_dccrn_batch_size_raw
+config: ./conf/tuning/train_enh_dccrn_batch_size.yaml
+|dataset|STOI|SAR|SDR|SIR|
+|---|---|---|---|---|
+|enhanced_cv_synthetic|0.98|24.69|24.69|0.00|
+|enhanced_tt_synthetic_no_reverb|0.96|17.69|17.69|0.00|
+|enhanced_tt_synthetic_with_reverb|0.81|10.45|10.45|0.00|
+## ENH config
+<details><summary>expand</summary>
+```
+config: ./conf/tuning/train_enh_dccrn_batch_size.yaml
+print_config: false
+log_level: INFO
+dry_run: false
+iterator_type: chunk
+output_dir: exp/enh_train_enh_dccrn_batch_size_raw
+ngpu: 1
+seed: 0
+num_workers: 4
+num_att_plot: 3
+dist_backend: nccl
+dist_init_method: env://
+dist_world_size: 4
+dist_rank: 0
+local_rank: 0
+dist_master_addr: localhost
+dist_master_port: 46366
+dist_launcher: null
+multiprocessing_distributed: true
+unused_parameters: false
+sharded_ddp: false
+cudnn_enabled: true
+cudnn_benchmark: false
+cudnn_deterministic: true
+collect_stats: false
+write_collected_feats: false
+max_epoch: 100
+patience: 10
+val_scheduler_criterion:
+- valid
+- loss
+early_stopping_criterion:
+- valid
+- loss
+- min
+best_model_criterion:
+-   - valid
+    - si_snr
+    - max
+-   - valid
+    - loss
+    - min
+keep_nbest_models: 1
+nbest_averaging_interval: 0
+grad_clip: 5.0
+grad_clip_type: 2.0
+grad_noise: false
+accum_grad: 1
+no_forward_run: false
+resume: true
+train_dtype: float32
+use_amp: false
+log_interval: null
+use_tensorboard: true
+use_wandb: false
+wandb_project: null
+wandb_id: null
+wandb_entity: null
+wandb_name: null
+wandb_model_log_interval: -1
+detect_anomaly: false
+pretrain_path: null
+init_param: []
+ignore_init_mismatch: false
+freeze_param: []
+num_iters_per_epoch: null
+batch_size: 32
+valid_batch_size: null
+batch_bins: 1000000
+valid_batch_bins: null
+train_shape_file:
+- exp/enh_stats_16k/train/speech_mix_shape
+- exp/enh_stats_16k/train/speech_ref1_shape
+- exp/enh_stats_16k/train/noise_ref1_shape
+valid_shape_file:
+- exp/enh_stats_16k/valid/speech_mix_shape
+- exp/enh_stats_16k/valid/speech_ref1_shape
+- exp/enh_stats_16k/valid/noise_ref1_shape
+batch_type: folded
+valid_batch_type: null
+fold_length:
+- 80000
+- 80000
+- 80000
+sort_in_batch: descending
+sort_batch: descending
+multiple_iterator: false
+chunk_length: 64000
+chunk_shift_ratio: 0.5
+num_cache_chunks: 1024
+train_data_path_and_name_and_type:
+-   - dump/raw/tr_synthetic/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/tr_synthetic/spk1.scp
+    - speech_ref1
+    - sound
+-   - dump/raw/tr_synthetic/noise1.scp
+    - noise_ref1
+    - sound
+valid_data_path_and_name_and_type:
+-   - dump/raw/cv_synthetic/wav.scp
+    - speech_mix
+    - sound
+-   - dump/raw/cv_synthetic/spk1.scp
+    - speech_ref1
+    - sound
+-   - dump/raw/cv_synthetic/noise1.scp
+    - noise_ref1
+    - sound
+allow_variable_data_keys: false
+max_cache_size: 0.0
+max_cache_fd: 32
+valid_max_cache_size: null
+optim: adam
+optim_conf:
+    lr: 0.001
+    eps: 1.0e-08
+    weight_decay: 1.0e-07
+scheduler: reducelronplateau
+scheduler_conf:
+    mode: min
+    factor: 0.7
+    patience: 1
+init: null
+model_conf:
+    loss_type: si_snr
+criterions:
+  # The first criterion
+  - name: si_snr
+    conf:
+      eps: 1.0e-7
+    # the wrapper for the current criterion
+    # for single-talker case, we simplely use fixed_order wrapper
+    wrapper: fixed_order
+    wrapper_conf:
+      weight: 1.0
+use_preprocessor: false
+encoder: stft
+encoder_conf:
+    n_fft: 512
+    win_length: 400
+    hop_length: 100
+separator: dccrn
+separator_conf: {}
+decoder: stft
+decoder_conf:
+    n_fft: 512
+    win_length: 400
+    hop_length: 100
+required:
+- output_dir
+version: 0.10.5a1
+distributed: true
+```
+</details>
+### Citing ESPnet
+```BibTex
+@inproceedings{watanabe2018espnet,
+  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
+  title={{ESPnet}: End-to-End Speech Processing Toolkit},
+  year={2018},
+  booktitle={Proceedings of Interspeech},
+  pages={2207--2211},
+  doi={10.21437/Interspeech.2018-1456},
+  url={http://dx.doi.org/10.21437/Interspeech.2018-1456}
+}
+@inproceedings{ESPnet-SE,
+  author = {Chenda Li and Jing Shi and Wangyou Zhang and Aswin Shanmugam Subramanian and Xuankai Chang and
+  Naoyuki Kamo and Moto Hira and Tomoki Hayashi and Christoph B{"{o}}ddeker and Zhuo Chen and Shinji Watanabe},
+  title = {ESPnet-SE: End-To-End Speech Enhancement and Separation Toolkit Designed for {ASR} Integration},
+  booktitle = {{IEEE} Spoken Language Technology Workshop, {SLT} 2021, Shenzhen, China, January 19-22, 2021},
+  pages = {785--792},
+  publisher = {{IEEE}},
+  year = {2021},
+  url = {https://doi.org/10.1109/SLT48900.2021.9383615},
+  doi = {10.1109/SLT48900.2021.9383615},
+  timestamp = {Mon, 12 Apr 2021 17:08:59 +0200},
+  biburl = {https://dblp.org/rec/conf/slt/Li0ZSCKHHBC021.bib},
+  bibsource = {dblp computer science bibliography, https://dblp.org}
+}
+```
+or arXiv:
+```bibtex
+@misc{watanabe2018espnet,
+  title={ESPnet: End-to-End Speech Processing Toolkit},
+  author={Shinji Watanabe and Takaaki Hori and Shigeki Karita and Tomoki Hayashi and Jiro Nishitoba and Yuya Unno and Nelson Yalta and Jahn Heymann and Matthew Wiesner and Nanxin Chen and Adithya Renduchintala and Tsubasa Ochiai},
+  year={2018},
+  eprint={1804.00015},
+  archivePrefix={arXiv},
+  primaryClass={cs.CL}
+}
+```