AV_MossFormer2_TSE_16K

Model card Files Files and versions

xet

Community

RedbeardNZ

alibabasglab commited on May 16, 2025

Commit

774706b

verified ·

0 Parent(s):

Duplicate from alibabasglab/AV_MossFormer2_TSE_16K

Browse files

Co-authored-by: Alibaba_Speech_Lab_SG <alibabasglab@users.noreply.huggingface.co>

Files changed (5) hide show

.gitattributes +35 -0
README.md +9 -0
last_best_checkpoint +1 -0
last_best_checkpoint.pt +3 -0
last_best_checkpoint_old.pt +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+license: apache-2.0
+---
+The AV_MossFormer2_TSE_16K model weights for 16 kHz audio-visual target speaker extraction in [ClearerVoice-Studio](https://github.com/modelscope/ClearerVoice-Studio/tree/main) repo.
+This model is trained on large scale open-sourced datasets.
+It extracts each speaker's voice from a multi-speaker video using facial recognition.

last_best_checkpoint ADDED Viewed

	@@ -0,0 +1 @@


1	+ last_best_checkpoint.pt

last_best_checkpoint.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0e60209aab0b31c38deea4ab116100acbbf3a07db8bc559f796f118da1a767d5
+size 734561014

last_best_checkpoint_old.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:591a51cfea0a4038b006793308a42b74a661a58b5e0afac20f1def0700b44ae6
+size 734561014