speechbrain
/

resepformer-wsj02mix

Source Separation

Speech Separation

Audio Source Separation

audio-source-separation

Model card Files Files and versions

cemsubakan commited on Feb 25, 2024

Commit

b8e127b

·

verified ·

1 Parent(s): 9de6a95

Update hyperparams.yaml

Files changed (1) hide show

hyperparams.yaml +10 -10

hyperparams.yaml CHANGED Viewed

@@ -13,11 +13,11 @@ kernel_size: 16
 kernel_stride: 8
 # Specifying the network
-Encoder: &id003 !new:speechbrain.lobes.models.dual_path.Encoder
   kernel_size: 16
   out_channels: 128
-intra_mdl: &id001 !new:speechbrain.lobes.models.resepformer.SBTransformerBlock_wnormandskip
   num_layers: 8
   d_model: 128
   nhead: 8
@@ -28,7 +28,7 @@ intra_mdl: &id001 !new:speechbrain.lobes.models.resepformer.SBTransformerBlock_w
   use_norm: true
   use_skip: true
-mem_mdl: &id002 !new:speechbrain.lobes.models.resepformer.SBTransformerBlock_wnormandskip
   num_layers: 8
   d_model: 128
   nhead: 8
@@ -39,7 +39,7 @@ mem_mdl: &id002 !new:speechbrain.lobes.models.resepformer.SBTransformerBlock_wno
   use_norm: true
   use_skip: true
-MaskNet: &id005 !new:speechbrain.lobes.models.resepformer.ResourceEfficientSeparator
   input_dim: 128
   num_spk: 2
   causal: false
@@ -47,10 +47,10 @@ MaskNet: &id005 !new:speechbrain.lobes.models.resepformer.ResourceEfficientSepar
   segment_size: 150
   layer: 2
   mem_type: av
-  seg_model: *id001
-  mem_model: *id002
-Decoder: &id004 !new:speechbrain.lobes.models.dual_path.Decoder
   in_channels: 128
   out_channels: 1
   kernel_size: 16
@@ -58,9 +58,9 @@ Decoder: &id004 !new:speechbrain.lobes.models.dual_path.Decoder
   bias: false
 modules:
-  encoder: *id003
-  decoder: *id004
-  masknet: *id005
 pretrainer: !new:speechbrain.utils.parameter_transfer.Pretrainer
   loadables:

 kernel_stride: 8
 # Specifying the network
+Encoder: !new:speechbrain.lobes.models.dual_path.Encoder
   kernel_size: 16
   out_channels: 128
+intra_mdl: !new:speechbrain.lobes.models.resepformer.SBTransformerBlock_wnormandskip
   num_layers: 8
   d_model: 128
   nhead: 8
   use_norm: true
   use_skip: true
+mem_mdl: !new:speechbrain.lobes.models.resepformer.SBTransformerBlock_wnormandskip
   num_layers: 8
   d_model: 128
   nhead: 8
   use_norm: true
   use_skip: true
+MaskNet: !new:speechbrain.lobes.models.resepformer.ResourceEfficientSeparator
   input_dim: 128
   num_spk: 2
   causal: false
   segment_size: 150
   layer: 2
   mem_type: av
+  seg_model: !ref <intra_mdl>
+  mem_model: !ref <mem_mdl>
+Decoder: !new:speechbrain.lobes.models.dual_path.Decoder
   in_channels: 128
   out_channels: 1
   kernel_size: 16
   bias: false
 modules:
+  encoder: !ref <Encoder>
+  decoder: !ref <Decoder>
+  masknet: !ref <MaskNet>
 pretrainer: !new:speechbrain.utils.parameter_transfer.Pretrainer
   loadables: