Spaces:

patriotyk
/

Apollo

Running on Zero

Serhiy Stetskovych commited on Nov 14, 2024

Commit

a60a79a

1 Parent(s): 1b8633f

Add vocal models

Files changed (4) hide show

app.py CHANGED Viewed

@@ -45,14 +45,23 @@ texts
 apollo_config = get_config('configs/apollo.yaml')
 apollo_model = look2hear.models.BaseModel.from_pretrain('weights/apollo.bin', **apollo_config['model']).to(device)
 models = {
-   'apollo':  apollo_model
 }
 choices = [
-    ('MP3 restore', 'apollo')
 ]
 @spaces.GPU

 apollo_config = get_config('configs/apollo.yaml')
+apollo_vocal_config = get_config('configs/config_apollo_vocal.yaml')
 apollo_model = look2hear.models.BaseModel.from_pretrain('weights/apollo.bin', **apollo_config['model']).to(device)
+apollo_vocal = look2hear.models.BaseModel.from_pretrain('weights/apollo_vocal.bin', **apollo_vocal_config['model']).to(device)
+apollo_vocal2 = look2hear.models.BaseModel.from_pretrain('weights/apollo_vocal2.bin', **apollo_vocal_config['model']).to(device)
 models = {
+   'apollo': apollo_model,
+   'apollo_vocal': apollo_vocal,
+   'apollo_vocal2': apollo_vocal2
 }
 choices = [
+    ('MP3 restore', 'apollo'),
+    ('Apollo vocal', 'apollo_vocal'),
+    ('Apollo vocal2', 'apollo_vocal2')
 ]
 @spaces.GPU

configs/config_apollo_vocal.yaml ADDED Viewed

+audio:
+  chunk_size: 132300
+  num_channels: 2
+  sample_rate: 44100
+  min_mean_abs: 0.0
+model:
+  sr: 44100
+  win: 20
+  feature_dim: 192
+  layer: 6
+training:
+  instruments: ['restored', 'addition']
+  target_instrument: 'restored'
+  batch_size: 1
+  gradient_accumulation_steps: 2
+  num_steps: 1000
+  num_epochs: 1000
+  optimizer: 'prodigy'
+  lr:  1.0
+  patience: 2
+  reduce_factor: 0.95
+  coarse_loss_clip: true
+  grad_clip: 0
+  q: 0.95
+  use_amp: false
+optimizer:
+  weight_decay: 0.01
+  betas: [0.5, 0.99]
+augmentations:
+  enable: false # enable or disable all augmentations (to fast disable if needed)
+  loudness: true # randomly change loudness of each stem on the range (loudness_min; loudness_max)
+  loudness_min: 0.5
+  loudness_max: 1.5
+inference:
+  batch_size: 1
+  num_overlap: 4

weights/apollo_vocal.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:61b93332da9cde13925b2726b0b31167b05bc20030271b19a583ccf76d69354b
+size 66532080

weights/apollo_vocal2.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9255c2f43b467840260dc4c0f99f26bcdb0a7c3523d7b5165d13322ca955b41
+size 38159792