Немножко изменил список зависимостей и добавил ячейку для просмотра списка установленных моделей в Vbach

Browse files

Files changed (1) hide show

MVSepLess_Epsilon_Colab.ipynb +54 -44

MVSepLess_Epsilon_Colab.ipynb CHANGED Viewed

@@ -18,63 +18,59 @@
         "%cd $home_dir\n",
         "!git clone $repo_url $mvsepless_dir\n",
         "%cd $mvsepless_dir\n",
-        "!pip install uv\n",
         "req = \"\"\"\n",
-        "torch==2.9.0\n",
-        "torchvision==0.24.0\n",
-        "torchaudio==2.9.0\n",
         "numpy==2.0.2\n",
         "pandas\n",
-        "scipy==1.16.3\n",
-        "librosa==0.11.0\n",
         "samplerate==0.1.0\n",
         "matplotlib\n",
-        "tqdm==4.67.1\n",
-        "einops==0.8.1\n",
-        "protobuf==5.29.5\n",
-        "soundfile==0.13.1\n",
-        "pydub==0.25.1\n",
-        "webrtcvad==2.0.10\n",
-        "audiomentations==0.42.0\n",
         "pedalboard==0.8.2\n",
-        "ffmpeg-python==0.2.0\n",
-        "ml_collections==1.1.0\n",
-        "timm==1.0.22\n",
-        "wandb==0.23.0\n",
-        "accelerate==1.12.0\n",
-        "bitsandbytes==0.46.0\n",
-        "tokenizers==0.22.1\n",
-        "huggingface-hub==0.36.0\n",
-        "transformers==4.57.2\n",
-        "segmentation_models_pytorch==0.5.0\n",
-        "torchseg==0.0.1a4\n",
         "demucs==4.0.0\n",
-        "asteroid==0.7.0\n",
-        "prodigyopt==1.1.2\n",
-        "torch_log_wmse==0.3.0\n",
-        "rotary_embedding_torch==0.6.5\n",
         "gradio\n",
-        "omegaconf==2.3.0\n",
-        "beartype==0.22.6\n",
-        "spafe==0.3.2\n",
-        "torch_audiomentations==0.12.0\n",
-        "auraloss==0.4.0\n",
         "onnx>=1.17\n",
         "onnx2torch>=0.3.0\n",
         "onnxruntime-gpu>=1.17\n",
-        "ml_dtypes==0.5.4\n",
         "resampy\n",
         "yt_dlp\n",
-        "python-magic\n",
         "pyngrok\n",
         "tabulate\n",
-        "gradio_modal\n",
         "neuraloperator==1.0.2\n",
-        "torchcrepe==0.0.23\n",
-        "praat-parselmouth==0.4.5\n",
         "faiss-cpu==1.11\n",
-        "local-attention==1.11.1\n",
-        "tenacity==9.1.2\n",
         "pyworld\n",
         "gdown\n",
         "\"\"\"\n",
@@ -147,7 +143,7 @@
         "\n",
         "input_url = \"\" # @param {\"type\":\"string\",\"placeholder\":\"Ссылка на аудио/видео\"}\n",
         "output_dir = \"/content/downloaded\" # @param {\"type\":\"string\",\"placeholder\":\"Директория для сохранения скачанного аудио\"}\n",
-        "cookies_path = \"\" # @param {\"type\":\"string\",\"placeholder\":\"Путь к cookies (дял успешного скачивания с ютуба)\"}\n",
         "downloaded_file = dw_yt_dlp(url=input_url, output_dir=output_dir, cookie=cookies_path)\n"
       ],
       "metadata": {
@@ -329,7 +325,7 @@
         "#@markdown ---\n",
         "#@markdown ### Входные данные\n",
         "#@markdown * Путь к входной папке/файлу:\n",
-        "input_path = \"\" # @param {\"type\":\"string\",\"placeholder\":\"/путь/к/файлу\"}\n",
         "#@markdown ---\n",
         "#@markdown ### Выбор модели\n",
         "#@markdown * Тип / Имя модели:\n",
@@ -385,6 +381,20 @@
         "id": "H24RtVB1YlE0"
       }
     },
     {
       "cell_type": "markdown",
       "source": [
@@ -475,7 +485,7 @@
         "# @markdown ---\n",
         "# @markdown  ### Hubert\n",
         "# @markdown * Стэк\n",
-        "stack = \"fairseq\" # @param [\"fairseq\",\"transformers\"]\n",
         "# @markdown * Имя модели для fairseq\n",
         "fairseq_embedder = \"hubert_base\" # @param [\"hubert_base\",\"contentvec_base\",\"korean_hubert_base\",\"chinese_hubert_base\",\"portuguese_hubert_base\",\"japanese_hubert_base\"]\n",
         "# @markdown * Имя модели для transformers\n",
@@ -483,7 +493,7 @@
         "# @markdown ---\n",
         "# @markdown  ### Настройки преобразования\n",
         "# @markdown * Влияние индекса\n",
-        "index_rate = 0 # @param {\"type\":\"slider\",\"min\":0,\"max\":1,\"step\":0.01}\n",
         "# @markdown * Стерео режим\n",
         "stereo_mode = \"mono\" # @param [\"mono\",\"left/right\",\"sim/dif\"]\n",
         "# @markdown * Метод определения тона\n",

         "%cd $home_dir\n",
         "!git clone $repo_url $mvsepless_dir\n",
         "%cd $mvsepless_dir\n",
+        "!pip install --no-cache-dir uv\n",
         "req = \"\"\"\n",
+        "torch\n",
+        "torchvision\n",
+        "torchaudio\n",
         "numpy==2.0.2\n",
         "pandas\n",
+        "scipy\n",
+        "librosa\n",
         "samplerate==0.1.0\n",
         "matplotlib\n",
+        "tqdm\n",
+        "einops\n",
+        "protobuf\n",
+        "soundfile\n",
+        "pydub\n",
+        "webrtcvad\n",
+        "audiomentations\n",
         "pedalboard==0.8.2\n",
+        "ml_collections\n",
+        "timm\n",
+        "wandb\n",
+        "accelerate\n",
+        "bitsandbytes\n",
+        "tokenizers\n",
+        "huggingface-hub\n",
+        "transformers\n",
+        "torchseg\n",
         "demucs==4.0.0\n",
+        "asteroid\n",
+        "prodigyopt\n",
+        "torch_log_wmse\n",
+        "rotary_embedding_torch\n",
         "gradio\n",
+        "omegaconf\n",
+        "beartype\n",
+        "spafe\n",
+        "torch_audiomentations\n",
+        "auraloss\n",
         "onnx>=1.17\n",
         "onnx2torch>=0.3.0\n",
         "onnxruntime-gpu>=1.17\n",
+        "ml_dtypes\n",
         "resampy\n",
         "yt_dlp\n",
         "pyngrok\n",
         "tabulate\n",
         "neuraloperator==1.0.2\n",
+        "torchcrepe\n",
+        "praat-parselmouth\n",
         "faiss-cpu==1.11\n",
+        "local-attention\n",
+        "tenacity\n",
         "pyworld\n",
         "gdown\n",
         "\"\"\"\n",
         "\n",
         "input_url = \"\" # @param {\"type\":\"string\",\"placeholder\":\"Ссылка на аудио/видео\"}\n",
         "output_dir = \"/content/downloaded\" # @param {\"type\":\"string\",\"placeholder\":\"Директория для сохранения скачанного аудио\"}\n",
+        "cookies_path = \"\" # @param {\"type\":\"string\",\"placeholder\":\"Путь к cookies (для успешного скачивания с ютуба)\"}\n",
         "downloaded_file = dw_yt_dlp(url=input_url, output_dir=output_dir, cookie=cookies_path)\n"
       ],
       "metadata": {
         "#@markdown ---\n",
         "#@markdown ### Входные данные\n",
         "#@markdown * Путь к входной папке/файлу:\n",
+        "input_path = \"/content/musicboxtntblits_128kbit.mp3\" # @param {\"type\":\"string\",\"placeholder\":\"/путь/к/файлу\"}\n",
         "#@markdown ---\n",
         "#@markdown ### Выбор модели\n",
         "#@markdown * Тип / Имя модели:\n",
         "id": "H24RtVB1YlE0"
       }
     },
+    {
+      "cell_type": "code",
+      "execution_count": null,
+      "metadata": {
+        "cellView": "form",
+        "id": "JGme2oZOf_W3"
+      },
+      "outputs": [],
+      "source": [
+        "#@title Показать список установленных моделей для преобразования\n",
+        "%cd $mvsepless_dir\n",
+        "!python mvsepless/model_manager.py vbach list"
+      ]
+    },
     {
       "cell_type": "markdown",
       "source": [
         "# @markdown ---\n",
         "# @markdown  ### Hubert\n",
         "# @markdown * Стэк\n",
+        "stack = \"transformers\" # @param [\"fairseq\",\"transformers\"]\n",
         "# @markdown * Имя модели для fairseq\n",
         "fairseq_embedder = \"hubert_base\" # @param [\"hubert_base\",\"contentvec_base\",\"korean_hubert_base\",\"chinese_hubert_base\",\"portuguese_hubert_base\",\"japanese_hubert_base\"]\n",
         "# @markdown * Имя модели для transformers\n",
         "# @markdown ---\n",
         "# @markdown  ### Настройки преобразования\n",
         "# @markdown * Влияние индекса\n",
+        "index_rate = 1 # @param {\"type\":\"slider\",\"min\":0,\"max\":1,\"step\":0.01}\n",
         "# @markdown * Стерео режим\n",
         "stereo_mode = \"mono\" # @param [\"mono\",\"left/right\",\"sim/dif\"]\n",
         "# @markdown * Метод определения тона\n",