1NEYRON1
/

whisper

@@ -887,52 +887,48 @@ class WhisperSSLEnsemble(PreTrainedModel):  # type: ignore
     # В классе WhisperSSLEnsemble
     def _load_ssl_ensemble_if_needed(self):
-        # Если модель уже загружена или не нужна, выходим
         if self.ssl_ensemble_model is not None or not self.predict_mode:
             return
         logger.info("Lazily loading SSL Ensemble model...")
         ssl_ensemble_config = self.config.ssl_ensemble_config
-        # Получаем директорию, где лежат все файлы модели
-        model_dir = os.path.dirname(__file__)
-        # Строим абсолютные пути к файлам, которые мы ищем
-        weak_learners_filename = ssl_ensemble_config["weak_learners_path"]
-        weak_learners_path = os.path.join(model_dir, weak_learners_filename)
-        meta_learner_filename = ssl_ensemble_config["meta_learner_path"]
-        meta_learner_path = os.path.join(model_dir, meta_learner_filename)
         try:
-            # Улучшенная проверка на наличие файлов с отладкой
-            if not os.path.exists(weak_learners_path):
-                # Получаем список всех файлов в директории для отладки
-                files_in_dir = os.listdir(model_dir)
-                error_message = (
-                    f"Weak learners file not found at the expected path: {weak_learners_path}\n"
-                    f"Expected filename from config: '{weak_learners_filename}'\n"
-                    f"Files found in the model directory ('{model_dir}'):\n{files_in_dir}"
-                )
-                raise FileNotFoundError(error_message)
-            if not os.path.exists(meta_learner_path):
-                files_in_dir = os.listdir(model_dir)
-                error_message = (
-                    f"Meta learner file not found at the expected path: {meta_learner_path}\n"
-                    f"Expected filename from config: '{meta_learner_filename}'\n"
-                    f"Files found in the model directory ('{model_dir}'):\n{files_in_dir}"
-                )
-                raise FileNotFoundError(error_message)
-            # Если все проверки пройдены, загружаем модели
             weak_learners = WeakLearners(
                 audio_dim=ssl_ensemble_config["audio_dim"],
                 text_dim=ssl_ensemble_config["text_dim"],
                 device=self._target_device.type
             )
-            # load_fitted уже внутри себя печатает ошибку, но мы можем быть уверены, что файл есть
-            weak_learners.load_fitted(weak_learners_path)
             meta_learner = StackingMetaLearner(
                 weak_output_dim=len(weak_learners.models),
@@ -950,10 +946,11 @@ class WhisperSSLEnsemble(PreTrainedModel):  # type: ignore
             logger.info(f"SSL Ensemble loaded successfully onto device {self._target_device}.")
         except Exception as e:
-            # Этот блок теперь будет ловить наши детальные ошибки FileNotFoundError
             logger.error(f"Failed to lazily load SSL Ensemble model: {e}", exc_info=True)
             self.predict_mode = False
             logger.warning("         Prediction with SSL Ensemble will be disabled.")
     def preprocess_audio(self, audios: List[Union[np.ndarray, torch.Tensor]]) -> torch.Tensor:
         self._load_whisper_if_needed()

     # В классе WhisperSSLEnsemble
     def _load_ssl_ensemble_if_needed(self):
         if self.ssl_ensemble_model is not None or not self.predict_mode:
             return
         logger.info("Lazily loading SSL Ensemble model...")
         ssl_ensemble_config = self.config.ssl_ensemble_config
         try:
+            # НОВЫЙ ПОДХОД: Скачиваем файлы напрямую из репозитория
+            from huggingface_hub import hf_hub_download
+            # Получаем имя репозитория из конфига
+            repo_id = getattr(self.config, '_name_or_path', '1NEYRON1/whisper')
+            # Скачиваем файлы весов напрямую из репозитория
+            weak_learners_filename = ssl_ensemble_config["weak_learners_path"]
+            meta_learner_filename = ssl_ensemble_config["meta_learner_path"]
+            logger.info(f"Downloading {weak_learners_filename} from {repo_id}...")
+            weak_learners_path = hf_hub_download(
+                repo_id=repo_id,
+                filename=weak_learners_filename
+            )
+            logger.info(f"Downloading {meta_learner_filename} from {repo_id}...")
+            meta_learner_path = hf_hub_download(
+                repo_id=repo_id,
+                filename=meta_learner_filename
+            )
+            logger.info(f"Files downloaded successfully:")
+            logger.info(f"  Weak learners: {weak_learners_path}")
+            logger.info(f"  Meta learner: {meta_learner_path}")
+            # Теперь загружаем модели из скачанных файлов
             weak_learners = WeakLearners(
                 audio_dim=ssl_ensemble_config["audio_dim"],
                 text_dim=ssl_ensemble_config["text_dim"],
                 device=self._target_device.type
             )
+            if not weak_learners.load_fitted(weak_learners_path):
+                raise RuntimeError(f"Failed to load weak learners from {weak_learners_path}")
             meta_learner = StackingMetaLearner(
                 weak_output_dim=len(weak_learners.models),
             logger.info(f"SSL Ensemble loaded successfully onto device {self._target_device}.")
         except Exception as e:
             logger.error(f"Failed to lazily load SSL Ensemble model: {e}", exc_info=True)
             self.predict_mode = False
             logger.warning("         Prediction with SSL Ensemble will be disabled.")
     def preprocess_audio(self, audios: List[Union[np.ndarray, torch.Tensor]]) -> torch.Tensor:
         self._load_whisper_if_needed()