Spaces:

Akjava
/

AIGamingVoice-Japanese

Sleeping

App Files Files Community

Akjava commited on Jan 9

Commit

1cee964

1 Parent(s): 697c000

fix log

Browse files

Files changed (1) hide show

app.py +22 -13

app.py CHANGED Viewed

@@ -36,6 +36,7 @@ MODEL_PATH = os.getenv("MODEL_PATH", os.path.join(MODELS_DIR, DEFAULT_MODEL))
 VOCODER_PATH = os.getenv("VOCODER_PATH", None)
 USE_GPU = os.getenv("USE_GPU", "false").lower() == "true"
 SAMPLE_RATE = 22050
 def get_available_models():
@@ -93,8 +94,9 @@ def process_japanese_text(text: str):
     phonemes = phonemes.replace(" ", "")
     phonemes = phonemes.replace("pau", " ")
-    print(f"Input: {text}")
-    print(f"Phonemes: {phonemes}")
     # Text to sequence
     sequence = text_to_sequence(phonemes)
@@ -136,7 +138,8 @@ class ONNXModelManager:
     def _load_model(self):
         """Load ONNX model(s)"""
-        print(f"Loading model from {self.model_path} with providers {self.providers}")
         self.model = ort.InferenceSession(self.model_path, providers=self.providers)
         model_inputs = self.model.get_inputs()
@@ -145,12 +148,14 @@ class ONNXModelManager:
         self.is_multi_speaker = len(model_inputs) == 4
         self.has_vocoder_embedded = model_outputs[0].name == "wav"
-        print(f"Model loaded: multi_speaker={self.is_multi_speaker}, "
-              f"vocoder_embedded={self.has_vocoder_embedded}")
         # Load external vocoder if needed
         if not self.has_vocoder_embedded and self.vocoder_path:
-            print(f"Loading external vocoder from {self.vocoder_path}")
             self.vocoder = ort.InferenceSession(self.vocoder_path, providers=self.providers)
     def synthesize(
@@ -204,7 +209,8 @@ def get_model_manager(model_name: str) -> ONNXModelManager:
     model_path = os.path.join(MODELS_DIR, model_name)
     if model_name not in model_managers:
-        print(f"Loading new model: {model_name}")
         model_managers[model_name] = ONNXModelManager(
             model_path=model_path,
             vocoder_path=VOCODER_PATH,
@@ -216,10 +222,12 @@ def get_model_manager(model_name: str) -> ONNXModelManager:
 # Pre-load all available models
-print("Pre-loading all models for ZeroGPU...")
 for model_name in get_available_models():
     get_model_manager(model_name)
-print("All models loaded.")
 # ============================================================================
 # Gradio Interface Functions
@@ -274,9 +282,10 @@ def synthesise(
         audio_duration_sec = len(audio) / SAMPLE_RATE
         rtf = inference_time / audio_duration_sec
-        print(f"Inference time: {inference_time:.3f}s, "
-              f"Audio duration: {audio_duration_sec:.3f}s, "
-              f"RTF: {rtf:.3f}")
         # Save to temporary file
         with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
@@ -445,4 +454,4 @@ if __name__ == "__main__":
         server_port=7860,
         share=False,
         show_error=True
-    )

 VOCODER_PATH = os.getenv("VOCODER_PATH", None)
 USE_GPU = os.getenv("USE_GPU", "false").lower() == "true"
 SAMPLE_RATE = 22050
+DEBUG = os.getenv("DEBUG", "false").lower() == "true"
 def get_available_models():
     phonemes = phonemes.replace(" ", "")
     phonemes = phonemes.replace("pau", " ")
+    if DEBUG:
+        print(f"Input: {text}")
+        print(f"Phonemes: {phonemes}")
     # Text to sequence
     sequence = text_to_sequence(phonemes)
     def _load_model(self):
         """Load ONNX model(s)"""
+        if DEBUG:
+            print(f"Loading model from {self.model_path} with providers {self.providers}")
         self.model = ort.InferenceSession(self.model_path, providers=self.providers)
         model_inputs = self.model.get_inputs()
         self.is_multi_speaker = len(model_inputs) == 4
         self.has_vocoder_embedded = model_outputs[0].name == "wav"
+        if DEBUG:
+            print(f"Model loaded: multi_speaker={self.is_multi_speaker}, "
+                  f"vocoder_embedded={self.has_vocoder_embedded}")
         # Load external vocoder if needed
         if not self.has_vocoder_embedded and self.vocoder_path:
+            if DEBUG:
+                print(f"Loading external vocoder from {self.vocoder_path}")
             self.vocoder = ort.InferenceSession(self.vocoder_path, providers=self.providers)
     def synthesize(
     model_path = os.path.join(MODELS_DIR, model_name)
     if model_name not in model_managers:
+        if DEBUG:
+            print(f"Loading new model: {model_name}")
         model_managers[model_name] = ONNXModelManager(
             model_path=model_path,
             vocoder_path=VOCODER_PATH,
 # Pre-load all available models
+if DEBUG:
+    print("Pre-loading all models for ZeroGPU...")
 for model_name in get_available_models():
     get_model_manager(model_name)
+if DEBUG:
+    print("All models loaded.")
 # ============================================================================
 # Gradio Interface Functions
         audio_duration_sec = len(audio) / SAMPLE_RATE
         rtf = inference_time / audio_duration_sec
+        if DEBUG:
+            print(f"Inference time: {inference_time:.3f}s, "
+                  f"Audio duration: {audio_duration_sec:.3f}s, "
+                  f"RTF: {rtf:.3f}")
         # Save to temporary file
         with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
         server_port=7860,
         share=False,
         show_error=True
+    )