Spaces:

crackuser
/

voiceclone-dev

Sleeping

App Files Files Community

crackuser commited on Sep 11, 2025

Commit

9fc51ff

verified ·

1 Parent(s): 1879a3e

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -10

app.py CHANGED Viewed

@@ -115,9 +115,7 @@ def load_whisper():
         return False
 def voice_to_voice_clone_fixed(reference_audio, input_audio, language="en"):
-    """
-    FIXED Voice-to-Voice Cloning - No more generate() errors!
-    """
     try:
         if not reference_audio or not input_audio:
             return None, "❌ Please upload both reference and input audio files!"
@@ -226,7 +224,7 @@ except Exception as e:
     startup_msg = f"⚠️ Startup issue: {str(e)}"
     startup_color = "#f8d7da"
-# Create Gradio Interface
 with gr.Blocks(title="🎭 FIXED Voice Cloning - No Generate() Errors") as demo:
     gr.HTML("""
@@ -250,11 +248,11 @@ with gr.Blocks(title="🎭 FIXED Voice Cloning - No Generate() Errors") as demo:
         <h4 style="color: #0c5460;">🔧 How This Fix Works:</h4>
         <div style="display: grid; grid-template-columns: 1fr 1fr; gap: 20px;">
             <div>
-                <h5>❌ Previous Problem:</h5>
                 <ul>
                     <li><code>'GPT2InferenceModel' object has no attribute 'generate'</code></li>
                     <li>High-level API internally called non-existent method</li>
-                    <li>TTS package bug causing failures</li>
                 </ul>
             </div>
             <div>
@@ -262,26 +260,26 @@ with gr.Blocks(title="🎭 FIXED Voice Cloning - No Generate() Errors") as demo:
                 <ul>
                     <li><strong>Manual Loading:</strong> Direct XTTS model initialization</li>
                     <li><strong>Direct Inference:</strong> Uses <code>model.inference()</code> not generate()</li>
-                    <li><strong>Maintained Package:</strong> Falls back to <code>coqui-tts</code></li>
                 </ul>
             </div>
         </div>
     </div>
     """)
-    # Main interface
     with gr.Row():
         with gr.Column():
             reference_audio = gr.Audio(
                 label="🎤 Reference Audio (Voice to Clone)",
-                info="6+ seconds of clear speech",
                 type="filepath",
                 sources=["upload", "microphone"]
             )
             input_audio = gr.Audio(
                 label="🎵 Input Audio (Content to Transform)",
-                info="Speech content to clone",
                 type="filepath",
                 sources=["upload", "microphone"]
             )
@@ -311,6 +309,27 @@ with gr.Blocks(title="🎭 FIXED Voice Cloning - No Generate() Errors") as demo:
                 interactive=False
             )
     # Event handler
     clone_btn.click(
         fn=voice_to_voice_clone_fixed,

         return False
 def voice_to_voice_clone_fixed(reference_audio, input_audio, language="en"):
+    """FIXED Voice-to-Voice Cloning - No more generate() errors!"""
     try:
         if not reference_audio or not input_audio:
             return None, "❌ Please upload both reference and input audio files!"
     startup_msg = f"⚠️ Startup issue: {str(e)}"
     startup_color = "#f8d7da"
+# Create Gradio Interface - FIXED (removed 'info' parameters)
 with gr.Blocks(title="🎭 FIXED Voice Cloning - No Generate() Errors") as demo:
     gr.HTML("""
         <h4 style="color: #0c5460;">🔧 How This Fix Works:</h4>
         <div style="display: grid; grid-template-columns: 1fr 1fr; gap: 20px;">
             <div>
+                <h5>❌ Previous Problems:</h5>
                 <ul>
                     <li><code>'GPT2InferenceModel' object has no attribute 'generate'</code></li>
+                    <li><code>TypeError: Audio.__init__() got an unexpected keyword argument 'info'</code></li>
                     <li>High-level API internally called non-existent method</li>
                 </ul>
             </div>
             <div>
                 <ul>
                     <li><strong>Manual Loading:</strong> Direct XTTS model initialization</li>
                     <li><strong>Direct Inference:</strong> Uses <code>model.inference()</code> not generate()</li>
+                    <li><strong>Fixed UI:</strong> Removed unsupported <code>info</code> parameters</li>
                 </ul>
             </div>
         </div>
     </div>
     """)
+    # Main interface - FIXED: Removed 'info' parameters
     with gr.Row():
         with gr.Column():
             reference_audio = gr.Audio(
                 label="🎤 Reference Audio (Voice to Clone)",
+                # REMOVED: info parameter to fix runtime error
                 type="filepath",
                 sources=["upload", "microphone"]
             )
             input_audio = gr.Audio(
                 label="🎵 Input Audio (Content to Transform)",
+                # REMOVED: info parameter to fix runtime error
                 type="filepath",
                 sources=["upload", "microphone"]
             )
                 interactive=False
             )
+    # Usage instructions
+    gr.HTML("""
+    <div style="padding: 20px; background: #f8f9fa; border-radius: 10px; margin-top: 20px;">
+        <h4 style="color: #495057;">📋 Usage Instructions:</h4>
+        <ol style="padding-left: 20px; line-height: 1.6;">
+            <li><strong>Reference Audio:</strong> Upload 6+ seconds of clear speech (voice to clone)</li>
+            <li><strong>Input Audio:</strong> Upload speech content to transform</li>
+            <li><strong>Language:</strong> Select the language of the content</li>
+            <li><strong>Click "Clone Voice"</strong> and wait for processing (1-2 minutes)</li>
+            <li><strong>Download Result:</strong> Same content, different voice!</li>
+        </ol>
+        <h5 style="color: #198754; margin-top: 15px;">✅ Runtime Errors Fixed:</h5>
+        <ul style="padding-left: 20px;">
+            <li>Removed unsupported <code>info</code> parameters from Audio components</li>
+            <li>Fixed generate() method error with direct inference</li>
+            <li>Added PyTorch 2.6 compatibility patches</li>
+        </ul>
+    </div>
+    """)
     # Event handler
     clone_btn.click(
         fn=voice_to_voice_clone_fixed,