Spaces:

pgits
/

stt-gpu-service

Sleeping

Peter Michael Gits Claude commited on Aug 28, 2025

Commit

489f3e7

1 Parent(s): f3f17e8

CRITICAL FIX: Return single value from gradio_transcribe_memory endpoint

- Fixed gradio_transcribe_memory to return only transcription text instead of 3-tuple
- This resolves JSON parsing errors in voiceCal-ai client
- voiceCal-ai expects single string but was receiving (transcription, timing, status)
- All error cases now also return single values
- Should resolve "Starting..." UI issue in voiceCal-ai

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <noreply@anthropic.com>

Files changed (1) hide show

app.py +5 -5

app.py CHANGED Viewed

@@ -223,7 +223,7 @@ def gradio_transcribe_memory(audio_base64: str, language: str = "en", model_size
         if not audio_base64 or audio_base64 == "":
             logger.warning("🚀 MEMORY: No audio data provided")
-            return "❌ No audio data provided", "{}", "Please provide audio data"
         # Decode base64 to binary audio data
         try:
@@ -231,7 +231,7 @@ def gradio_transcribe_memory(audio_base64: str, language: str = "en", model_size
             logger.info(f"🚀 MEMORY: Decoded audio size: {len(audio_binary)} bytes")
         except Exception as decode_error:
             logger.error(f"🚀 MEMORY: Base64 decode error: {decode_error}")
-            return f"❌ Invalid base64 audio data: {decode_error}", "{}", "Base64 decode failed"
         # Save to temporary file for Whisper processing (still needed for torchaudio.load)
         with tempfile.NamedTemporaryFile(suffix='.webm', delete=False) as tmp_file:
@@ -249,9 +249,9 @@ def gradio_transcribe_memory(audio_base64: str, language: str = "en", model_size
             logger.info(f"🚀 MEMORY: Status: {status}")
             if status == "success":
-                return f"✅ {transcription}", json.dumps(timing, indent=2), f"Status: {status}"
             else:
-                return f"❌ Transcription failed", json.dumps(timing, indent=2), f"Status: {status}"
         finally:
             # Clean up temp file
@@ -262,7 +262,7 @@ def gradio_transcribe_memory(audio_base64: str, language: str = "en", model_size
     except Exception as e:
         error_msg = f"Error in gradio_transcribe_memory: {str(e)}"
         logger.error(f"🚀 MEMORY: {error_msg}")
-        return f"❌ Error: {str(e)}", "{}", "Error occurred during in-memory transcription"
 # Create Gradio interface with transcription functionality
 with gr.Blocks(title="🎤 STT WebSocket Service v1.0.0") as demo:

         if not audio_base64 or audio_base64 == "":
             logger.warning("🚀 MEMORY: No audio data provided")
+            return "❌ No audio data provided"
         # Decode base64 to binary audio data
         try:
             logger.info(f"🚀 MEMORY: Decoded audio size: {len(audio_binary)} bytes")
         except Exception as decode_error:
             logger.error(f"🚀 MEMORY: Base64 decode error: {decode_error}")
+            return f"❌ Invalid base64 audio data: {decode_error}"
         # Save to temporary file for Whisper processing (still needed for torchaudio.load)
         with tempfile.NamedTemporaryFile(suffix='.webm', delete=False) as tmp_file:
             logger.info(f"🚀 MEMORY: Status: {status}")
             if status == "success":
+                return transcription  # Return only transcription for voiceCal-ai compatibility
             else:
+                return "❌ Transcription failed"
         finally:
             # Clean up temp file
     except Exception as e:
         error_msg = f"Error in gradio_transcribe_memory: {str(e)}"
         logger.error(f"🚀 MEMORY: {error_msg}")
+        return f"❌ Error: {str(e)}"
 # Create Gradio interface with transcription functionality
 with gr.Blocks(title="🎤 STT WebSocket Service v1.0.0") as demo: