Spaces:

Saadpie1
/

ASH-BAND

Sleeping

App Files Files Community

Saadpie1 commited on Feb 25

Commit

0296e2a

verified ·

1 Parent(s): be72adb

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -13

app.py CHANGED Viewed

@@ -1,7 +1,5 @@
 import os
 import asyncio
-import json
-import base64
 from fastapi import FastAPI, WebSocket, WebSocketDisconnect
 from google import genai
 from google.genai import types
@@ -33,24 +31,31 @@ async def websocket_endpoint(websocket: WebSocket):
     try:
         async with client.aio.live.connect(model=MODEL, config=CONFIG) as session:
-            # 1. Receiver from Gemini -> Send to Band
             async def receive_from_gemini():
                 async for response in session.receive():
                     if response.server_content and response.server_content.model_turn:
                         parts = response.server_content.model_turn.parts
                         for part in parts:
                             if hasattr(part, 'inline_data') and part.inline_data:
-                                # Send raw audio bytes to ESP32
                                 await websocket.send_bytes(part.inline_data.data)
-            # 2. Receiver from Band -> Send to Gemini
             async def receive_from_band():
                 while True:
-                    # ESP32 sends raw 16kHz PCM chunks
-                    data = await websocket.receive_bytes()
-                    await session.send_realtime_input(
-                        audio=types.Blob(data=data, mime_type="audio/pcm;rate=16000")
-                    )
             await asyncio.gather(receive_from_gemini(), receive_from_band())
@@ -65,7 +70,4 @@ def read_root():
 if __name__ == "__main__":
     import uvicorn
-    # Port 7860 is mandatory for Hugging Face Spaces
     uvicorn.run(app, host="0.0.0.0", port=7860)

 import os
 import asyncio
 from fastapi import FastAPI, WebSocket, WebSocketDisconnect
 from google import genai
 from google.genai import types
     try:
         async with client.aio.live.connect(model=MODEL, config=CONFIG) as session:
+            # 1. Gemini -> Band (Binary Audio)
             async def receive_from_gemini():
                 async for response in session.receive():
                     if response.server_content and response.server_content.model_turn:
                         parts = response.server_content.model_turn.parts
                         for part in parts:
                             if hasattr(part, 'inline_data') and part.inline_data:
                                 await websocket.send_bytes(part.inline_data.data)
+            # 2. Band/Termux -> Gemini (Hybrid: Handles Text & Audio)
             async def receive_from_band():
                 while True:
+                    # Generic receive() avoids the 'KeyError' crash
+                    message = await websocket.receive()
+                    if "bytes" in message:
+                        # Audio from ESP32 or Termux Mic
+                        await session.send_realtime_input(
+                            audio=types.Blob(data=message["bytes"], mime_type="audio/pcm;rate=16000")
+                        )
+                    elif "text" in message:
+                        # Typing from Termux
+                        await session.send_client_content(
+                            turns=[types.Content(parts=[types.Part(text=message["text"])])]
+                        )
             await asyncio.gather(receive_from_gemini(), receive_from_band())
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=7860)