Spaces:

Bc-AI
/

sam-x-api

Sleeping

Bc-AI commited on Oct 19, 2025

Commit

e8fe16d

verified ·

1 Parent(s): 1df8ec7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,7 +13,7 @@ from fastapi import FastAPI, HTTPException
 from fastapi.responses import StreamingResponse
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
-from typing import List, Optional, AsyncGenerator
 import asyncio
 import gradio as gr
@@ -361,7 +361,7 @@ print(f"\n🎉 Ready! Default model: {current_backend.get_name()}")
 # Streaming Generator
 # ==============================================================================
-async def generate_stream(prompt: str, backend, temperature: float) -> AsyncGenerator[str]:
     encoded_prompt = tokenizer.encode(prompt)
     input_ids = [i for i in encoded_prompt.ids if i != eos_token_id]
     generated = input_ids.copy()
@@ -460,7 +460,7 @@ async def chat_completions(request: ChatCompletionRequest):
                 }]
             }
             yield f"data: {json.dumps(chunk)}\n\n"
-        yield "data: [DONE]\n\n"
     if request.stream:
         return StreamingResponse(event_stream(), media_type="text/event-stream")
@@ -468,7 +468,7 @@ async def chat_completions(request: ChatCompletionRequest):
         full = ""
         async for token in event_stream():
             if "[DONE]" not in token:
-                data = json.loads(token.replace("data: ", "").strip())
                 full += data["choices"][0]["delta"]["content"]
         return {"choices": [{"message": {"content": full}}]}

 from fastapi.responses import StreamingResponse
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
+from typing import List, Optional, AsyncGenerator  # ✅ AsyncGenerator import
 import asyncio
 import gradio as gr
 # Streaming Generator
 # ==============================================================================
+async def generate_stream(prompt: str, backend, temperature: float) -> AsyncGenerator[str, None]:  # ✅ Fixed type hint
     encoded_prompt = tokenizer.encode(prompt)
     input_ids = [i for i in encoded_prompt.ids if i != eos_token_id]
     generated = input_ids.copy()
                 }]
             }
             yield f"data: {json.dumps(chunk)}\n\n"
+        yield " [DONE]\n\n"
     if request.stream:
         return StreamingResponse(event_stream(), media_type="text/event-stream")
         full = ""
         async for token in event_stream():
             if "[DONE]" not in token:
+                data = json.loads(token.replace(" ", "").strip())
                 full += data["choices"][0]["delta"]["content"]
         return {"choices": [{"message": {"content": full}}]}