Spaces:

shivamsshhiivvaamm
/

docker_check

Sleeping

App Files Files Community

shivamsshhiivvaamm commited on Dec 19, 2025

Commit

28f20dc

verified ·

1 Parent(s): 804bd59

Upload 4 files

Browse files

Files changed (4) hide show

Dockerfile +12 -0
code.py +79 -0
requirements.txt +3 -0
tey.py +41 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,12 @@

+FROM python:3.13-slim
+WORKDIR /ML
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+COPY . .
+EXPOSE 8000
+CMD ["uvicorn", "code:app", "--host", "0.0.0.0", "--port", "8000"]

code.py ADDED Viewed

	@@ -0,0 +1,79 @@

+from fastapi import FastAPI
+from fastapi.responses import HTMLResponse, StreamingResponse
+from openai import OpenAI
+from os import getenv
+from dotenv import load_dotenv
+load_dotenv()
+app = FastAPI()
+client = OpenAI(
+    base_url="https://openrouter.ai/api/v1",
+    api_key=getenv("OPENROUTER_API_KEY"),
+)
+@app.get("/", response_class=HTMLResponse)
+def index():
+    return """
+    <!DOCTYPE html>
+    <html>
+    <head>
+        <title>Streaming Chat</title>
+        <style>
+            body { font-family: monospace; }
+            #output { white-space: pre-wrap; }
+        </style>
+    </head>
+    <body>
+        <h2>Streaming Response</h2>
+        <button onclick="startChat()">Start Chat</button>
+        <div id="output"></div>
+        <script>
+            async function startChat() {
+                const output = document.getElementById("output");
+                output.textContent = "";
+                const response = await fetch("/chat");
+                const reader = response.body.getReader();
+                const decoder = new TextDecoder();
+                while (true) {
+                    const { value, done } = await reader.read();
+                    if (done) break;
+                    const chunk = decoder.decode(value, { stream: true });
+                    output.textContent += chunk;   // 🔥 live append
+                }
+            }
+        </script>
+    </body>
+    </html>
+    """
+@app.get("/chat")
+def chat():
+    def token_generator():
+        stream = client.chat.completions.create(
+            model="openai/gpt-oss-120b",
+            messages=[{"role": "user", "content": "Say you are a poet and write a poem about streaming responses. with the small description and include a dummy name to"}],
+            stream=True,
+        )
+        for event in stream:
+            delta = event.choices[0].delta
+            if delta and delta.content:
+                yield delta.content   # ✅ streamed to frontend
+    return StreamingResponse(
+        token_generator(),
+        media_type="text/plain"
+    )
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=8000)

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+fastapi
+uvicorn[standard]
+openai

tey.py ADDED Viewed

	@@ -0,0 +1,41 @@

+import logging
+from openai import OpenAI
+from dotenv import load_dotenv
+from os import getenv
+load_dotenv()
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+client = OpenAI(
+    base_url="https://openrouter.ai/api/v1",
+    api_key=getenv("OPENROUTER_API_KEY"),
+)
+def chat():
+    stream = client.chat.completions.create(
+        model="openai/gpt-oss-120b",
+        messages=[
+            {"role": "user", "content": "Say this is a test"}
+        ],
+        stream=True,   # ✅ REQUIRED
+    )
+    logger.info("Streaming response:")
+    full_response = ""
+    for event in stream:
+        # Some events don't contain text — always guard
+        delta = event.choices[0].delta
+        if delta and delta.content:
+            token = delta.content
+            logger.info(token)
+            print(token, end="", flush=True)
+            full_response += token
+    print()
+    return {"response": full_response}
+chat()