Spaces:

thangquang09
/

Deploy_FastAPI_Space

Paused

App Files Files Community

thangquang09 commited on Mar 26, 2025

Commit

03aa457

1 Parent(s): 1a496eb

Add application file

Browse files

Files changed (3) hide show

Dockerfile +13 -0
app.py +65 -0
requirements.txt +6 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,13 @@

+FROM python:3.12.9
+COPY . .
+WORKDIR /
+RUN pip install --no-cache-dir --upgrade -r /requirements.txt
+RUN curl -fsSL https://ollama.com/install.sh | sh
+RUN ollama serve
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,65 @@

+from fastapi import FastAPI
+from pydantic import BaseModel
+from fastapi.middleware.cors import CORSMiddleware
+from llama_index.llms.ollama import Ollama
+from llama_index.core.llms import ChatMessage
+import time
+app = FastAPI()
+class Generate(BaseModel):
+    response: str
+    duration: float
+chat_history = []
+model = Ollama(model="llama3")
+def generate_text(model: Ollama, prompt: str) -> {}:
+    if prompt == "":
+        return {
+            "response": "Please provide a prompt.",
+            "duration": str(0)
+        }
+    chat_history.append({
+        "role": "user",
+        "content": prompt
+    })
+    messages = [ChatMessage(role=msg["role"], content=msg["content"]) for msg in chat_history]
+    start_time = time.time()
+    response_gen = model.stream_chat(messages)
+    full_response = ""
+    try:
+        for response_chunk in response_gen:
+            full_response += response_chunk.delta
+    except Exception as e:
+        return {
+            "response": f"Error: {str(e)}",
+            "duration": 0
+        }
+    duration = time.time() - start_time
+    chat_history.append({
+        "role": "assistant",
+        "content": full_response
+    })
+    return {
+        "response": full_response,
+        "duration": f"{duration:.2f}"
+    }
+@app.get("/")
+async def root():
+    return {"message": "Hello World"}
+@app.post("/api/generate", summary="Generate text from prompt", tags=["Generate"], response_model=Generate)
+def inference(input_prompt: str):
+    return generate_text(model, input_prompt)

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+streamlit
+fastapi>=0.100.0  # Newer FastAPI version
+llama-index
+pydantic>=2.0.0  # Newer Pydantic version
+Pillow
+uvicorn