audio_chat

Sleeping

App Files Files Community

pvanand commited on Jan 8, 2025

Commit

8afcdff

verified ·

1 Parent(s): 775f284

add sse

Browse files

Files changed (1) hide show

main.py +51 -0

main.py CHANGED Viewed

@@ -19,6 +19,8 @@ from fastapi.responses import StreamingResponse, JSONResponse
 from pydantic import BaseModel, Field
 from openai import OpenAI
 from prompts import *
 # ============================================================================
 # Configuration and Setup
 # ============================================================================
@@ -277,6 +279,7 @@ async def llm_agent(query: LLMAgentQueryModel, background_tasks: BackgroundTasks
         logger.info(f"Completed LLM agent response for query: {query.prompt}")
     return StreamingResponse(process_response(), media_type="text/event-stream")
 @app.post("/v2/llm-agent")
 async def llm_agent_v2(query: LLMAgentQueryModel, background_tasks: BackgroundTasks, api_key: str = Depends(verify_api_key)):
@@ -323,6 +326,54 @@ async def llm_agent_v2(query: LLMAgentQueryModel, background_tasks: BackgroundTa
     return StreamingResponse(process_response(), media_type="text/event-stream")
 import edge_tts
 import io

 from pydantic import BaseModel, Field
 from openai import OpenAI
 from prompts import *
+import json
+from sse_starlette.sse import EventSourceResponse
 # ============================================================================
 # Configuration and Setup
 # ============================================================================
         logger.info(f"Completed LLM agent response for query: {query.prompt}")
     return StreamingResponse(process_response(), media_type="text/event-stream")
 @app.post("/v2/llm-agent")
 async def llm_agent_v2(query: LLMAgentQueryModel, background_tasks: BackgroundTasks, api_key: str = Depends(verify_api_key)):
     return StreamingResponse(process_response(), media_type="text/event-stream")
+@app.post("/v3/llm-agent")
+async def llm_agent_v2(query: LLMAgentQueryModel, background_tasks: BackgroundTasks, api_key: str = Depends(verify_api_key)):
+    """
+    LLM agent endpoint that provides responses based on user queries, maintaining conversation history.
+    Accepts custom system messages and allows selection of different models.
+    Requires API Key authentication via X-API-Key header.
+    """
+    logger.info(f"Received LLM agent query: {query.prompt}")
+    # Generate a new conversation ID if not provided
+    if not query.conversation_id:
+        query.conversation_id = str(uuid4())
+    # Initialize or retrieve conversation history
+    if query.conversation_id not in conversations:
+        system_message = query.system_message or "You are a helpful assistant."
+        conversations[query.conversation_id] = [
+            {"role": "system", "content": system_message}
+        ]
+    elif query.system_message:
+        # Update system message if provided
+        conversations[query.conversation_id][0] = {"role": "system", "content": query.system_message}
+    # Add user's prompt to conversation history
+    conversations[query.conversation_id].append({"role": "user", "content": query.prompt})
+    last_activity[query.conversation_id] = time.time()
+    # Limit tokens in the conversation history
+    limited_conversation = limit_conversation_history(conversations[query.conversation_id])
+    def process_response():
+        full_response = ""
+        for content in chat_with_llama_stream(limited_conversation, model=query.model_id):
+            full_response += content
+            yield json.dumps({"type": "response","content": content}) + "\n"
+        # Add the assistant's response to the conversation history
+        conversations[query.conversation_id].append({"role": "assistant", "content": full_response})
+        background_tasks.add_task(update_db, query.user_id, query.conversation_id, query.prompt, full_response)
+        logger.info(f"Completed LLM agent response for query: {query.prompt}")
+    return EventSourceResponse(
+        process_response(),
+        media_type="text/event-stream"
+    )
 import edge_tts
 import io