Spaces:

Madras1
/

OpenAda

Sleeping

App Files Files Community

Madras1 commited on Jan 2

Commit

0f0b357

verified ·

1 Parent(s): 75421ec

Upload 5 files

Browse files

Files changed (4) hide show

Dockerfile +8 -3
app.py +349 -266
memory.py +128 -0
requirements.txt +2 -0

Dockerfile CHANGED Viewed

@@ -3,25 +3,30 @@ FROM python:3.11-slim
 # Set working directory
 WORKDIR /app
-# Install system dependencies for edge-tts
 RUN apt-get update && apt-get install -y \
     --no-install-recommends \
     && rm -rf /var/lib/apt/lists/*
 # Copy requirements first for better caching
 COPY requirements.txt .
-# Install Python dependencies
 RUN pip install --no-cache-dir -r requirements.txt
 # Copy application code
 COPY app.py .
 # Expose port (HuggingFace uses 7860)
 EXPOSE 7860
 # Health check
-HEALTHCHECK --interval=30s --timeout=10s --start-period=5s --retries=3 \
     CMD python -c "import httpx; httpx.get('http://localhost:7860/health')" || exit 1
 # Run the application

 # Set working directory
 WORKDIR /app
+# Install system dependencies
 RUN apt-get update && apt-get install -y \
     --no-install-recommends \
+    build-essential \
     && rm -rf /var/lib/apt/lists/*
 # Copy requirements first for better caching
 COPY requirements.txt .
+# Install Python dependencies (pode demorar devido ao sentence-transformers)
 RUN pip install --no-cache-dir -r requirements.txt
+# Pre-download the embedding model during build
+RUN python -c "from sentence_transformers import SentenceTransformer; SentenceTransformer('all-MiniLM-L6-v2')"
 # Copy application code
 COPY app.py .
+COPY memory.py .
 # Expose port (HuggingFace uses 7860)
 EXPOSE 7860
 # Health check
+HEALTHCHECK --interval=30s --timeout=10s --start-period=60s --retries=3 \
     CMD python -c "import httpx; httpx.get('http://localhost:7860/health')" || exit 1
 # Run the application

app.py CHANGED Viewed

@@ -1,266 +1,349 @@
-"""
-3D Avatar Chat Backend (v2 - Fixed)
-FastAPI + OpenRouter + Edge TTS
-Deploy: HuggingFace Spaces
-"""
-import os
-import base64
-import re
-from io import BytesIO
-from fastapi import FastAPI, HTTPException
-from fastapi.middleware.cors import CORSMiddleware
-from pydantic import BaseModel
-import edge_tts
-import httpx
-# ============================================================================
-# Configuration
-# ============================================================================
-OPENROUTER_API_KEY = os.getenv("OPENROUTER_API_KEY", "")
-OPENROUTER_MODEL = os.getenv("OPENROUTER_MODEL", "nousresearch/hermes-3-llama-3.1-405b:free")
-TTS_VOICE = "pt-BR-FranciscaNeural"
-TTS_RATE = "+0%"
-# System prompt for the chatbot
-SYSTEM_PROMPT = """Você é Ada, uma assistente virtual amigável e prestativa.
-Responda de forma natural, concisa e conversacional em português brasileiro.
-Mantenha respostas curtas (máximo 2-3 frases) para manter a conversa fluida.
-Seja simpática e use tom casual."""
-# ============================================================================
-# Phoneme to Viseme Mapping
-# ============================================================================
-VISEME_MAP = {
-    'a': 'A', 'á': 'A', 'à': 'A', 'ã': 'A', 'â': 'A',
-    'e': 'E', 'é': 'E', 'ê': 'E',
-    'i': 'I', 'í': 'I',
-    'o': 'O', 'ó': 'O', 'ô': 'O', 'õ': 'O',
-    'u': 'U', 'ú': 'U',
-    'm': 'M', 'b': 'M', 'p': 'M',
-    'f': 'F', 'v': 'F',
-    'l': 'L', 'n': 'L', 't': 'L', 'd': 'L',
-    's': 'S', 'z': 'S', 'c': 'S', 'ç': 'S',
-    'r': 'R', 'x': 'S', 'j': 'S', 'g': 'L', 'q': 'L', 'k': 'L',
-    'h': 'X', ' ': 'X',
-}
-CHAR_DURATION = 0.065
-def text_to_visemes(text: str) -> list[dict]:
-    """Convert text to a timeline of visemes."""
-    visemes = []
-    current_time = 0.0
-    text_lower = text.lower()
-    i = 0
-    while i < len(text_lower):
-        char = text_lower[i]
-        if char in '.,!?;:':
-            visemes.append({
-                'time': current_time,
-                'viseme': 'X',
-                'duration': 0.15
-            })
-            current_time += 0.15
-            i += 1
-            continue
-        viseme = VISEME_MAP.get(char, 'X')
-        if visemes and visemes[-1]['viseme'] == viseme:
-            visemes[-1]['duration'] += CHAR_DURATION
-        else:
-            visemes.append({
-                'time': current_time,
-                'viseme': viseme,
-                'duration': CHAR_DURATION
-            })
-        current_time += CHAR_DURATION
-        i += 1
-    visemes.append({
-        'time': current_time,
-        'viseme': 'X',
-        'duration': 0.2
-    })
-    return visemes
-# ============================================================================
-# FastAPI App
-# ============================================================================
-app = FastAPI(title="3D Avatar Chat API")
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],
-    allow_credentials=True,
-    allow_methods=["*"],
-    allow_headers=["*"],
-)
-class ChatRequest(BaseModel):
-    message: str
-    history: list[dict] = []
-class ChatResponse(BaseModel):
-    text: str
-    audio_base64: str
-    visemes: list[dict]
-    duration: float
-@app.get("/")
-async def root():
-    return {"status": "ok", "message": "3D Avatar Chat API v2"}
-@app.get("/health")
-async def health():
-    has_key = bool(OPENROUTER_API_KEY)
-    return {"status": "healthy", "has_api_key": has_key, "model": OPENROUTER_MODEL}
-@app.post("/chat", response_model=ChatResponse)
-async def chat(request: ChatRequest):
-    """Process chat message and return response with audio."""
-    # Validar API key
-    if not OPENROUTER_API_KEY:
-        raise HTTPException(
-            status_code=500,
-            detail="OPENROUTER_API_KEY não configurada. Configure nas secrets do Space."
-        )
-    # Validar mensagem
-    if not request.message or not request.message.strip():
-        raise HTTPException(status_code=400, detail="Mensagem vazia")
-    # Build messages
-    messages = [{"role": "system", "content": SYSTEM_PROMPT}]
-    for msg in request.history[-10:]:
-        role = msg.get("role", "user")
-        content = msg.get("content", "")
-        if role in ["user", "assistant"] and content:
-            messages.append({"role": role, "content": content})
-    messages.append({"role": "user", "content": request.message})
-    # Call OpenRouter
-    bot_text = ""
-    try:
-        async with httpx.AsyncClient(timeout=30.0) as client:
-            response = await client.post(
-                "https://openrouter.ai/api/v1/chat/completions",
-                headers={
-                    "Authorization": f"Bearer {OPENROUTER_API_KEY}",
-                    "Content-Type": "application/json",
-                    "HTTP-Referer": "https://huggingface.co/spaces",
-                    "X-Title": "OpenAda Avatar Chat"
-                },
-                json={
-                    "model": OPENROUTER_MODEL,
-                    "messages": messages,
-                    "max_tokens": 200,
-                    "temperature": 0.7,
-                }
-            )
-            # Log para debug
-            print(f"OpenRouter status: {response.status_code}")
-            if response.status_code != 200:
-                error_text = response.text
-                print(f"OpenRouter error: {error_text}")
-                raise HTTPException(
-                    status_code=500,
-                    detail=f"OpenRouter retornou {response.status_code}: {error_text[:200]}"
-                )
-            data = response.json()
-            print(f"OpenRouter response: {data}")
-            # Extrair texto da resposta
-            if "choices" in data and len(data["choices"]) > 0:
-                choice = data["choices"][0]
-                if "message" in choice and "content" in choice["message"]:
-                    bot_text = choice["message"]["content"]
-                elif "text" in choice:
-                    bot_text = choice["text"]
-            # Fallback se não encontrou texto
-            if not bot_text:
-                print(f"Não encontrou texto na resposta: {data}")
-                bot_text = "Desculpe, não consegui processar sua mensagem."
-    except httpx.TimeoutException:
-        raise HTTPException(status_code=504, detail="Timeout ao conectar com OpenRouter")
-    except httpx.HTTPError as e:
-        print(f"HTTP Error: {e}")
-        raise HTTPException(status_code=500, detail=f"Erro de conexão: {str(e)}")
-    except Exception as e:
-        print(f"Unexpected error: {e}")
-        raise HTTPException(status_code=500, detail=f"Erro inesperado: {str(e)}")
-    # Limpar texto
-    bot_text = bot_text.strip()
-    if not bot_text:
-        bot_text = "Hmm, não entendi. Pode reformular?"
-    # Limpar para TTS
-    clean_text = re.sub(r'[*_`~#]', '', bot_text)
-    clean_text = re.sub(r'\[.*?\]\(.*?\)', '', clean_text)
-    clean_text = re.sub(r'<[^>]+>', '', clean_text)
-    clean_text = clean_text.strip()
-    if not clean_text:
-        clean_text = bot_text
-    # Generate audio
-    audio_base64 = ""
-    try:
-        communicate = edge_tts.Communicate(clean_text, TTS_VOICE, rate=TTS_RATE)
-        audio_buffer = BytesIO()
-        async for chunk in communicate.stream():
-            if chunk["type"] == "audio":
-                audio_buffer.write(chunk["data"])
-        audio_buffer.seek(0)
-        audio_data = audio_buffer.read()
-        if len(audio_data) > 0:
-            audio_base64 = base64.b64encode(audio_data).decode('utf-8')
-        else:
-            print("TTS retornou áudio vazio")
-    except Exception as e:
-        print(f"TTS error: {e}")
-        # Continua sem áudio
-    # Generate visemes
-    visemes = text_to_visemes(clean_text)
-    duration = sum(v['duration'] for v in visemes)
-    return ChatResponse(
-        text=bot_text,
-        audio_base64=audio_base64,
-        visemes=visemes,
-        duration=duration
-    )
-if __name__ == "__main__":
-    import uvicorn
-    uvicorn.run(app, host="0.0.0.0", port=7860)

+"""
+3D Avatar Chat Backend (v3 - With Vector Memory)
+FastAPI + OpenRouter + Edge TTS + ChromaDB
+Deploy: HuggingFace Spaces
+"""
+import os
+import base64
+import re
+from io import BytesIO
+from fastapi import FastAPI, HTTPException
+from fastapi.middleware.cors import CORSMiddleware
+from pydantic import BaseModel
+import edge_tts
+import httpx
+# Importar módulo de memória (lazy load para não atrasar startup)
+memory_module = None
+def get_memory():
+    """Lazy load memory module."""
+    global memory_module
+    if memory_module is None:
+        try:
+            from memory import get_memory as _get_memory
+            memory_module = _get_memory()
+        except Exception as e:
+            print(f"Erro ao carregar memória: {e}")
+            return None
+    return memory_module
+# ============================================================================
+# Configuration
+# ============================================================================
+OPENROUTER_API_KEY = os.getenv("OPENROUTER_API_KEY", "")
+OPENROUTER_MODEL = os.getenv("OPENROUTER_MODEL", "google/gemini-2.0-flash-001")
+TTS_VOICE = "pt-BR-FranciscaNeural"
+TTS_RATE = "+0%"
+# System prompt for the chatbot
+SYSTEM_PROMPT = """Você é Ada, uma assistente virtual amigável e prestativa.
+Responda de forma natural, concisa e conversacional em português brasileiro.
+Mantenha respostas curtas (máximo 2-3 frases) para manter a conversa fluida.
+Seja simpática e use tom casual.
+Se houver contexto de conversas anteriores fornecido, use-o para dar respostas mais personalizadas e lembrar de informações que o usuário compartilhou."""
+# ============================================================================
+# Phoneme to Viseme Mapping
+# ============================================================================
+VISEME_MAP = {
+    'a': 'A', 'á': 'A', 'à': 'A', 'ã': 'A', 'â': 'A',
+    'e': 'E', 'é': 'E', 'ê': 'E',
+    'i': 'I', 'í': 'I',
+    'o': 'O', 'ó': 'O', 'ô': 'O', 'õ': 'O',
+    'u': 'U', 'ú': 'U',
+    'm': 'M', 'b': 'M', 'p': 'M',
+    'f': 'F', 'v': 'F',
+    'l': 'L', 'n': 'L', 't': 'L', 'd': 'L',
+    's': 'S', 'z': 'S', 'c': 'S', 'ç': 'S',
+    'r': 'R', 'x': 'S', 'j': 'S', 'g': 'L', 'q': 'L', 'k': 'L',
+    'h': 'X', ' ': 'X',
+}
+CHAR_DURATION = 0.065
+def text_to_visemes(text: str) -> list[dict]:
+    """Convert text to a timeline of visemes."""
+    visemes = []
+    current_time = 0.0
+    text_lower = text.lower()
+    i = 0
+    while i < len(text_lower):
+        char = text_lower[i]
+        if char in '.,!?;:':
+            visemes.append({
+                'time': current_time,
+                'viseme': 'X',
+                'duration': 0.15
+            })
+            current_time += 0.15
+            i += 1
+            continue
+        viseme = VISEME_MAP.get(char, 'X')
+        if visemes and visemes[-1]['viseme'] == viseme:
+            visemes[-1]['duration'] += CHAR_DURATION
+        else:
+            visemes.append({
+                'time': current_time,
+                'viseme': viseme,
+                'duration': CHAR_DURATION
+            })
+        current_time += CHAR_DURATION
+        i += 1
+    visemes.append({
+        'time': current_time,
+        'viseme': 'X',
+        'duration': 0.2
+    })
+    return visemes
+# ============================================================================
+# FastAPI App
+# ============================================================================
+app = FastAPI(title="3D Avatar Chat API")
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+class ChatRequest(BaseModel):
+    message: str
+    history: list[dict] = []
+class ChatResponse(BaseModel):
+    text: str
+    audio_base64: str
+    visemes: list[dict]
+    duration: float
+    memory_context: list[str] = []  # Contexto recuperado
+@app.get("/")
+async def root():
+    return {"status": "ok", "message": "3D Avatar Chat API v3 (with memory)"}
+@app.get("/health")
+async def health():
+    has_key = bool(OPENROUTER_API_KEY)
+    memory = get_memory()
+    memory_stats = memory.get_stats() if memory else {"error": "not loaded"}
+    return {
+        "status": "healthy",
+        "has_api_key": has_key,
+        "model": OPENROUTER_MODEL,
+        "memory": memory_stats
+    }
+@app.get("/memory/stats")
+async def memory_stats():
+    """Get memory statistics."""
+    memory = get_memory()
+    if not memory:
+        return {"error": "Memory not initialized"}
+    return memory.get_stats()
+@app.delete("/memory/clear")
+async def clear_memory():
+    """Clear all memories."""
+    memory = get_memory()
+    if not memory:
+        return {"error": "Memory not initialized"}
+    memory.clear_memories()
+    return {"status": "cleared"}
+@app.post("/chat", response_model=ChatResponse)
+async def chat(request: ChatRequest):
+    """Process chat message and return response with audio."""
+    # Validar API key
+    if not OPENROUTER_API_KEY:
+        raise HTTPException(
+            status_code=500,
+            detail="OPENROUTER_API_KEY não configurada. Configure nas secrets do Space."
+        )
+    # Validar mensagem
+    if not request.message or not request.message.strip():
+        raise HTTPException(status_code=400, detail="Mensagem vazia")
+    # =========================================================================
+    # Buscar contexto na memória vetorial
+    # =========================================================================
+    memory_context = []
+    memory = get_memory()
+    if memory:
+        try:
+            relevant_memories = memory.search_memories(request.message, k=3)
+            for mem in relevant_memories:
+                if mem['score'] > 0.3:  # Só usar se relevância > 30%
+                    memory_context.append(
+                        f"[Conversa anterior] {mem['user_message']} → {mem['bot_response']}"
+                    )
+            print(f"Memórias relevantes encontradas: {len(memory_context)}")
+        except Exception as e:
+            print(f"Erro ao buscar memória: {e}")
+    # =========================================================================
+    # Build messages
+    # =========================================================================
+    messages = [{"role": "system", "content": SYSTEM_PROMPT}]
+    # Adicionar contexto de memória se houver
+    if memory_context:
+        context_text = "\n\n**Contexto de conversas anteriores:**\n" + "\n".join(memory_context)
+        messages.append({
+            "role": "system",
+            "content": f"Informações relevantes de conversas anteriores:\n{context_text}"
+        })
+    # Histórico recente
+    for msg in request.history[-10:]:
+        role = msg.get("role", "user")
+        content = msg.get("content", "")
+        if role in ["user", "assistant"] and content:
+            messages.append({"role": role, "content": content})
+    messages.append({"role": "user", "content": request.message})
+    # =========================================================================
+    # Call OpenRouter
+    # =========================================================================
+    bot_text = ""
+    try:
+        async with httpx.AsyncClient(timeout=30.0) as client:
+            response = await client.post(
+                "https://openrouter.ai/api/v1/chat/completions",
+                headers={
+                    "Authorization": f"Bearer {OPENROUTER_API_KEY}",
+                    "Content-Type": "application/json",
+                    "HTTP-Referer": "https://huggingface.co/spaces",
+                    "X-Title": "OpenAda Avatar Chat"
+                },
+                json={
+                    "model": OPENROUTER_MODEL,
+                    "messages": messages,
+                    "max_tokens": 200,
+                    "temperature": 0.7,
+                }
+            )
+            print(f"OpenRouter status: {response.status_code}")
+            if response.status_code != 200:
+                error_text = response.text
+                print(f"OpenRouter error: {error_text}")
+                raise HTTPException(
+                    status_code=500,
+                    detail=f"OpenRouter retornou {response.status_code}: {error_text[:200]}"
+                )
+            data = response.json()
+            print(f"OpenRouter response received")
+            # Extrair texto da resposta
+            if "choices" in data and len(data["choices"]) > 0:
+                choice = data["choices"][0]
+                if "message" in choice and "content" in choice["message"]:
+                    bot_text = choice["message"]["content"]
+                elif "text" in choice:
+                    bot_text = choice["text"]
+            if not bot_text:
+                print(f"Não encontrou texto na resposta: {data}")
+                bot_text = "Desculpe, não consegui processar sua mensagem."
+    except httpx.TimeoutException:
+        raise HTTPException(status_code=504, detail="Timeout ao conectar com OpenRouter")
+    except httpx.HTTPError as e:
+        print(f"HTTP Error: {e}")
+        raise HTTPException(status_code=500, detail=f"Erro de conexão: {str(e)}")
+    except Exception as e:
+        print(f"Unexpected error: {e}")
+        raise HTTPException(status_code=500, detail=f"Erro inesperado: {str(e)}")
+    # Limpar texto
+    bot_text = bot_text.strip()
+    if not bot_text:
+        bot_text = "Hmm, não entendi. Pode reformular?"
+    # =========================================================================
+    # Salvar na memória
+    # =========================================================================
+    if memory:
+        try:
+            memory.add_memory(request.message, bot_text)
+        except Exception as e:
+            print(f"Erro ao salvar memória: {e}")
+    # =========================================================================
+    # Generate TTS
+    # =========================================================================
+    clean_text = re.sub(r'[*_`~#]', '', bot_text)
+    clean_text = re.sub(r'\[.*?\]\(.*?\)', '', clean_text)
+    clean_text = re.sub(r'<[^>]+>', '', clean_text)
+    clean_text = clean_text.strip()
+    if not clean_text:
+        clean_text = bot_text
+    audio_base64 = ""
+    try:
+        communicate = edge_tts.Communicate(clean_text, TTS_VOICE, rate=TTS_RATE)
+        audio_buffer = BytesIO()
+        async for chunk in communicate.stream():
+            if chunk["type"] == "audio":
+                audio_buffer.write(chunk["data"])
+        audio_buffer.seek(0)
+        audio_data = audio_buffer.read()
+        if len(audio_data) > 0:
+            audio_base64 = base64.b64encode(audio_data).decode('utf-8')
+        else:
+            print("TTS retornou áudio vazio")
+    except Exception as e:
+        print(f"TTS error: {e}")
+    # Generate visemes
+    visemes = text_to_visemes(clean_text)
+    duration = sum(v['duration'] for v in visemes)
+    return ChatResponse(
+        text=bot_text,
+        audio_base64=audio_base64,
+        visemes=visemes,
+        duration=duration,
+        memory_context=memory_context
+    )
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=7860)

memory.py ADDED Viewed

	@@ -0,0 +1,128 @@

+"""
+Vector Memory Module
+Memória de longo prazo usando ChromaDB + Sentence Transformers
+"""
+import chromadb
+from sentence_transformers import SentenceTransformer
+from datetime import datetime
+import hashlib
+# Usar modelo leve para embeddings
+EMBEDDING_MODEL = "all-MiniLM-L6-v2"  # ~80MB, rápido
+# Singleton para evitar recarregar
+_memory_instance = None
+def get_memory():
+    """Get or create memory instance."""
+    global _memory_instance
+    if _memory_instance is None:
+        _memory_instance = VectorMemory()
+    return _memory_instance
+class VectorMemory:
+    def __init__(self):
+        print("Inicializando memória vetorial...")
+        # Modelo de embeddings
+        self.model = SentenceTransformer(EMBEDDING_MODEL)
+        print(f"Modelo carregado: {EMBEDDING_MODEL}")
+        # ChromaDB em memória (persiste enquanto o servidor estiver rodando)
+        self.client = chromadb.Client()
+        self.collection = self.client.get_or_create_collection(
+            name="chat_memory",
+            metadata={"hnsw:space": "cosine"}
+        )
+        print(f"Memória pronta. {self.collection.count()} memórias existentes.")
+    def _generate_id(self, text: str) -> str:
+        """Generate unique ID for a memory."""
+        timestamp = datetime.now().isoformat()
+        content = f"{timestamp}:{text}"
+        return hashlib.md5(content.encode()).hexdigest()
+    def add_memory(self, user_message: str, bot_response: str):
+        """
+        Add a conversation exchange to memory.
+        Stores the combined context for better retrieval.
+        """
+        # Combinar mensagem e resposta para contexto completo
+        combined = f"Usuário: {user_message}\nAssistente: {bot_response}"
+        # Gerar embedding
+        embedding = self.model.encode(combined).tolist()
+        # Gerar ID único
+        doc_id = self._generate_id(combined)
+        # Metadados
+        metadata = {
+            "user_message": user_message[:500],  # Truncar se muito longo
+            "bot_response": bot_response[:500],
+            "timestamp": datetime.now().isoformat()
+        }
+        # Adicionar ao banco
+        self.collection.add(
+            ids=[doc_id],
+            embeddings=[embedding],
+            documents=[combined],
+            metadatas=[metadata]
+        )
+        print(f"Memória adicionada. Total: {self.collection.count()}")
+    def search_memories(self, query: str, k: int = 3) -> list[dict]:
+        """
+        Search for relevant memories based on the query.
+        Returns list of {text, user_message, bot_response, score}
+        """
+        if self.collection.count() == 0:
+            return []
+        # Gerar embedding da query
+        query_embedding = self.model.encode(query).tolist()
+        # Buscar similares
+        results = self.collection.query(
+            query_embeddings=[query_embedding],
+            n_results=min(k, self.collection.count())
+        )
+        memories = []
+        if results and results['documents'] and results['documents'][0]:
+            for i, doc in enumerate(results['documents'][0]):
+                metadata = results['metadatas'][0][i] if results['metadatas'] else {}
+                distance = results['distances'][0][i] if results['distances'] else 0
+                memories.append({
+                    "text": doc,
+                    "user_message": metadata.get("user_message", ""),
+                    "bot_response": metadata.get("bot_response", ""),
+                    "score": 1 - distance,  # Converter distância em similaridade
+                    "timestamp": metadata.get("timestamp", "")
+                })
+        return memories
+    def clear_memories(self):
+        """Clear all memories."""
+        # Recriar collection
+        self.client.delete_collection("chat_memory")
+        self.collection = self.client.get_or_create_collection(
+            name="chat_memory",
+            metadata={"hnsw:space": "cosine"}
+        )
+        print("Memórias limpas.")
+    def get_stats(self) -> dict:
+        """Get memory statistics."""
+        return {
+            "total_memories": self.collection.count(),
+            "model": EMBEDDING_MODEL
+        }

requirements.txt CHANGED Viewed

@@ -3,3 +3,5 @@ uvicorn[standard]==0.34.0
 edge-tts==6.1.12
 httpx==0.28.1
 python-multipart==0.0.20

 edge-tts==6.1.12
 httpx==0.28.1
 python-multipart==0.0.20
+chromadb==0.4.22
+sentence-transformers==2.2.2