Spaces:

ecotecds
/

Chatbot-RAG-v4

Running

App Files Files Community

NoeMartinezSanchez commited on Apr 9

Commit

5c4e69b

1 Parent(s): fbe249f

Correccion mas afondo

Browse files

Files changed (3) hide show

api/main.py +26 -4
models/gemma_wrapper.py +13 -6
rag/retriever.py +16 -5

api/main.py CHANGED Viewed

@@ -129,10 +129,32 @@ async def chat(request: ChatRequest):
         user_id = request.user_id or str(uuid.uuid4())
         conversation_id = request.conversation_id or str(uuid.uuid4())
-        # Procesar consulta
-        response_text, is_rag, confidence, sources = rag_system.process_query(
-            request.message
-        )
         # DEBUG: Verificar qué se recibe
         logger.info(f"🔍 DEBUG - response_text tipo: {type(response_text)}, largo: {len(response_text) if response_text else 0}")

         user_id = request.user_id or str(uuid.uuid4())
         conversation_id = request.conversation_id or str(uuid.uuid4())
+        # Detectar saludos y responder directamente sin RAG
+        msg_lower = request.message.lower().strip()
+        saludos = ["hola", "buenos días", "buenas tardes", "buenas", "holi", "hello", "hey", "qué tal", "cómo estás", "buen día"]
+        despedidas = ["adiós", "chao", "bye", "hasta luego", "me voy", "nos vemos", "me retiro"]
+        gracias = ["gracias", "thank", "agradezco", "muchas gracias", "te agradezco"]
+        if any(s in msg_lower for s in saludos):
+            response_text = "¡Hola! Bienvenido a Prepa en Línea SEP. Estoy aquí para ayudarte con tus dudas sobre el programa. ¿Qué necesitas saber?"
+            is_rag = False
+            confidence = 1.0
+            sources = []
+        elif any(s in msg_lower for s in despedidas):
+            response_text = "¡Hasta luego! Éxito en tus estudios. Cuando tengas dudas sobre Prepa en Línea, vuelve a escribirme."
+            is_rag = False
+            confidence = 1.0
+            sources = []
+        elif any(s in msg_lower for s in gracias):
+            response_text = "¡De nada! Si tienes más dudas sobre Prepa en Línea, con gusto te ayudo. ¡Éxito en tus estudios!"
+            is_rag = False
+            confidence = 1.0
+            sources = []
+        else:
+            # Procesar consulta normal con RAG
+            response_text, is_rag, confidence, sources = rag_system.process_query(
+                request.message
+            )
         # DEBUG: Verificar qué se recibe
         logger.info(f"🔍 DEBUG - response_text tipo: {type(response_text)}, largo: {len(response_text) if response_text else 0}")

models/gemma_wrapper.py CHANGED Viewed

@@ -263,10 +263,10 @@ question: str,
         logger.info(f"RAG generation - Context length: {len(context)}, Question: {question[:50]}...")
         raw_response = self.generate(
             prompt=prompt,
-            max_new_tokens=512,
-            temperature=0.6,
-            top_p=0.9,
-            repetition_penalty=1.15,
         )
         response = self._clean_and_fix_response(raw_response)
@@ -353,11 +353,20 @@ Responde de forma clara y útil en español. Si no tienes información suficient
         response = re.sub(r'\s+', ' ', response).strip()
         if len(response) >= 2:
             first_word = response.split()[0] if response.split() else ""
             if len(first_word) <= 2 and first_word.islower():
                 response = response[len(first_word):].strip()
         response = response.lower()
         sentences = re.split(r'([.!?]+)', response)
@@ -375,8 +384,6 @@ Responde de forma clara y útil en español. Si no tienes información suficient
             response = ''.join(fixed)
         response = response.strip()
-        if not response or len(response) < 5:
-            response = "Lo siento, no pude generar una respuesta adecuada. ¿Podrías reformular tu pregunta?"
         return response

         logger.info(f"RAG generation - Context length: {len(context)}, Question: {question[:50]}...")
         raw_response = self.generate(
             prompt=prompt,
+            max_new_tokens=256,
+            temperature=0.5,
+            top_p=0.85,
+            repetition_penalty=1.1,
         )
         response = self._clean_and_fix_response(raw_response)
         response = re.sub(r'\s+', ' ', response).strip()
+        # Fix truncated responses - remove short truncated first words
         if len(response) >= 2:
             first_word = response.split()[0] if response.split() else ""
             if len(first_word) <= 2 and first_word.islower():
                 response = response[len(first_word):].strip()
+        # Fix non-alphabetic characters at start
+        while response and not response[0].isalpha():
+            response = response[1:].strip()
+        # Ensure minimum length
+        if not response or len(response) < 20:
+            response = "No encontré información específica sobre ese tema en los materiales disponibles. Te recomiendo consultar la guía del aspirante de Prepa en Línea SEP."
         response = response.lower()
         sentences = re.split(r'([.!?]+)', response)
             response = ''.join(fixed)
         response = response.strip()
         return response

rag/retriever.py CHANGED Viewed

@@ -318,13 +318,14 @@ class VectorStoreFAISS:
             'distances': [distances],
             'metadatas': [results]
         }
-    def search_documents(self, query_embedding: np.ndarray, top_k: int = 3) -> Dict:
         """
         Buscar documentos similares al embedding de consulta.
         Args:
             query_embedding: Embedding de la consulta
             top_k: Número de resultados a retornar
         Returns:
             Diccionario con formato compatible con ChromaDB
@@ -345,16 +346,26 @@ class VectorStoreFAISS:
             min(top_k, self.index.ntotal)
         )
-        # Formatear resultados
         documents_result = []
         metadatas_result = []
         distances_result = []
         for i, idx in enumerate(indices[0]):
             if idx < len(self.documents):
-                documents_result.append(self.documents[idx])
-                metadatas_result.append(self.metadata[idx])
-                distances_result.append(float(distances[0][i]))
         return {
             'documents': [documents_result],

             'distances': [distances],
             'metadatas': [results]
         }
+    def search_documents(self, query_embedding: np.ndarray, top_k: int = 5, min_similarity: float = 0.6) -> Dict:
         """
         Buscar documentos similares al embedding de consulta.
         Args:
             query_embedding: Embedding de la consulta
             top_k: Número de resultados a retornar
+            min_similarity: Umbral mínimo de similitud (0-1)
         Returns:
             Diccionario con formato compatible con ChromaDB
             min(top_k, self.index.ntotal)
         )
+        # Formatear resultados con filtrado por similitud
         documents_result = []
         metadatas_result = []
         distances_result = []
         for i, idx in enumerate(indices[0]):
             if idx < len(self.documents):
+                similarity = float(distances[0][i])
+                if similarity >= min_similarity:
+                    documents_result.append(self.documents[idx])
+                    metadatas_result.append(self.metadata[idx])
+                    distances_result.append(similarity)
+        # Si no hay resultados con suficiente similitud,返回 vacío
+        if not documents_result:
+            return {
+                'documents': [[]],
+                'distances': [[]],
+                'metadatas': [[]]
+            }
         return {
             'documents': [documents_result],