Spaces:

ecotecds
/

Chatbot-RAG-v4

Running

App Files Files Community

NoeMartinezSanchez commited on Apr 9

Commit

94252ff

1 Parent(s): bdd77b2

Mejora del promt 6

Browse files

Files changed (3) hide show

api/main.py +3 -4
config/settings.py +1 -1
models/gemma_wrapper.py +44 -20

api/main.py CHANGED Viewed

@@ -140,12 +140,12 @@ async def chat(request: ChatRequest):
         logger.info(f"🔍 DEBUG - sources count: {len(sources) if sources else 0}")
         logger.info(f"📤 Respuesta generada: {'RAG' if is_rag else 'Intent'} - Confianza: {confidence:.2%}")
-        # Crear respuesta
         response = ChatResponse(
             response=response_text,
             sources=sources,
             is_rag_response=is_rag,
-            confidence=confidence
         )
         # Almacenar conversación
@@ -163,13 +163,12 @@ async def chat(request: ChatRequest):
             "sources": sources
         })
-        # Añadir headers con IDs
         headers = {
             "X-User-ID": user_id,
             "X-Conversation-ID": conversation_id,
             "X-Message-ID": message_id,
             "X-Response-Type": "rag" if is_rag else "intent",
-            "X-Confidence": str(confidence)
         }
         return JSONResponse(

         logger.info(f"🔍 DEBUG - sources count: {len(sources) if sources else 0}")
         logger.info(f"📤 Respuesta generada: {'RAG' if is_rag else 'Intent'} - Confianza: {confidence:.2%}")
+        # Crear respuesta - NO mostrar confianza al usuario
         response = ChatResponse(
             response=response_text,
             sources=sources,
             is_rag_response=is_rag,
+            confidence=None  # Ocultar confianza del usuario
         )
         # Almacenar conversación
             "sources": sources
         })
+        # Añadir headers con IDs (sin confianza)
         headers = {
             "X-User-ID": user_id,
             "X-Conversation-ID": conversation_id,
             "X-Message-ID": message_id,
             "X-Response-Type": "rag" if is_rag else "intent",
         }
         return JSONResponse(

config/settings.py CHANGED Viewed

@@ -25,7 +25,7 @@ class Settings(BaseSettings):
     INTENTS_ENABLED: bool = True  # Si quieres poder desactivar intents fácilmente
     # Búsqueda y recuperación
-    TOP_K_RESULTS: int = Field(default=3, ge=1, le=10)
     SIMILARITY_THRESHOLD: float = Field(default=0.75, ge=0.1, le=1.0)
     MAX_CONTEXT_LENGTH: int = 4000  # Tokens máximos para contexto

     INTENTS_ENABLED: bool = True  # Si quieres poder desactivar intents fácilmente
     # Búsqueda y recuperación
+    TOP_K_RESULTS: int = Field(default=5, ge=1, le=10)
     SIMILARITY_THRESHOLD: float = Field(default=0.75, ge=0.1, le=1.0)
     MAX_CONTEXT_LENGTH: int = 4000  # Tokens máximos para contexto

models/gemma_wrapper.py CHANGED Viewed

@@ -258,19 +258,22 @@ question: str,
         Returns:
             Generated response based on the context.
         """
-        prompt = self._build_simple_prompt(context, question)
         logger.info(f"RAG generation - Context length: {len(context)}, Question: {question[:50]}...")
-        return self.generate(
             prompt=prompt,
             max_new_tokens=512,
-            temperature=0.7,
             top_p=0.9,
-            repetition_penalty=1.0,
         )
-    def _build_simple_prompt(self, context: str, question: str) -> str:
-        """Build simple prompt - direct and minimal.
         Args:
             context: Retrieved context from RAG.
@@ -295,14 +298,21 @@ question: str,
             user_message = """¡De nada! Si tienes más dudas sobre Prepa en Línea, con gusto te ayudo."""
         else:
             user_message = f"""Eres un asistente de Prepa en Línea SEP. Responde preguntas de estudiantes usando la información del contexto proporcionado.
 Contexto:
 {context}
 Pregunta: {question}
-Responde de forma clara y útil en español."""
         prompt = f"""<start_of_turn>user
 {user_message}<end_of_turn>
@@ -311,14 +321,14 @@ Responde de forma clara y útil en español."""
         return prompt
-    def _clean_response(self, response: str) -> str:
-        """Clean and post-process generated response.
         Args:
             response: Raw response from the model.
         Returns:
-            Cleaned response.
         """
         import re
@@ -338,21 +348,35 @@ Responde de forma clara y útil en español."""
         response = ' '.join(clean_lines)
         response = re.sub(r'#\w+', '', response)
         response = re.sub(r'\*+', '', response)
         response = re.sub(r'[{}\[\]()]', '', response)
         response = re.sub(r'\s+', ' ', response).strip()
-        if response.startswith('Pre ') or response.startswith('El '):
-            pass
-        elif response.startswith('Res ') or response.startswith('Te '):
-            pass
-        elif len(response) > 0 and not response[0].isalpha():
-            words = response.split()
-            if words:
-                response = ' '.join(words)
         return response

         Returns:
             Generated response based on the context.
         """
+        prompt = self._build_improved_prompt(context, question)
         logger.info(f"RAG generation - Context length: {len(context)}, Question: {question[:50]}...")
+        raw_response = self.generate(
             prompt=prompt,
             max_new_tokens=512,
+            temperature=0.6,
             top_p=0.9,
+            repetition_penalty=1.15,
         )
+        response = self._clean_and_fix_response(raw_response)
+        return response
+    def _build_improved_prompt(self, context: str, question: str) -> str:
+        """Build improved prompt with better handling of common topics.
         Args:
             context: Retrieved context from RAG.
             user_message = """¡De nada! Si tienes más dudas sobre Prepa en Línea, con gusto te ayudo."""
         else:
+            if "propedéutico" in question_lower or "curso propedéutico" in question_lower:
+                context_hint = "El curso propedéutico es obligatorio para tous los estudiantes de Prepa en Línea. Tiene una duración aproximada de 3 semanas y debes completarlo antes de comenzar el primer semestre formal."
+            else:
+                context_hint = ""
             user_message = f"""Eres un asistente de Prepa en Línea SEP. Responde preguntas de estudiantes usando la información del contexto proporcionado.
+{context_hint}
 Contexto:
 {context}
 Pregunta: {question}
+Responde de forma clara y útil en español. Si no tienes información suficiente, dilo honestamente."""
         prompt = f"""<start_of_turn>user
 {user_message}<end_of_turn>
         return prompt
+    def _clean_and_fix_response(self, response: str) -> str:
+        """Clean and fix generated response - handles truncations and formatting.
         Args:
             response: Raw response from the model.
         Returns:
+            Cleaned and fixed response.
         """
         import re
         response = ' '.join(clean_lines)
         response = re.sub(r'#\w+', '', response)
         response = re.sub(r'\*+', '', response)
         response = re.sub(r'[{}\[\]()]', '', response)
         response = re.sub(r'\s+', ' ', response).strip()
+        if len(response) >= 2:
+            first_word = response.split()[0] if response.split() else ""
+            if len(first_word) <= 2 and first_word.islower():
+                response = response[len(first_word):].strip()
+        response = response.lower()
+        sentences = re.split(r'([.!?]+)', response)
+        if sentences:
+            fixed = []
+            for i, part in enumerate(sentences):
+                if i % 2 == 0:
+                    if part:
+                        part = part.strip()
+                        if part:
+                            part = part[0].upper() + part[1:] if len(part) > 1 else part.upper()
+                            fixed.append(part)
+                else:
+                    fixed.append(part)
+            response = ''.join(fixed)
+        response = response.strip()
+        if not response or len(response) < 5:
+            response = "Lo siento, no pude generar una respuesta adecuada. ¿Podrías reformular tu pregunta?"
         return response