Spaces:

cesar
/

DemoProfeIA

Sleeping

App Files Files Community

cesar commited on Jan 26, 2025

Commit

b527142

verified ·

1 Parent(s): 85b6c95

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -32

app.py CHANGED Viewed

@@ -41,33 +41,36 @@ def extraer_texto(pdf_path: str) -> str:
             texto_total += page.extract_text() or ""
     return texto_total
-def parsear_con_llm(texto_pdf: str, model: GenerativeModel) -> dict:
     """
-    Usa el LLM para extraer preguntas y respuestas:
-    - Considera que 'Explicá' o 'Explica' o 'Explique' es una pregunta,
-      aunque no diga 'Pregunta:'.
-    - Reconoce 'RESPUESTA', 'RESPUESTAS', con o sin dos puntos,
-      como inicio de la respuesta.
     """
     prompt = f"""
-Eres un parser de texto.
-Te entrego el contenido de un PDF con una pregunta o varias,
-y su(s) respuesta(s). Usa estas reglas para interpretarlo:
-1. Si ves 'Explicá', 'Explica', 'Explique', 'Teniendo en cuenta que...'
-   o algo similar, asúmelo como una pregunta.
-   Si no hay 'Pregunta:' literal, aun así consideralo pregunta.
-2. Las respuestas podrían estar marcadas como 'RESPUESTAS', 'RESPUESTA', 'RESPUESTAS:', etc.
-3. Devuelve un JSON con la estructura:
 {{
-  "Pregunta 1": "Texto de la respuesta"
 }}
-   Si hay más de una pregunta, enumerarlas como 'Pregunta 2', etc.
-4. Si no hay nada reconocible, devuelve {{}}.
 Texto PDF:
 {texto_pdf}
-Devuelve solo el JSON, sin explicaciones ni texto extra.
 """
     part_text = Part.from_text(prompt)
@@ -87,13 +90,12 @@ Devuelve solo el JSON, sin explicaciones ni texto extra.
         return {}
 def comparar_preguntas_respuestas(dict_docente: dict, dict_alumno: dict) -> str:
     retroalimentacion = []
     for pregunta, resp_correcta in dict_docente.items():
         resp_alumno = dict_alumno.get(pregunta, None)
         if resp_alumno is None:
-            retroalimentacion.append(
-                f"**{pregunta}**\nNo fue asignada al alumno.\n"
-            )
         else:
             retroalimentacion.append(
                 f"**{pregunta}**\n"
@@ -107,26 +109,27 @@ def revisar_examen(json_cred, pdf_docente, pdf_alumno):
         configurar_credenciales(json_cred.name)
         vertexai.init(project="deploygpt", location="us-central1")
         texto_docente = extraer_texto(pdf_docente.name)
         texto_alumno = extraer_texto(pdf_alumno.name)
-        # 1) Instanciar el modelo
         model = GenerativeModel(
             "gemini-1.5-pro-001",
             system_instruction=["Eres un parser estricto."]
         )
-        # 2) Convertir PDF Docente y Alumno en dict {Pregunta X: Respuesta X}
-        dict_docente = parsear_con_llm(texto_docente, model)
-        dict_alumno = parsear_con_llm(texto_alumno, model)
-        # 3) Comparar y generar feedback
         feedback = comparar_preguntas_respuestas(dict_docente, dict_alumno)
         if len(feedback.strip()) < 5:
             return "No se encontraron preguntas o respuestas válidas."
-        # 4) Generar un resumen
         summary_prompt = f"""
         Eres un profesor experto de bioquímica. Te muestro la comparación de preguntas y respuestas:
         {feedback}
@@ -151,14 +154,16 @@ interface = gr.Interface(
     fn=revisar_examen,
     inputs=[
         gr.File(label="Credenciales JSON"),
-        gr.File(label="PDF Docente"),
         gr.File(label="PDF Alumno")
     ],
     outputs=gr.Markdown(),
-    title="Revisión de Exámenes con LLM (Permisivo)",
-    description=("Sube credenciales, el PDF del docente y del alumno; "
-                 "se emplea un LLM para encontrar 'Explicá' y 'RESPUESTAS' etc. "
-                 "y evitar alucinaciones.")
 )
 interface.launch(debug=True)

             texto_total += page.extract_text() or ""
     return texto_total
+def parsear_con_llm_con_enumeraciones(texto_pdf: str, model: GenerativeModel) -> dict:
     """
+    Usa el LLM para extraer las 'Preguntas' y sus 'Respuestas'.
+    Reconoce enumeraciones en 'Preguntas' (ej. '1.' o '1)') y en 'RESPUESTAS'.
+    Devuelve JSON con la forma:
+    {
+      "Pregunta 1": "Texto de la respuesta",
+      "Pregunta 2": "Texto de la respuesta",
+      ...
+    }
     """
+    # Prompt que describe el formato “Preguntas” y “RESPUESTAS”
     prompt = f"""
+Eres un parser de texto que recibe el contenido de un PDF con dos secciones:
+'Preguntas' y 'RESPUESTAS', cada una enumerada como '1.', '2)', etc.
+Tu tarea es emparejar cada pregunta con su respuesta correspondiente, basándote
+en el número que las identifica (1, 2, 3, ...).
+Devuelve un JSON con la estructura:
 {{
+  "Pregunta 1": "texto de la respuesta",
+  "Pregunta 2": "texto de la respuesta",
+  ...
 }}
+Si no hay correspondencia entre pregunta y respuesta, la dejas vacía.
+Ejemplo de JSON vacío: {{}}
 Texto PDF:
 {texto_pdf}
+Devuelve solo el JSON, sin explicaciones adicionales.
 """
     part_text = Part.from_text(prompt)
         return {}
 def comparar_preguntas_respuestas(dict_docente: dict, dict_alumno: dict) -> str:
+    """Compara dict_docente vs dict_alumno y retorna retroalimentación."""
     retroalimentacion = []
     for pregunta, resp_correcta in dict_docente.items():
         resp_alumno = dict_alumno.get(pregunta, None)
         if resp_alumno is None:
+            retroalimentacion.append(f"**{pregunta}**\nNo fue asignada al alumno.\n")
         else:
             retroalimentacion.append(
                 f"**{pregunta}**\n"
         configurar_credenciales(json_cred.name)
         vertexai.init(project="deploygpt", location="us-central1")
+        # Leer texto de ambos PDFs
         texto_docente = extraer_texto(pdf_docente.name)
         texto_alumno = extraer_texto(pdf_alumno.name)
+        # Instanciar el modelo
         model = GenerativeModel(
             "gemini-1.5-pro-001",
             system_instruction=["Eres un parser estricto."]
         )
+        # Parsear 'Preguntas' y 'RESPUESTAS' para docente y alumno
+        dict_docente = parsear_con_llm_con_enumeraciones(texto_docente, model)
+        dict_alumno = parsear_con_llm_con_enumeraciones(texto_alumno, model)
+        # Comparar y generar retroalimentación
         feedback = comparar_preguntas_respuestas(dict_docente, dict_alumno)
         if len(feedback.strip()) < 5:
             return "No se encontraron preguntas o respuestas válidas."
+        # Generar resumen final
         summary_prompt = f"""
         Eres un profesor experto de bioquímica. Te muestro la comparación de preguntas y respuestas:
         {feedback}
     fn=revisar_examen,
     inputs=[
         gr.File(label="Credenciales JSON"),
+        gr.File(label="PDF del Docente"),
         gr.File(label="PDF Alumno")
     ],
     outputs=gr.Markdown(),
+    title="Revisión de Exámenes con Enumeraciones",
+    description=(
+        "Sube tus credenciales, el PDF del docente y del alumno. El LLM "
+        "detectará enumeraciones (1., 2), etc.) en 'Preguntas' y 'RESPUESTAS' "
+        "para armar un JSON y compararlos."
+    )
 )
 interface.launch(debug=True)