Spaces:

heerjtdev
/

answer_feedback

Sleeping

App Files Files Community

heerjtdev commited on 11 days ago

Commit

feb61bd

verified ·

1 Parent(s): 05fc0ae

Update app.py

Browse files

Files changed (1) hide show

app.py +305 -49

app.py CHANGED Viewed

@@ -179,6 +179,230 @@
 import gradio as gr
 import fitz  # PyMuPDF
 import torch
@@ -201,15 +425,12 @@ class OnnxBgeEmbeddings(Embeddings):
     def __init__(self, model_name="BAAI/bge-large-en-v1.5"):
         print(f"🔄 Loading Embeddings: {model_name}...")
         self.tokenizer = AutoTokenizer.from_pretrained(model_name)
-        # Note: export=True will re-convert on every restart.
-        # For production, you'd want to save this permanently, but this works for now.
         self.model = ORTModelForFeatureExtraction.from_pretrained(model_name, export=True)
     def _process_batch(self, texts):
         inputs = self.tokenizer(texts, padding=True, truncation=True, max_length=512, return_tensors="pt")
         with torch.no_grad():
             outputs = self.model(**inputs)
-        # CLS pooling for BGE
         embeddings = outputs.last_hidden_state[:, 0]
         embeddings = torch.nn.functional.normalize(embeddings, p=2, dim=1)
         return embeddings.numpy().tolist()
@@ -221,18 +442,16 @@ class OnnxBgeEmbeddings(Embeddings):
         return self._process_batch(["Represent this sentence for searching relevant passages: " + text])[0]
 # ---------------------------------------------------------
-# 2. LLM Evaluator Class (Llama-3.2-1B ONNX)
 # ---------------------------------------------------------
 class LLMEvaluator:
     def __init__(self):
         self.repo_id = "onnx-community/Llama-3.2-1B-Instruct"
         self.local_dir = "onnx_llama_local"
-        print(f"🔄 Preparing LLM: {self.repo_id}...")
-        # [FIXED DOWNLOADER]
-        print(f"📥 Downloading FP16 model + data to {self.local_dir}...")
         snapshot_download(
             repo_id=self.repo_id,
             local_dir=self.local_dir,
@@ -243,45 +462,57 @@ class LLMEvaluator:
                 "tokenizer*",
                 "special_tokens_map.json",
                 "*.jinja",
-                "onnx/model_fp16.onnx*"  # WILDCARD '*' ensures we get .onnx AND .onnx_data
             ]
         )
         print("✅ Download complete.")
         self.tokenizer = AutoTokenizer.from_pretrained(self.local_dir)
-        # [CRITICAL FIX]
-        # Separating 'subfolder' and 'file_name' is required by Optimum
         self.model = ORTModelForCausalLM.from_pretrained(
             self.local_dir,
-            subfolder="onnx",             # Point to the subfolder
-            file_name="model_fp16.onnx",  # Just the filename
             use_cache=True,
             use_io_binding=False
         )
     def evaluate(self, context, question, student_answer):
-        # Prompt Engineering for Llama 3
         messages = [
-            {"role": "system", "content": "You are a helpful academic grader. Grade the student answer based ONLY on the provided context."},
-            {"role": "user", "content": f"""
-            ### CONTEXT:
-            {context}
-            ### QUESTION:
-            {question}
-            ### STUDENT ANSWER:
-            {student_answer}
-            ### INSTRUCTIONS:
-            1. Is the answer correct?
-            2. Score out of 10.
-            3. Explanation.
-            """}
         ]
-        # Format input using the chat template
         input_text = self.tokenizer.apply_chat_template(
             messages,
             tokenize=False,
@@ -290,23 +521,21 @@ class LLMEvaluator:
         inputs = self.tokenizer(input_text, return_tensors="pt")
-        # Generate response
         with torch.no_grad():
             outputs = self.model.generate(
                 **inputs,
-                max_new_tokens=256,
-                temperature=0.3,
                 do_sample=True,
                 top_p=0.9
             )
-        # Decode response
         response = self.tokenizer.decode(
             outputs[0][inputs.input_ids.shape[1]:],
             skip_special_tokens=True
         )
         return response
 # ---------------------------------------------------------
 # 3. Main Application Logic
 # ---------------------------------------------------------
@@ -314,7 +543,7 @@ class VectorSystem:
     def __init__(self):
         self.vector_store = None
         self.embeddings = OnnxBgeEmbeddings()
-        self.llm = LLMEvaluator() # Initialize LLM
         self.all_chunks = []
     def process_file(self, file_obj):
@@ -334,6 +563,7 @@ class VectorSystem:
             if not self.all_chunks: return "File empty."
             metadatas = [{"id": i} for i in range(len(self.all_chunks))]
             self.vector_store = FAISS.from_texts(self.all_chunks, self.embeddings, metadatas=metadatas)
             return f"✅ Indexed {len(self.all_chunks)} chunks."
@@ -344,18 +574,44 @@ class VectorSystem:
         if not self.vector_store: return "⚠️ Please upload a file first.", ""
         if not question: return "⚠️ Enter a question.", ""
-        # 1. Retrieve
-        results = self.vector_store.similarity_search_with_score(question, k=3)
-        # Prepare context for LLM
-        context_text = "\n\n".join([doc.page_content for doc, _ in results])
-        # Prepare Evidence Output for UI
-        evidence_display = "### 📚 Retrieved Context:\n"
-        for i, (doc, score) in enumerate(results):
-            evidence_display += f"**Chunk {i+1}** (Score: {score:.4f}):\n> {doc.page_content}\n\n"
-        # 2. Evaluate (if answer provided)
         llm_feedback = "Please enter a student answer to grade."
         if student_answer:
             llm_feedback = self.llm.evaluate(context_text, question, student_answer)
@@ -368,7 +624,7 @@ system = VectorSystem()
 # --- GRADIO UI ---
 with gr.Blocks(title="EduGenius AI Grader") as demo:
     gr.Markdown("# 🧠 EduGenius: RAG + LLM Grading")
-    gr.Markdown("Powered by **BGE-Large** (Retrieval) and **Llama-3.2-1B** (Evaluation) - All ONNX Optimized.")
     with gr.Row():
         with gr.Column(scale=1):
@@ -382,8 +638,8 @@ with gr.Blocks(title="EduGenius AI Grader") as demo:
             run_btn = gr.Button("Retrieve & Grade", variant="secondary")
             with gr.Row():
-                evidence_box = gr.Markdown(label="Context")
-                grade_box = gr.Markdown(label="LLM Evaluation")
     upload_btn.click(system.process_file, inputs=[pdf_input], outputs=[status_msg])
     run_btn.click(system.process_query, inputs=[q_input, a_input], outputs=[evidence_box, grade_box])

+# import gradio as gr
+# import fitz  # PyMuPDF
+# import torch
+# import os
+# # --- LANGCHAIN & RAG IMPORTS ---
+# from langchain_text_splitters import RecursiveCharacterTextSplitter
+# from langchain_community.vectorstores import FAISS
+# from langchain_core.embeddings import Embeddings
+# # --- ONNX & MODEL IMPORTS ---
+# from transformers import AutoTokenizer
+# from optimum.onnxruntime import ORTModelForFeatureExtraction, ORTModelForCausalLM
+# from huggingface_hub import snapshot_download
+# # ---------------------------------------------------------
+# # 1. Custom ONNX Embedding Class (BGE-Large)
+# # ---------------------------------------------------------
+# class OnnxBgeEmbeddings(Embeddings):
+#     def __init__(self, model_name="BAAI/bge-large-en-v1.5"):
+#         print(f"🔄 Loading Embeddings: {model_name}...")
+#         self.tokenizer = AutoTokenizer.from_pretrained(model_name)
+#         # Note: export=True will re-convert on every restart.
+#         # For production, you'd want to save this permanently, but this works for now.
+#         self.model = ORTModelForFeatureExtraction.from_pretrained(model_name, export=True)
+#     def _process_batch(self, texts):
+#         inputs = self.tokenizer(texts, padding=True, truncation=True, max_length=512, return_tensors="pt")
+#         with torch.no_grad():
+#             outputs = self.model(**inputs)
+#         # CLS pooling for BGE
+#         embeddings = outputs.last_hidden_state[:, 0]
+#         embeddings = torch.nn.functional.normalize(embeddings, p=2, dim=1)
+#         return embeddings.numpy().tolist()
+#     def embed_documents(self, texts):
+#         return self._process_batch(texts)
+#     def embed_query(self, text):
+#         return self._process_batch(["Represent this sentence for searching relevant passages: " + text])[0]
+# # ---------------------------------------------------------
+# # 2. LLM Evaluator Class (Llama-3.2-1B ONNX)
+# # ---------------------------------------------------------
+# class LLMEvaluator:
+#     def __init__(self):
+#         self.repo_id = "onnx-community/Llama-3.2-1B-Instruct"
+#         self.local_dir = "onnx_llama_local"
+#         print(f"🔄 Preparing LLM: {self.repo_id}...")
+#         # [FIXED DOWNLOADER]
+#         print(f"📥 Downloading FP16 model + data to {self.local_dir}...")
+#         snapshot_download(
+#             repo_id=self.repo_id,
+#             local_dir=self.local_dir,
+#             local_dir_use_symlinks=False,
+#             allow_patterns=[
+#                 "config.json",
+#                 "generation_config.json",
+#                 "tokenizer*",
+#                 "special_tokens_map.json",
+#                 "*.jinja",
+#                 "onnx/model_fp16.onnx*"  # WILDCARD '*' ensures we get .onnx AND .onnx_data
+#             ]
+#         )
+#         print("✅ Download complete.")
+#         self.tokenizer = AutoTokenizer.from_pretrained(self.local_dir)
+#         # [CRITICAL FIX]
+#         # Separating 'subfolder' and 'file_name' is required by Optimum
+#         self.model = ORTModelForCausalLM.from_pretrained(
+#             self.local_dir,
+#             subfolder="onnx",             # Point to the subfolder
+#             file_name="model_fp16.onnx",  # Just the filename
+#             use_cache=True,
+#             use_io_binding=False
+#         )
+#     def evaluate(self, context, question, student_answer):
+#         # Prompt Engineering for Llama 3
+#         messages = [
+#             {"role": "system", "content": "You are a helpful academic grader. Grade the student answer based ONLY on the provided context."},
+#             {"role": "user", "content": f"""
+#             ### CONTEXT:
+#             {context}
+#             ### QUESTION:
+#             {question}
+#             ### STUDENT ANSWER:
+#             {student_answer}
+#             ### INSTRUCTIONS:
+#             1. Is the answer correct?
+#             2. Score out of 10.
+#             3. Explanation.
+#             """}
+#         ]
+#         # Format input using the chat template
+#         input_text = self.tokenizer.apply_chat_template(
+#             messages,
+#             tokenize=False,
+#             add_generation_prompt=True
+#         )
+#         inputs = self.tokenizer(input_text, return_tensors="pt")
+#         # Generate response
+#         with torch.no_grad():
+#             outputs = self.model.generate(
+#                 **inputs,
+#                 max_new_tokens=256,
+#                 temperature=0.3,
+#                 do_sample=True,
+#                 top_p=0.9
+#             )
+#         # Decode response
+#         response = self.tokenizer.decode(
+#             outputs[0][inputs.input_ids.shape[1]:],
+#             skip_special_tokens=True
+#         )
+#         return response
+# # ---------------------------------------------------------
+# # 3. Main Application Logic
+# # ---------------------------------------------------------
+# class VectorSystem:
+#     def __init__(self):
+#         self.vector_store = None
+#         self.embeddings = OnnxBgeEmbeddings()
+#         self.llm = LLMEvaluator() # Initialize LLM
+#         self.all_chunks = []
+#     def process_file(self, file_obj):
+#         if file_obj is None: return "No file uploaded."
+#         try:
+#             text = ""
+#             if file_obj.name.endswith('.pdf'):
+#                 doc = fitz.open(file_obj.name)
+#                 for page in doc: text += page.get_text()
+#             elif file_obj.name.endswith('.txt'):
+#                 with open(file_obj.name, 'r', encoding='utf-8') as f: text = f.read()
+#             else:
+#                 return "❌ Error: Only .pdf and .txt supported."
+#             text_splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=150)
+#             self.all_chunks = text_splitter.split_text(text)
+#             if not self.all_chunks: return "File empty."
+#             metadatas = [{"id": i} for i in range(len(self.all_chunks))]
+#             self.vector_store = FAISS.from_texts(self.all_chunks, self.embeddings, metadatas=metadatas)
+#             return f"✅ Indexed {len(self.all_chunks)} chunks."
+#         except Exception as e:
+#             return f"Error: {str(e)}"
+#     def process_query(self, question, student_answer):
+#         if not self.vector_store: return "⚠️ Please upload a file first.", ""
+#         if not question: return "⚠️ Enter a question.", ""
+#         # 1. Retrieve
+#         results = self.vector_store.similarity_search_with_score(question, k=3)
+#         # Prepare context for LLM
+#         context_text = "\n\n".join([doc.page_content for doc, _ in results])
+#         # Prepare Evidence Output for UI
+#         evidence_display = "### 📚 Retrieved Context:\n"
+#         for i, (doc, score) in enumerate(results):
+#             evidence_display += f"**Chunk {i+1}** (Score: {score:.4f}):\n> {doc.page_content}\n\n"
+#         # 2. Evaluate (if answer provided)
+#         llm_feedback = "Please enter a student answer to grade."
+#         if student_answer:
+#             llm_feedback = self.llm.evaluate(context_text, question, student_answer)
+#         return evidence_display, llm_feedback
+# # Initialize
+# system = VectorSystem()
+# # --- GRADIO UI ---
+# with gr.Blocks(title="EduGenius AI Grader") as demo:
+#     gr.Markdown("# 🧠 EduGenius: RAG + LLM Grading")
+#     gr.Markdown("Powered by **BGE-Large** (Retrieval) and **Llama-3.2-1B** (Evaluation) - All ONNX Optimized.")
+#     with gr.Row():
+#         with gr.Column(scale=1):
+#             pdf_input = gr.File(label="1. Upload Chapter (PDF/TXT)")
+#             upload_btn = gr.Button("Index Content", variant="primary")
+#             status_msg = gr.Textbox(label="System Status", interactive=False)
+#         with gr.Column(scale=2):
+#             q_input = gr.Textbox(label="2. Question")
+#             a_input = gr.Textbox(label="3. Student Answer")
+#             run_btn = gr.Button("Retrieve & Grade", variant="secondary")
+#             with gr.Row():
+#                 evidence_box = gr.Markdown(label="Context")
+#                 grade_box = gr.Markdown(label="LLM Evaluation")
+#     upload_btn.click(system.process_file, inputs=[pdf_input], outputs=[status_msg])
+#     run_btn.click(system.process_query, inputs=[q_input, a_input], outputs=[evidence_box, grade_box])
+# if __name__ == "__main__":
+#     demo.launch()
 import gradio as gr
 import fitz  # PyMuPDF
 import torch
     def __init__(self, model_name="BAAI/bge-large-en-v1.5"):
         print(f"🔄 Loading Embeddings: {model_name}...")
         self.tokenizer = AutoTokenizer.from_pretrained(model_name)
         self.model = ORTModelForFeatureExtraction.from_pretrained(model_name, export=True)
     def _process_batch(self, texts):
         inputs = self.tokenizer(texts, padding=True, truncation=True, max_length=512, return_tensors="pt")
         with torch.no_grad():
             outputs = self.model(**inputs)
         embeddings = outputs.last_hidden_state[:, 0]
         embeddings = torch.nn.functional.normalize(embeddings, p=2, dim=1)
         return embeddings.numpy().tolist()
         return self._process_batch(["Represent this sentence for searching relevant passages: " + text])[0]
 # ---------------------------------------------------------
+# 2. LLM Evaluator Class (Llama-3.2-1B ONNX - INT8 QUANTIZED)
 # ---------------------------------------------------------
 class LLMEvaluator:
     def __init__(self):
         self.repo_id = "onnx-community/Llama-3.2-1B-Instruct"
         self.local_dir = "onnx_llama_local"
+        print(f"🔄 Preparing LLM: {self.repo_id} (Int8 Quantized)...")
+        print(f"📥 Downloading Int8 model to {self.local_dir}...")
         snapshot_download(
             repo_id=self.repo_id,
             local_dir=self.local_dir,
                 "tokenizer*",
                 "special_tokens_map.json",
                 "*.jinja",
+                "onnx/model_quantized.onnx"
             ]
         )
         print("✅ Download complete.")
         self.tokenizer = AutoTokenizer.from_pretrained(self.local_dir)
         self.model = ORTModelForCausalLM.from_pretrained(
             self.local_dir,
+            subfolder="onnx",
+            file_name="model_quantized.onnx",
             use_cache=True,
             use_io_binding=False
         )
     def evaluate(self, context, question, student_answer):
+        # STRICT PROMPT (As requested)
+        system_prompt = """You are a strict academic grader.
+        RULES:
+        1. BASE YOUR SCORE ONLY ON THE CONTEXT PROVIDED.
+        2. If the student answer contradicts the context, give a score of 0-2.
+        3. If the context says 'A is B', and the student says 'A is C', the student is WRONG.
+        4. Be harsh. Do not give credit for vague or hallucinatory answers."""
+        user_prompt = f"""
+        ### SOURCE MATERIAL (CONTEXT):
+        {context}
+        ### EXAM QUESTION:
+        {question}
+        ### STUDENT ANSWER:
+        {student_answer}
+        ### INSTRUCTIONS:
+        Compare the Student Answer to the Source Material.
+        - Does the student explicitly mention the key points found in the text?
+        - If the student describes something NOT in the text (e.g., "looking in" vs "looking out"), mark it wrong.
+        OUTPUT FORMAT:
+        Score: [0-10]
+        Verdict: [Correct/Incorrect/Partially Correct]
+        Explanation: [1-2 sentences explaining why, citing the text]
+        """
         messages = [
+            {"role": "system", "content": system_prompt},
+            {"role": "user", "content": user_prompt}
         ]
         input_text = self.tokenizer.apply_chat_template(
             messages,
             tokenize=False,
         inputs = self.tokenizer(input_text, return_tensors="pt")
         with torch.no_grad():
             outputs = self.model.generate(
                 **inputs,
+                max_new_tokens=200,
+                temperature=0.1,
                 do_sample=True,
                 top_p=0.9
             )
         response = self.tokenizer.decode(
             outputs[0][inputs.input_ids.shape[1]:],
             skip_special_tokens=True
         )
         return response
 # ---------------------------------------------------------
 # 3. Main Application Logic
 # ---------------------------------------------------------
     def __init__(self):
         self.vector_store = None
         self.embeddings = OnnxBgeEmbeddings()
+        self.llm = LLMEvaluator()
         self.all_chunks = []
     def process_file(self, file_obj):
             if not self.all_chunks: return "File empty."
+            # We store the ID to look up neighbors later
             metadatas = [{"id": i} for i in range(len(self.all_chunks))]
             self.vector_store = FAISS.from_texts(self.all_chunks, self.embeddings, metadatas=metadatas)
             return f"✅ Indexed {len(self.all_chunks)} chunks."
         if not self.vector_store: return "⚠️ Please upload a file first.", ""
         if not question: return "⚠️ Enter a question.", ""
+        # 1. RAG RETRIEVAL - Get ONLY the Top 1 Best Match
+        results = self.vector_store.similarity_search_with_score(question, k=1)
+        if not results:
+            return "No relevant text found.", ""
+        # Get the ID of the best chunk
+        best_doc, score = results[0]
+        chunk_id = best_doc.metadata['id']
+        # 2. CONTEXT EXPANSION (Neighboring Chunks)
+        # We retrieve Preceding + Current + Succeeding to repair cut-off sentences.
+        # Get Preceding Chunk (if not at start)
+        prev_text = self.all_chunks[chunk_id - 1] if chunk_id > 0 else ""
+        # Get Current Chunk
+        curr_text = self.all_chunks[chunk_id]
+        # Get Succeeding Chunk (if not at end)
+        next_text = self.all_chunks[chunk_id + 1] if chunk_id < len(self.all_chunks) - 1 else ""
+        # Join them into one solid block of text for the LLM
+        context_text = f"{prev_text}\n\n{curr_text}\n\n{next_text}"
+        # 3. UI DISPLAY
+        # We format this nicely so the user knows what part is the "Core Match"
+        evidence_display = f"### 🎯 Best Match (Score: {score:.4f})\n"
+        if prev_text:
+            evidence_display += f"> **PREVIOUS CONTEXT:**\n...{prev_text[-400:]}\n\n" # Show last 400 chars
+        evidence_display += f"> **CORE MATCH:**\n**{curr_text}**\n\n"
+        if next_text:
+            evidence_display += f"> **NEXT CONTEXT:**\n{next_text[:400]}...\n" # Show first 400 chars
+        # 4. LLM EVALUATION
         llm_feedback = "Please enter a student answer to grade."
         if student_answer:
             llm_feedback = self.llm.evaluate(context_text, question, student_answer)
 # --- GRADIO UI ---
 with gr.Blocks(title="EduGenius AI Grader") as demo:
     gr.Markdown("# 🧠 EduGenius: RAG + LLM Grading")
+    gr.Markdown("Powered by **BGE-Large** (Retrieval) and **Llama-3.2-1B-Int8** (Evaluation).")
     with gr.Row():
         with gr.Column(scale=1):
             run_btn = gr.Button("Retrieve & Grade", variant="secondary")
             with gr.Row():
+                evidence_box = gr.Markdown(label="Context Used for Grading")
+                grade_box = gr.Markdown(label="LLM Evaluation Result")
     upload_btn.click(system.process_file, inputs=[pdf_input], outputs=[status_msg])
     run_btn.click(system.process_query, inputs=[q_input, a_input], outputs=[evidence_box, grade_box])