Spaces:

umerforsure
/

AI-Study-Assistant

Running

umerforsure commited on Aug 7, 2025

Commit

267a2df

1 Parent(s): 9584b5a

🐛 Fix: improved model output post-processing to avoid empty answers

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,13 +12,14 @@ from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_core.documents import Document
-# Load Reasoning Model (lightweight + CPU friendly)
-model_id = "google/flan-t5-base"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
-model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
 reasoning_pipeline = pipeline(
-    "text2text-generation",
     model=model,
     tokenizer=tokenizer,
     max_new_tokens=512,
@@ -33,6 +34,7 @@ vectorstore = None
 # Summarizer
 summary_pipeline = pipeline("summarization", model="sshleifer/distilbart-cnn-12-6")
 def clean_text(text):
     lines = text.split("\n")
     cleaned = []

 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_core.documents import Document
+#extra
+# Load Reasoning Model (CPU-friendly with better reasoning)
+model_id = "microsoft/phi-1_5"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(model_id)
 reasoning_pipeline = pipeline(
+    "text-generation",
     model=model,
     tokenizer=tokenizer,
     max_new_tokens=512,
 # Summarizer
 summary_pipeline = pipeline("summarization", model="sshleifer/distilbart-cnn-12-6")
 def clean_text(text):
     lines = text.split("\n")
     cleaned = []