Spaces:

manabb
/

CharBotWithPDF

Running

App Files Files Community

manabb commited on Dec 28, 2025

Commit

5d2977e

verified ·

1 Parent(s): 55ff4a2

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -6

app.py CHANGED Viewed

@@ -329,12 +329,12 @@ def generate_qa_chain(repo_id, embedding_model="sentence-transformers/all-MiniLM
 #============================
 def bePrepare():
     global qa_chain
-    qa_chain = generate_qa_chain("manabb/nrl",llm=llm)
     return "I am ready, ask me questions with model tiny Lama."
 def bePrepare1():
     global qa_chain1
-    qa_chain1 = generate_qa_chain("manabb/nrl",llm=llm1)
     return "I am ready, ask me questions with model google flan-t5."
 def ask_question(query):
@@ -348,7 +348,7 @@ def ask_question(query):
         # Extract source documents with page info
         sources = response.get("source_documents", [])
         source_info = ""
-        pdf_url = f"https://huggingface.co/datasets/manabb/nrl/resolve/main/docs/{os.path.basename(filename)}"
         source_info += f" [📄 PDF]({pdf_url})"
         for i, doc in enumerate(sources[:3]):  # Top 3 sources
             page_num = getattr(doc.metadata, 'page', 'Unknown')
@@ -356,7 +356,7 @@ def ask_question(query):
             source_info += f"\n**Source {i+1}:** {os.path.basename(filename)} (Page {page_num})"
         # HF dataset link
-        repo_url = f"https://huggingface.co/datasets/manabb/nrl"
         msg = f"{result}\n\n**📄 Document Sources:**{source_info}\n\n[View all documents]({repo_url})"
     return msg
 def ask_question1(query):
@@ -370,7 +370,7 @@ def ask_question1(query):
         # Extract source documents with page info
         sources = response.get("source_documents", [])
         source_info = ""
-        pdf_url = f"https://huggingface.co/datasets/manabb/nrl/resolve/main/docs/{os.path.basename(filename)}"
         source_info += f" [📄 PDF]({pdf_url})"
         for i, doc in enumerate(sources[:3]):  # Top 3 sources
             page_num = getattr(doc.metadata, 'page', 'Unknown')
@@ -378,7 +378,7 @@ def ask_question1(query):
             source_info += f"\n**Source {i+1}:** {os.path.basename(filename)} (Page {page_num})"
         # HF dataset link
-        repo_url = f"https://huggingface.co/datasets/manabb/nrl"
         msg = f"{result}\n\n**📄 Document Sources:**{source_info}\n\n[View all documents]({repo_url})"
     return msg
 #===============================================
@@ -407,6 +407,30 @@ def delete_entire_repo(user):
             mx = mx+f"❌ eoor during creation of depo: {e1}"
     return mx
 #===============================================
 # Gradio UI
 with gr.Blocks(title="N R L C H A T B O T - for commercial procurement - Supply", css="""
     #blue-col { background: linear-gradient(135deg, #667eea, #764ba2); padding: 20px; border-radius: 10px; }
@@ -452,6 +476,8 @@ with gr.Blocks(title="N R L C H A T B O T - for commercial procurement - Supply"
             gr.Markdown("## 📚 Uploaded Documents")
             with gr.Row():
                 pdf_list = gr.Markdown("**No documents loaded yet.**")
         with gr.Column(elem_id="blue-col",scale=1):
             gr.Markdown("## 🧠 For uploading new PDF documents.")
             with gr.Row():

 #============================
 def bePrepare():
     global qa_chain
+    qa_chain = generate_qa_chain(os.getenv("reposit_id"),llm=llm)
     return "I am ready, ask me questions with model tiny Lama."
 def bePrepare1():
     global qa_chain1
+    qa_chain1 = generate_qa_chain(os.getenv("reposit_id"),llm=llm1)
     return "I am ready, ask me questions with model google flan-t5."
 def ask_question(query):
         # Extract source documents with page info
         sources = response.get("source_documents", [])
         source_info = ""
+        pdf_url = f"https://huggingface.co/datasets/manabb/withPDFlink/resolve/main/docs/{os.path.basename(filename)}"
         source_info += f" [📄 PDF]({pdf_url})"
         for i, doc in enumerate(sources[:3]):  # Top 3 sources
             page_num = getattr(doc.metadata, 'page', 'Unknown')
             source_info += f"\n**Source {i+1}:** {os.path.basename(filename)} (Page {page_num})"
         # HF dataset link
+        repo_url = f"https://huggingface.co/datasets/manabb/withPDFlink"
         msg = f"{result}\n\n**📄 Document Sources:**{source_info}\n\n[View all documents]({repo_url})"
     return msg
 def ask_question1(query):
         # Extract source documents with page info
         sources = response.get("source_documents", [])
         source_info = ""
+        pdf_url = f"https://huggingface.co/datasets/manabb/withPDFlink/resolve/main/docs/{os.path.basename(filename)}"
         source_info += f" [📄 PDF]({pdf_url})"
         for i, doc in enumerate(sources[:3]):  # Top 3 sources
             page_num = getattr(doc.metadata, 'page', 'Unknown')
             source_info += f"\n**Source {i+1}:** {os.path.basename(filename)} (Page {page_num})"
         # HF dataset link
+        repo_url = f"https://huggingface.co/datasets/manabb/withPDFlink"
         msg = f"{result}\n\n**📄 Document Sources:**{source_info}\n\n[View all documents]({repo_url})"
     return msg
 #===============================================
             mx = mx+f"❌ eoor during creation of depo: {e1}"
     return mx
 #===============================================
+# ❌ Static (never updates)
+# pdf_list = gr.Markdown("**No documents loaded yet.**")
+# ✅ Dynamic function
+def get_pdf_list(repo_id):
+    try:
+        from huggingface_hub import HfApi
+        api = HfApi(token=os.getenv("HF_TOKEN"))
+        files = api.list_repo_files(repo_id, repo_type="dataset")
+        pdf_files = [f for f in files if f.endswith('.pdf')]
+        if not pdf_files:
+            return "**No PDF documents in repo yet.**"
+        links = []
+        for pdf in pdf_files:
+            url = f"https://huggingface.co/datasets/{repo_id}/resolve/main/{pdf}"
+            links.append(f"• [📄 {os.path.basename(pdf)}]({url})")
+        return f"**📚 Uploaded PDFs ({len(pdf_files)}):**\n" + "\n".join(links)
+    except:
+        return "**❌ Cannot load PDF list**"
+#===============================================
 # Gradio UI
 with gr.Blocks(title="N R L C H A T B O T - for commercial procurement - Supply", css="""
     #blue-col { background: linear-gradient(135deg, #667eea, #764ba2); padding: 20px; border-radius: 10px; }
             gr.Markdown("## 📚 Uploaded Documents")
             with gr.Row():
                 pdf_list = gr.Markdown("**No documents loaded yet.**")
+                refresh_btn = gr.Button("🔄 Refresh")
+                refresh_btn.click(get_pdf_list,inputs=os.getenv("reposit_id"),outputs=pdf_list)
         with gr.Column(elem_id="blue-col",scale=1):
             gr.Markdown("## 🧠 For uploading new PDF documents.")
             with gr.Row():