Spaces:

Zahid0123
/

Agentic-Rag-Hacktahon

Sleeping

App Files Files Community

Zahid0123 commited on Nov 21, 2025

Commit

fb14d9c

verified ·

1 Parent(s): cd1d99b

Update app.py

Browse files

Files changed (1) hide show

app.py +45 -73

app.py CHANGED Viewed

@@ -48,7 +48,7 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 # ===================================================================
-# UTILITY CLASSES
 # ===================================================================
 class WebSearchTool:
@@ -111,7 +111,7 @@ class ConfigManager:
 # ===================================================================
-# DOCUMENT PROCESSING
 # ===================================================================
 class DocumentProcessor:
@@ -244,7 +244,7 @@ def build_embeddings_from_directory(data_directory: str, output_directory: str,
 # ===================================================================
-# RETRIEVER
 # ===================================================================
 class DocumentRetriever:
@@ -285,7 +285,7 @@ class DocumentRetriever:
 # ===================================================================
-# AGENTIC TOOLS
 # ===================================================================
 class AgenticTools:
@@ -455,7 +455,7 @@ class AgenticEvaluator:
 # ===================================================================
-# MAIN AGENT CLASS
 # ===================================================================
 class AgenticRAGAgent:
@@ -492,11 +492,8 @@ class AgenticRAGAgent:
                 print(f"❌ Error: {e}")
     def clean_text_for_speech(self, text):
-        """Clean text for TTS"""
         if not text:
             return ""
-        # Remove markdown formatting
         text = re.sub(r'\*\*([^*]+)\*\*', r'\1', text)
         text = re.sub(r'\*([^*]+)\*', r'\1', text)
         text = re.sub(r'^#{1,6}\s+', '', text, flags=re.MULTILINE)
@@ -505,43 +502,24 @@ class AgenticRAGAgent:
         text = re.sub(r'`([^`]+)`', r'\1', text)
         text = re.sub(r'^[\s]*[-*+•]\s+', '', text, flags=re.MULTILINE)
         text = re.sub(r'^[\s]*\d+\.\s+', '', text, flags=re.MULTILINE)
-        # Remove emojis
-        emoji_pattern = re.compile(
-            "["
-            "\U0001F600-\U0001F64F"
-            "\U0001F300-\U0001F5FF"
-            "\U0001F680-\U0001F6FF"
-            "\U0001F1E0-\U0001F1FF"
-            "\U00002702-\U000027B0"
-            "\U000024C2-\U0001F251"
-            "\U0001F900-\U0001F9FF"
-            "\U00002600-\U000026FF"
-            "\U00002700-\U000027BF"
-            "]+"
-        )
         text = emoji_pattern.sub('', text)
         text = re.sub(r'\s+', ' ', text)
         text = re.sub(r'\n+', '. ', text)
         text = text.strip()
         text = re.sub(r'\.+', '.', text)
         return text
     def generate_audio_response(self, text):
-        """Generate audio using gTTS"""
         if not text or not GTTS_AVAILABLE:
             return None
         clean_text = self.clean_text_for_speech(text)
         if not clean_text:
             return None
         try:
             temp_dir = tempfile.gettempdir()
             timestamp = int(time.time())
             audio_file = os.path.join(temp_dir, f"response_{timestamp}.mp3")
             tts = gTTS(text=clean_text, lang='en', slow=False)
             tts.save(audio_file)
             return audio_file
@@ -560,13 +538,11 @@ class AgenticRAGAgent:
     def get_simple_answer(self, query, retrieved_docs):
         if not self.groq_client:
             return "Error: Groq API not configured"
         context = "\n\n".join([doc.get('content', str(doc)) for doc in retrieved_docs[:5]])
         prompt = f"""Based on this context, provide a clear answer.
 Context: {context}
 Question: {query}
 Answer:"""
         try:
             response = self.groq_client.chat.completions.create(
                 model="llama-3.1-8b-instant",
@@ -595,10 +571,8 @@ Answer:"""
                 progress(0.5, desc="Generating response...")
                 response = self.get_greeting_response(query)
                 chat_history.append({"role": "assistant", "content": response})
                 progress(0.8, desc="🔊 Generating voice...")
                 audio_file = self.generate_audio_response(response)
                 return chat_history, "", audio_file
             progress(0.1, desc="🧠 Planning...")
@@ -648,7 +622,7 @@ Answer:"""
             if self.synthesizer:
                 final_answer = self.synthesizer.synthesize_results(query, results, self.temperature, self.max_tokens)
             else:
-                successful = [r['result'] for r in results.values() if r.get('success')]
                 final_answer = f"Based on available info: {' '.join(map(str, successful))}"
             progress(0.9, desc="📊 Evaluating...")
@@ -680,7 +654,7 @@ Answer:"""
             return chat_history, "", audio_file
         except Exception as e:
-            error = f"❌ Error: {str(e)}"
             chat_history.append({"role": "assistant", "content": error})
             return chat_history, "", None
@@ -699,7 +673,6 @@ Answer:"""
                     dest = os.path.join("sample_data", original)
                     with open(dest, "wb") as dst:
                         dst.write(file.read())
                     uploaded.append(original)
             if not uploaded:
@@ -748,12 +721,12 @@ Answer:"""
 # ===================================================================
-# GRADIO INTERFACE (COMPATIBLE WITH GRADIO 4.27)
 # ===================================================================
-def create_interface():
-    agent = AgenticRAGAgent()
     with gr.Blocks(title="🤖 AI Research Agent", theme=gr.themes.Soft()) as interface:
         gr.HTML("""
         <div style="text-align: center; padding: 20px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); border-radius: 15px;">
@@ -807,57 +780,56 @@ def create_interface():
                     gr.HTML(f"""
                     <div style="padding: 10px;">
                         <p><strong>Text-to-Speech (gTTS):</strong> {'✅ Available' if GTTS_AVAILABLE else '❌ Not Available'}</p>
-                        <p><strong>Speech-to-Text:</strong> {'✅ Available' if STT_AVAILABLE else '❌ Not Available (HF Spaces limitation)'}</p>
                         <p><em>Voice output: Auto-plays with responses</em></p>
                     </div>
                     """)
-        # -----------------------------
-        # Event Handlers (Sync wrapper for async)
-        # -----------------------------
-        def process_msg(message, history):
-            import asyncio
-            try:
-                loop = asyncio.get_event_loop()
-                if loop.is_running():
-                    future = asyncio.run_coroutine_threadsafe(agent.process_agentic_query(message, history), loop)
-                    return future.result()
-                else:
-                    return loop.run_until_complete(agent.process_agentic_query(message, history))
-            except RuntimeError:
-                return asyncio.run(agent.process_agentic_query(message, history))
-        submit_btn.click(process_msg, inputs=[msg, chatbot], outputs=[chatbot, msg, audio_output])
-        msg.submit(process_msg, inputs=[msg, chatbot], outputs=[chatbot, msg, audio_output])
-        clear_btn.click(lambda: [], outputs=[chatbot])
-        file_upload.change(agent.upload_documents, inputs=[file_upload], outputs=[upload_status])
         apply_btn.click(
-            agent.update_settings,
-            inputs=[
-                temperature_slider, max_tokens_slider, chunk_size_slider,
-                chunk_overlap_slider, retrieval_k_slider, enable_web,
-                enable_calc, enable_fact, enable_analysis
-            ],
             outputs=[settings_status]
         )
     return interface
 # ===================================================================
-# MAIN
 # ===================================================================
 if __name__ == "__main__":
     print("🚀 Launching AI Research Agent on Hugging Face Spaces...")
-    print("✨ Features:")
-    print("   • Multi-Tool Integration")
-    print("   • Intelligent Query Planning")
-    print("   • Multi-Step Reasoning")
-    print("   • Result Synthesis")
-    print("   • Quality Evaluation")
-    print("   • 🔊 Voice Output (Text-to-Speech)")
     app = create_interface()
-    app.launch()

 logger = logging.getLogger(__name__)
 # ===================================================================
+# UTILITY CLASSES (unchanged)
 # ===================================================================
 class WebSearchTool:
 # ===================================================================
+# DOCUMENT PROCESSING (unchanged)
 # ===================================================================
 class DocumentProcessor:
 # ===================================================================
+# RETRIEVER (unchanged)
 # ===================================================================
 class DocumentRetriever:
 # ===================================================================
+# AGENTIC TOOLS (unchanged)
 # ===================================================================
 class AgenticTools:
 # ===================================================================
+# MAIN AGENT CLASS (unchanged except small fix for audio clear)
 # ===================================================================
 class AgenticRAGAgent:
                 print(f"❌ Error: {e}")
     def clean_text_for_speech(self, text):
         if not text:
             return ""
         text = re.sub(r'\*\*([^*]+)\*\*', r'\1', text)
         text = re.sub(r'\*([^*]+)\*', r'\1', text)
         text = re.sub(r'^#{1,6}\s+', '', text, flags=re.MULTILINE)
         text = re.sub(r'`([^`]+)`', r'\1', text)
         text = re.sub(r'^[\s]*[-*+•]\s+', '', text, flags=re.MULTILINE)
         text = re.sub(r'^[\s]*\d+\.\s+', '', text, flags=re.MULTILINE)
+        emoji_pattern = re.compile("[\U0001F600-\U0001F64F\U0001F300-\U0001F5FF\U0001F680-\U0001F6FF\U0001F1E0-\U0001F1FF\U00002702-\U000027B0\U000024C2-\U0001F251\U0001F900-\U0001F9FF\U00002600-\U000026FF\U00002700-\U000027BF]+")
         text = emoji_pattern.sub('', text)
         text = re.sub(r'\s+', ' ', text)
         text = re.sub(r'\n+', '. ', text)
         text = text.strip()
         text = re.sub(r'\.+', '.', text)
         return text
     def generate_audio_response(self, text):
         if not text or not GTTS_AVAILABLE:
             return None
         clean_text = self.clean_text_for_speech(text)
         if not clean_text:
             return None
         try:
             temp_dir = tempfile.gettempdir()
             timestamp = int(time.time())
             audio_file = os.path.join(temp_dir, f"response_{timestamp}.mp3")
             tts = gTTS(text=clean_text, lang='en', slow=False)
             tts.save(audio_file)
             return audio_file
     def get_simple_answer(self, query, retrieved_docs):
         if not self.groq_client:
             return "Error: Groq API not configured"
         context = "\n\n".join([doc.get('content', str(doc)) for doc in retrieved_docs[:5]])
         prompt = f"""Based on this context, provide a clear answer.
 Context: {context}
 Question: {query}
 Answer:"""
         try:
             response = self.groq_client.chat.completions.create(
                 model="llama-3.1-8b-instant",
                 progress(0.5, desc="Generating response...")
                 response = self.get_greeting_response(query)
                 chat_history.append({"role": "assistant", "content": response})
                 progress(0.8, desc="🔊 Generating voice...")
                 audio_file = self.generate_audio_response(response)
                 return chat_history, "", audio_file
             progress(0.1, desc="🧠 Planning...")
             if self.synthesizer:
                 final_answer = self.synthesizer.synthesize_results(query, results, self.temperature, self.max_tokens)
             else:
+                successful = [r['result'] for r in results.values() if r.get("success")]
                 final_answer = f"Based on available info: {' '.join(map(str, successful))}"
             progress(0.9, desc="📊 Evaluating...")
             return chat_history, "", audio_file
         except Exception as e:
+            mockery = f"❌ Error: {str(e)}"
             chat_history.append({"role": "assistant", "content": error})
             return chat_history, "", None
                     dest = os.path.join("sample_data", original)
                     with open(dest, "wb") as dst:
                         dst.write(file.read())
                     uploaded.append(original)
             if not uploaded:
 # ===================================================================
+# CREATE AGENT GLOBALLY + FIXED GRADIO INTERFACE
 # ===================================================================
+agent = AgenticRAGAgent()  # ← Important: global instance
+def create_interface():
     with gr.Blocks(title="🤖 AI Research Agent", theme=gr.themes.Soft()) as interface:
         gr.HTML("""
         <div style="text-align: center; padding: 20px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); border-radius: 15px;">
                     gr.HTML(f"""
                     <div style="padding: 10px;">
                         <p><strong>Text-to-Speech (gTTS):</strong> {'✅ Available' if GTTS_AVAILABLE else '❌ Not Available'}</p>
+                        <p>< Urol><strong>Speech-to-Text:</strong> {'✅ Available' if STT_AVAILABLE else '❌ Not Available (HF Spaces limitation)'}</p>
                         <p><em>Voice output: Auto-plays with responses</em></p>
                     </div>
                     """)
+        # ===================== FIXED EVENT HANDLERS =====================
+        def respond(message, history):
+            return agent.process_agentic_query(message, history)
+        submit_btn.click(
+            fn=respond,
+            inputs=[msg, chatbot],
+            outputs=[chatbot, msg, audio_output],
+            concurrency_limit=1
+        )
+        msg.submit(
+            fn=respond,
+            inputs=[msg, chatbot],
+            outputs=[chatbot, msg, audio_output],
+            concurrency_limit=1
+        )
+        clear_btn.click(
+            lambda: ([], None),
+            outputs=[chatbot, audio_output]
+        )
+        file_upload.change(
+            fn=agent.upload_documents,
+            inputs=[file_upload],
+            outputs=[upload_status]
+        )
         apply_btn.click(
+            fn=agent.update_settings,
+            inputs=[temperature_slider, max_tokens_slider, chunk_size_slider,
+                    chunk_overlap_slider, retrieval_k_slider, enable_web,
+                    enable_calc, enable_fact, enable_analysis],
             outputs=[settings_status]
         )
     return interface
 # ===================================================================
+# MAIN - WITH QUEUE (CRITICAL FOR HF SPACES)
 # ===================================================================
 if __name__ == "__main__":
     print("🚀 Launching AI Research Agent on Hugging Face Spaces...")
     app = create_interface()
+    app.queue()  # ← THIS FIXES 99% of button issues on HF Spaces
+    app.launch()