Spaces:

Zahid0123
/

Agentic-Rag-Hacktahon

Sleeping

App Files Files Community

Zahid0123 commited on Nov 21, 2025

Commit

4b0b53b

verified ·

1 Parent(s): 0452f80

Update app.py

Browse files

Files changed (1) hide show

app.py +73 -45

app.py CHANGED Viewed

@@ -48,7 +48,7 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 # ===================================================================
-# UTILITY CLASSES (unchanged)
 # ===================================================================
 class WebSearchTool:
@@ -111,7 +111,7 @@ class ConfigManager:
 # ===================================================================
-# DOCUMENT PROCESSING (unchanged)
 # ===================================================================
 class DocumentProcessor:
@@ -244,7 +244,7 @@ def build_embeddings_from_directory(data_directory: str, output_directory: str,
 # ===================================================================
-# RETRIEVER (unchanged)
 # ===================================================================
 class DocumentRetriever:
@@ -285,7 +285,7 @@ class DocumentRetriever:
 # ===================================================================
-# AGENTIC TOOLS (unchanged)
 # ===================================================================
 class AgenticTools:
@@ -455,7 +455,7 @@ class AgenticEvaluator:
 # ===================================================================
-# MAIN AGENT CLASS (unchanged except small fix for audio clear)
 # ===================================================================
 class AgenticRAGAgent:
@@ -492,8 +492,11 @@ class AgenticRAGAgent:
                 print(f"❌ Error: {e}")
     def clean_text_for_speech(self, text):
         if not text:
             return ""
         text = re.sub(r'\*\*([^*]+)\*\*', r'\1', text)
         text = re.sub(r'\*([^*]+)\*', r'\1', text)
         text = re.sub(r'^#{1,6}\s+', '', text, flags=re.MULTILINE)
@@ -502,24 +505,43 @@ class AgenticRAGAgent:
         text = re.sub(r'`([^`]+)`', r'\1', text)
         text = re.sub(r'^[\s]*[-*+•]\s+', '', text, flags=re.MULTILINE)
         text = re.sub(r'^[\s]*\d+\.\s+', '', text, flags=re.MULTILINE)
-        emoji_pattern = re.compile("[\U0001F600-\U0001F64F\U0001F300-\U0001F5FF\U0001F680-\U0001F6FF\U0001F1E0-\U0001F1FF\U00002702-\U000027B0\U000024C2-\U0001F251\U0001F900-\U0001F9FF\U00002600-\U000026FF\U00002700-\U000027BF]+")
         text = emoji_pattern.sub('', text)
         text = re.sub(r'\s+', ' ', text)
         text = re.sub(r'\n+', '. ', text)
         text = text.strip()
         text = re.sub(r'\.+', '.', text)
         return text
     def generate_audio_response(self, text):
         if not text or not GTTS_AVAILABLE:
             return None
         clean_text = self.clean_text_for_speech(text)
         if not clean_text:
             return None
         try:
             temp_dir = tempfile.gettempdir()
             timestamp = int(time.time())
             audio_file = os.path.join(temp_dir, f"response_{timestamp}.mp3")
             tts = gTTS(text=clean_text, lang='en', slow=False)
             tts.save(audio_file)
             return audio_file
@@ -538,11 +560,13 @@ class AgenticRAGAgent:
     def get_simple_answer(self, query, retrieved_docs):
         if not self.groq_client:
             return "Error: Groq API not configured"
         context = "\n\n".join([doc.get('content', str(doc)) for doc in retrieved_docs[:5]])
         prompt = f"""Based on this context, provide a clear answer.
 Context: {context}
 Question: {query}
 Answer:"""
         try:
             response = self.groq_client.chat.completions.create(
                 model="llama-3.1-8b-instant",
@@ -571,8 +595,10 @@ Answer:"""
                 progress(0.5, desc="Generating response...")
                 response = self.get_greeting_response(query)
                 chat_history.append({"role": "assistant", "content": response})
                 progress(0.8, desc="🔊 Generating voice...")
                 audio_file = self.generate_audio_response(response)
                 return chat_history, "", audio_file
             progress(0.1, desc="🧠 Planning...")
@@ -622,7 +648,7 @@ Answer:"""
             if self.synthesizer:
                 final_answer = self.synthesizer.synthesize_results(query, results, self.temperature, self.max_tokens)
             else:
-                successful = [r['result'] for r in results.values() if r.get("success")]
                 final_answer = f"Based on available info: {' '.join(map(str, successful))}"
             progress(0.9, desc="📊 Evaluating...")
@@ -654,7 +680,7 @@ Answer:"""
             return chat_history, "", audio_file
         except Exception as e:
-            mockery = f"❌ Error: {str(e)}"
             chat_history.append({"role": "assistant", "content": error})
             return chat_history, "", None
@@ -673,6 +699,7 @@ Answer:"""
                     dest = os.path.join("sample_data", original)
                     with open(dest, "wb") as dst:
                         dst.write(file.read())
                     uploaded.append(original)
             if not uploaded:
@@ -721,12 +748,12 @@ Answer:"""
 # ===================================================================
-# CREATE AGENT GLOBALLY + FIXED GRADIO INTERFACE
 # ===================================================================
-agent = AgenticRAGAgent()  # ← Important: global instance
 def create_interface():
     with gr.Blocks(title="🤖 AI Research Agent", theme=gr.themes.Soft()) as interface:
         gr.HTML("""
         <div style="text-align: center; padding: 20px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); border-radius: 15px;">
@@ -780,56 +807,57 @@ def create_interface():
                     gr.HTML(f"""
                     <div style="padding: 10px;">
                         <p><strong>Text-to-Speech (gTTS):</strong> {'✅ Available' if GTTS_AVAILABLE else '❌ Not Available'}</p>
-                        <p>< Urol><strong>Speech-to-Text:</strong> {'✅ Available' if STT_AVAILABLE else '❌ Not Available (HF Spaces limitation)'}</p>
                         <p><em>Voice output: Auto-plays with responses</em></p>
                     </div>
                     """)
-        # ===================== FIXED EVENT HANDLERS =====================
-        def respond(message, history):
-            return agent.process_agentic_query(message, history)
-        submit_btn.click(
-            fn=respond,
-            inputs=[msg, chatbot],
-            outputs=[chatbot, msg, audio_output],
-            concurrency_limit=1
-        )
-        msg.submit(
-            fn=respond,
-            inputs=[msg, chatbot],
-            outputs=[chatbot, msg, audio_output],
-            concurrency_limit=1
-        )
-        clear_btn.click(
-            lambda: ([], None),
-            outputs=[chatbot, audio_output]
-        )
-        file_upload.change(
-            fn=agent.upload_documents,
-            inputs=[file_upload],
-            outputs=[upload_status]
-        )
         apply_btn.click(
-            fn=agent.update_settings,
-            inputs=[temperature_slider, max_tokens_slider, chunk_size_slider,
-                    chunk_overlap_slider, retrieval_k_slider, enable_web,
-                    enable_calc, enable_fact, enable_analysis],
             outputs=[settings_status]
         )
     return interface
 # ===================================================================
-# MAIN - WITH QUEUE (CRITICAL FOR HF SPACES)
 # ===================================================================
 if __name__ == "__main__":
     print("🚀 Launching AI Research Agent on Hugging Face Spaces...")
     app = create_interface()
-    app.queue()  # ← THIS FIXES 99% of button issues on HF Spaces
-    app.launch()

 logger = logging.getLogger(__name__)
 # ===================================================================
+# UTILITY CLASSES
 # ===================================================================
 class WebSearchTool:
 # ===================================================================
+# DOCUMENT PROCESSING
 # ===================================================================
 class DocumentProcessor:
 # ===================================================================
+# RETRIEVER
 # ===================================================================
 class DocumentRetriever:
 # ===================================================================
+# AGENTIC TOOLS
 # ===================================================================
 class AgenticTools:
 # ===================================================================
+# MAIN AGENT CLASS
 # ===================================================================
 class AgenticRAGAgent:
                 print(f"❌ Error: {e}")
     def clean_text_for_speech(self, text):
+        """Clean text for TTS"""
         if not text:
             return ""
+        # Remove markdown formatting
         text = re.sub(r'\*\*([^*]+)\*\*', r'\1', text)
         text = re.sub(r'\*([^*]+)\*', r'\1', text)
         text = re.sub(r'^#{1,6}\s+', '', text, flags=re.MULTILINE)
         text = re.sub(r'`([^`]+)`', r'\1', text)
         text = re.sub(r'^[\s]*[-*+•]\s+', '', text, flags=re.MULTILINE)
         text = re.sub(r'^[\s]*\d+\.\s+', '', text, flags=re.MULTILINE)
+        # Remove emojis
+        emoji_pattern = re.compile(
+            "["
+            "\U0001F600-\U0001F64F"
+            "\U0001F300-\U0001F5FF"
+            "\U0001F680-\U0001F6FF"
+            "\U0001F1E0-\U0001F1FF"
+            "\U00002702-\U000027B0"
+            "\U000024C2-\U0001F251"
+            "\U0001F900-\U0001F9FF"
+            "\U00002600-\U000026FF"
+            "\U00002700-\U000027BF"
+            "]+"
+        )
         text = emoji_pattern.sub('', text)
         text = re.sub(r'\s+', ' ', text)
         text = re.sub(r'\n+', '. ', text)
         text = text.strip()
         text = re.sub(r'\.+', '.', text)
         return text
     def generate_audio_response(self, text):
+        """Generate audio using gTTS"""
         if not text or not GTTS_AVAILABLE:
             return None
         clean_text = self.clean_text_for_speech(text)
         if not clean_text:
             return None
         try:
             temp_dir = tempfile.gettempdir()
             timestamp = int(time.time())
             audio_file = os.path.join(temp_dir, f"response_{timestamp}.mp3")
             tts = gTTS(text=clean_text, lang='en', slow=False)
             tts.save(audio_file)
             return audio_file
     def get_simple_answer(self, query, retrieved_docs):
         if not self.groq_client:
             return "Error: Groq API not configured"
         context = "\n\n".join([doc.get('content', str(doc)) for doc in retrieved_docs[:5]])
         prompt = f"""Based on this context, provide a clear answer.
 Context: {context}
 Question: {query}
 Answer:"""
         try:
             response = self.groq_client.chat.completions.create(
                 model="llama-3.1-8b-instant",
                 progress(0.5, desc="Generating response...")
                 response = self.get_greeting_response(query)
                 chat_history.append({"role": "assistant", "content": response})
                 progress(0.8, desc="🔊 Generating voice...")
                 audio_file = self.generate_audio_response(response)
                 return chat_history, "", audio_file
             progress(0.1, desc="🧠 Planning...")
             if self.synthesizer:
                 final_answer = self.synthesizer.synthesize_results(query, results, self.temperature, self.max_tokens)
             else:
+                successful = [r['result'] for r in results.values() if r.get('success')]
                 final_answer = f"Based on available info: {' '.join(map(str, successful))}"
             progress(0.9, desc="📊 Evaluating...")
             return chat_history, "", audio_file
         except Exception as e:
+            error = f"❌ Error: {str(e)}"
             chat_history.append({"role": "assistant", "content": error})
             return chat_history, "", None
                     dest = os.path.join("sample_data", original)
                     with open(dest, "wb") as dst:
                         dst.write(file.read())
                     uploaded.append(original)
             if not uploaded:
 # ===================================================================
+# GRADIO INTERFACE (COMPATIBLE WITH GRADIO 4.27)
 # ===================================================================
 def create_interface():
+    agent = AgenticRAGAgent()
     with gr.Blocks(title="🤖 AI Research Agent", theme=gr.themes.Soft()) as interface:
         gr.HTML("""
         <div style="text-align: center; padding: 20px; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); border-radius: 15px;">
                     gr.HTML(f"""
                     <div style="padding: 10px;">
                         <p><strong>Text-to-Speech (gTTS):</strong> {'✅ Available' if GTTS_AVAILABLE else '❌ Not Available'}</p>
+                        <p><strong>Speech-to-Text:</strong> {'✅ Available' if STT_AVAILABLE else '❌ Not Available (HF Spaces limitation)'}</p>
                         <p><em>Voice output: Auto-plays with responses</em></p>
                     </div>
                     """)
+        # -----------------------------
+        # Event Handlers (Sync wrapper for async)
+        # -----------------------------
+        def process_msg(message, history):
+            import asyncio
+            try:
+                loop = asyncio.get_event_loop()
+                if loop.is_running():
+                    future = asyncio.run_coroutine_threadsafe(agent.process_agentic_query(message, history), loop)
+                    return future.result()
+                else:
+                    return loop.run_until_complete(agent.process_agentic_query(message, history))
+            except RuntimeError:
+                return asyncio.run(agent.process_agentic_query(message, history))
+        submit_btn.click(process_msg, inputs=[msg, chatbot], outputs=[chatbot, msg, audio_output])
+        msg.submit(process_msg, inputs=[msg, chatbot], outputs=[chatbot, msg, audio_output])
+        clear_btn.click(lambda: [], outputs=[chatbot])
+        file_upload.change(agent.upload_documents, inputs=[file_upload], outputs=[upload_status])
         apply_btn.click(
+            agent.update_settings,
+            inputs=[
+                temperature_slider, max_tokens_slider, chunk_size_slider,
+                chunk_overlap_slider, retrieval_k_slider, enable_web,
+                enable_calc, enable_fact, enable_analysis
+            ],
             outputs=[settings_status]
         )
     return interface
 # ===================================================================
+# MAIN
 # ===================================================================
 if __name__ == "__main__":
     print("🚀 Launching AI Research Agent on Hugging Face Spaces...")
+    print("✨ Features:")
+    print("   • Multi-Tool Integration")
+    print("   • Intelligent Query Planning")
+    print("   • Multi-Step Reasoning")
+    print("   • Result Synthesis")
+    print("   • Quality Evaluation")
+    print("   • 🔊 Voice Output (Text-to-Speech)")
     app = create_interface()
+    app.launch()