Spaces:

maria355
/

RAG-Documents-Translator

Sleeping

App Files Files Community

maria355 commited on May 11, 2025

Commit

f4bbb80

verified ·

1 Parent(s): 82e7c99

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -85

app.py CHANGED Viewed

@@ -10,17 +10,16 @@ import requests
 from deep_translator import GoogleTranslator
 from gtts import gTTS
 import time
-# Set page config for better appearance
 st.set_page_config(
     page_title="RAG Document Assistant",
     page_icon="📄",
     layout="wide",
     initial_sidebar_state="expanded"
 )
-print('---------------------------------')
-# Sidebar profile function
 def sidebar_profiles():
-    st.sidebar.markdown("""<hr>""", unsafe_allow_html=True)  # Add line before author name
     st.sidebar.markdown("### 🎉Author: Maria Nadeem🌟")
     st.sidebar.markdown("### 🔗 Connect With Me")
     st.sidebar.markdown("""
@@ -42,32 +41,24 @@ def sidebar_profiles():
     <hr>
     """, unsafe_allow_html=True)
-# API Key Management with better error handling
 def get_api_key():
-    # First try to get from environment
     api_key = os.getenv("GROQ_API_KEY")
-    # If not in environment, try to get from session state or let user input it
     if not api_key:
         if "GROQ_API_KEY" in st.session_state:
             api_key = st.session_state["GROQ_API_KEY"]
     return api_key
-# Initialize session state variables if they don't exist
-if "chunks" not in st.session_state:
-    st.session_state.chunks = []
-if "chunk_sources" not in st.session_state:
-    st.session_state.chunk_sources = []
-if "debug_mode" not in st.session_state:
-    st.session_state.debug_mode = False
-if "last_query_time" not in st.session_state:
-    st.session_state.last_query_time = None
-if "last_response" not in st.session_state:
-    st.session_state.last_response = None
-# Setup
 @st.cache_resource
 def load_embedder():
     return SentenceTransformer("all-MiniLM-L6-v2")
@@ -75,11 +66,8 @@ def load_embedder():
 embedder = load_embedder()
 embedding_dim = 384
 index = faiss.IndexFlatL2(embedding_dim)
-translated_text = GoogleTranslator(source='auto', target='fr').translate(text)
-result = GoogleTranslator(source='auto', target='fr').translate(text)
 tokenizer = tiktoken.get_encoding("cl100k_base")
-# Utilities
 def num_tokens_from_string(string: str) -> int:
     return len(tokenizer.encode(string))
@@ -89,11 +77,11 @@ def chunk_text(text, max_tokens=250):
     total_tokens = 0
     result_chunks = []
     for sentence in sentences:
-        if not sentence.strip():  # Skip empty sentences
             continue
         token_len = num_tokens_from_string(sentence)
         if total_tokens + token_len > max_tokens:
-            if current_chunk:  # Only add if there's content
                 result_chunks.append(". ".join(current_chunk) + ("." if not current_chunk[-1].endswith(".") else ""))
             current_chunk = [sentence]
             total_tokens = token_len
@@ -112,22 +100,19 @@ def extract_text_from_pdf(pdf_file):
     return text
 def index_uploaded_text(text):
-    # Reset the index and chunks
     global index
     index = faiss.IndexFlatL2(embedding_dim)
     st.session_state.chunks = []
     st.session_state.chunk_sources = []
-    # Process text into chunks
     chunks_list = chunk_text(text)
     st.session_state.chunks = chunks_list
-    # Create source references and vectors
     for i, chunk in enumerate(chunks_list):
         st.session_state.chunk_sources.append(f"Chunk {i+1}: {chunk[:50]}...")
         vector = embedder.encode([chunk])[0]
         index.add(np.array([vector]).astype('float32'))
     return len(chunks_list)
 def retrieve_chunks(query, top_k=5):
@@ -151,18 +136,13 @@ Answer: Please provide a comprehensive answer based only on the context provided
 def generate_answer(prompt):
     api_key = get_api_key()
     if not api_key:
         return "API key is missing. Please set the GROQ_API_KEY environment variable or enter it in the sidebar."
     headers = {
-        "Authorization": f"Bearer {api_key.strip()}",  # Strip to remove any whitespace
         "Content-Type": "application/json"
     }
-    # Use the model selected by the user, default to llama3-8b if none selected
     selected_model = st.session_state.get("MODEL_CHOICE", "llama3-8b-8192")
     payload = {
         "model": selected_model,
         "messages": [
@@ -172,7 +152,6 @@ def generate_answer(prompt):
         "temperature": 0.3,
         "max_tokens": 1024
     }
     try:
         start_time = time.time()
         with st.spinner("Sending request to Groq API..."):
@@ -182,65 +161,33 @@ def generate_answer(prompt):
                 headers=headers,
                 timeout=30
             )
         query_time = time.time() - start_time
         st.session_state.last_query_time = f"{query_time:.2f} seconds"
-        # For debugging - show only status code when debug mode is enabled
-        if st.session_state.debug_mode:
-            st.write(f"API Response Status Code: {response.status_code}")
-            st.write(f"Response time: {query_time:.2f} seconds")
         if response.status_code == 401:
-            return "Authentication failed: The API key appears to be invalid or expired. Please check your API key."
         if response.status_code == 400:
-            # Display the detailed error for 400 Bad Request
             error_info = response.json().get("error", {})
             error_message = error_info.get("message", "Unknown error")
-            error_type = error_info.get("type", "Unknown type")
-            # Try alternate model if model not found
-            if "model not found" in error_message.lower() or "model_not_found" in error_type.lower():
-                st.warning("Trying with an alternate model (llama3-8b-8192)...")
                 payload["model"] = "llama3-8b-8192"
-                response = requests.post(
-                    "https://api.groq.com/openai/v1/chat/completions",
-                    json=payload,
-                    headers=headers,
-                    timeout=30
-                )
                 if response.status_code != 200:
-                    return f"Both model attempts failed. Please check the available models for your Groq API key. Error: {error_message}"
             else:
                 return f"API Error: {error_message}"
-        response.raise_for_status()  # Raises an HTTPError for other bad responses
         response_json = response.json()
-        if "choices" not in response_json:
-            error_msg = f"Unexpected API response format. Response: {response_json}"
-            if "error" in response_json:
-                error_msg = f"API Error: {response_json['error'].get('message', 'Unknown error')}"
-            st.error(error_msg)
-            return "Sorry, I couldn't retrieve an answer due to an API error."
-        if not response_json["choices"]:
             return "No answer was generated."
         answer = response_json["choices"][0]["message"]["content"]
         st.session_state.last_response = answer
         return answer
     except requests.exceptions.RequestException as e:
-        st.error(f"API request failed: {str(e)}")
-        return f"Sorry, I couldn't connect to the API service. Error: {str(e)}"
     except Exception as e:
-        st.error(f"Unexpected error: {str(e)}")
-        return f"Sorry, something went wrong. Error: {str(e)}"
 def translate_text(text, target_language):
     try:
@@ -248,7 +195,7 @@ def translate_text(text, target_language):
             return GoogleTranslator(source='auto', target=target_language).translate(text)
     except Exception as e:
         st.error(f"Translation failed: {str(e)}")
-        return text  # Return original text if translation fails
 def text_to_speech(text, lang_code):
     try:
@@ -260,7 +207,6 @@ def text_to_speech(text, lang_code):
     except Exception as e:
         st.error(f"Text-to-speech failed: {str(e)}")
         return None
 # Streamlit UI
 st.title("📄 Task-Specific RAG Assistant")
 st.markdown("Upload a document and ask questions to get AI-powered answers with translation capabilities.")

 from deep_translator import GoogleTranslator
 from gtts import gTTS
 import time
 st.set_page_config(
     page_title="RAG Document Assistant",
     page_icon="📄",
     layout="wide",
     initial_sidebar_state="expanded"
 )
 def sidebar_profiles():
+    st.sidebar.markdown("""<hr>""", unsafe_allow_html=True)
     st.sidebar.markdown("### 🎉Author: Maria Nadeem🌟")
     st.sidebar.markdown("### 🔗 Connect With Me")
     st.sidebar.markdown("""
     <hr>
     """, unsafe_allow_html=True)
 def get_api_key():
     api_key = os.getenv("GROQ_API_KEY")
     if not api_key:
         if "GROQ_API_KEY" in st.session_state:
             api_key = st.session_state["GROQ_API_KEY"]
     return api_key
+# Session state initialization
+for key, default in {
+    "chunks": [],
+    "chunk_sources": [],
+    "debug_mode": False,
+    "last_query_time": None,
+    "last_response": None
+}.items():
+    if key not in st.session_state:
+        st.session_state[key] = default
 @st.cache_resource
 def load_embedder():
     return SentenceTransformer("all-MiniLM-L6-v2")
 embedder = load_embedder()
 embedding_dim = 384
 index = faiss.IndexFlatL2(embedding_dim)
 tokenizer = tiktoken.get_encoding("cl100k_base")
 def num_tokens_from_string(string: str) -> int:
     return len(tokenizer.encode(string))
     total_tokens = 0
     result_chunks = []
     for sentence in sentences:
+        if not sentence.strip():
             continue
         token_len = num_tokens_from_string(sentence)
         if total_tokens + token_len > max_tokens:
+            if current_chunk:
                 result_chunks.append(". ".join(current_chunk) + ("." if not current_chunk[-1].endswith(".") else ""))
             current_chunk = [sentence]
             total_tokens = token_len
     return text
 def index_uploaded_text(text):
     global index
     index = faiss.IndexFlatL2(embedding_dim)
     st.session_state.chunks = []
     st.session_state.chunk_sources = []
     chunks_list = chunk_text(text)
     st.session_state.chunks = chunks_list
     for i, chunk in enumerate(chunks_list):
         st.session_state.chunk_sources.append(f"Chunk {i+1}: {chunk[:50]}...")
         vector = embedder.encode([chunk])[0]
         index.add(np.array([vector]).astype('float32'))
     return len(chunks_list)
 def retrieve_chunks(query, top_k=5):
 def generate_answer(prompt):
     api_key = get_api_key()
     if not api_key:
         return "API key is missing. Please set the GROQ_API_KEY environment variable or enter it in the sidebar."
     headers = {
+        "Authorization": f"Bearer {api_key.strip()}",
         "Content-Type": "application/json"
     }
     selected_model = st.session_state.get("MODEL_CHOICE", "llama3-8b-8192")
     payload = {
         "model": selected_model,
         "messages": [
         "temperature": 0.3,
         "max_tokens": 1024
     }
     try:
         start_time = time.time()
         with st.spinner("Sending request to Groq API..."):
                 headers=headers,
                 timeout=30
             )
         query_time = time.time() - start_time
         st.session_state.last_query_time = f"{query_time:.2f} seconds"
         if response.status_code == 401:
+            return "Authentication failed: Invalid or expired API key."
         if response.status_code == 400:
             error_info = response.json().get("error", {})
             error_message = error_info.get("message", "Unknown error")
+            if "model not found" in error_message.lower():
+                st.warning("Trying with alternate model...")
                 payload["model"] = "llama3-8b-8192"
+                response = requests.post("https://api.groq.com/openai/v1/chat/completions", json=payload, headers=headers)
                 if response.status_code != 200:
+                    return f"Both model attempts failed. Error: {error_message}"
             else:
                 return f"API Error: {error_message}"
+        response.raise_for_status()
         response_json = response.json()
+        if "choices" not in response_json or not response_json["choices"]:
             return "No answer was generated."
         answer = response_json["choices"][0]["message"]["content"]
         st.session_state.last_response = answer
         return answer
     except requests.exceptions.RequestException as e:
+        return f"API request failed: {str(e)}"
     except Exception as e:
+        return f"Unexpected error: {str(e)}"
 def translate_text(text, target_language):
     try:
             return GoogleTranslator(source='auto', target=target_language).translate(text)
     except Exception as e:
         st.error(f"Translation failed: {str(e)}")
+        return text
 def text_to_speech(text, lang_code):
     try:
     except Exception as e:
         st.error(f"Text-to-speech failed: {str(e)}")
         return None
 # Streamlit UI
 st.title("📄 Task-Specific RAG Assistant")
 st.markdown("Upload a document and ask questions to get AI-powered answers with translation capabilities.")