Spaces:

sathvikk
/

wikitrial

Sleeping

App Files Files Community

sathvikk commited on Jul 4, 2025

Commit

b396118

verified ·

1 Parent(s): bd27fc9

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +51 -54

src/streamlit_app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import os
-os.environ["HOME"] = "/tmp"  # Fix for Hugging Face Spaces
 import streamlit as st
 import requests
@@ -10,7 +10,7 @@ st.set_page_config(page_title="WikiTrail", layout="wide")
 st.title("📚 WikiTrail")
 st.markdown("Explore Wikipedia topics visually and get a summarized journey.")
-# Language options
 languages = {
     "English": "en",
     "Hindi (हिन्दी)": "hi",
@@ -20,37 +20,35 @@ languages = {
 lang_name = st.selectbox("🌐 Select Language", list(languages.keys()))
 lang_code = languages[lang_name]
-# Input
-topic_input = st.text_input("🔍 Enter a topic (in English)", placeholder="e.g., India, Telangana, Mahatma Gandhi")
 topic_input = topic_input.strip()
-# 🔍 Fix: Get best matching title or fallback
 def get_translated_title(query, lang):
-    search_url = f"https://{lang}.wikipedia.org/w/api.php"
-    params = {
-        "action": "query",
-        "list": "search",
-        "srsearch": query,
-        "format": "json",
-        "origin": "*"
-    }
     try:
         res = requests.get(search_url, params=params)
         res.raise_for_status()
         data = res.json()
-        search_results = data.get("query", {}).get("search", [])
-        if search_results:
-            return search_results[0]["title"]
-        return query  # fallback
     except:
-        return query  # fallback
-# Summary API
 def fetch_summary(title, lang):
-    safe_title = urllib.parse.quote(title.replace(" ", "_"))
-    url = f"https://{lang}.wikipedia.org/api/rest_v1/page/summary/{safe_title}"
     res = requests.get(url)
     if res.status_code == 200:
         data = res.json()
@@ -61,58 +59,58 @@ def fetch_summary(title, lang):
         }
     return None
-# Related Topics
 def fetch_related(title, lang):
-    safe_title = urllib.parse.quote(title.replace(" ", "_"))
-    url = f"https://{lang}.wikipedia.org/w/api.php?action=query&format=json&origin=*&titles={safe_title}&prop=links&pllimit=5"
     res = requests.get(url)
     if res.status_code == 200:
         data = res.json()
-        pages = list(data['query']['pages'].values())
-        if pages and 'links' in pages[0]:
-            return [link['title'] for link in pages[0]['links']]
     return []
-# Simple Summary
-def summarize_bullets(texts, limit=3):
-    full_text = ' '.join(set(texts))
-    sentences = full_text.replace('।', '.').replace('?', '.').replace('!', '.').split('.')
     clean = [s.strip() for s in sentences if s.strip()]
     return ["• " + s + "." for s in clean[:limit]] if clean else ["No summary available."]
-# ✅ Main logic
 if topic_input:
     with st.spinner("🔍 Searching Wikipedia..."):
         summaries = []
-        final_text = ""
-        translated_title = get_translated_title(topic_input, lang_code)
-        st.caption(f"📄 Fetched title: {translated_title}")  # Debug info
-        main = fetch_summary(translated_title, lang_code)
         if not main:
             st.error(f"No matching page found in {lang_name} for '{topic_input}'")
             st.stop()
         st.subheader("🔷 Main Topic")
-        summaries.append(main["summary"])
-        final_text += f"📚 {main['title']} - {lang_name} Wikipedia Summary\n\n"
-        final_text += main["summary"] + "\n\n"
         st.markdown(f"### {main['title']}")
         st.write(main["summary"])
         st.markdown(f"[Read More →]({main['link']})", unsafe_allow_html=True)
         st.subheader("🔗 Related Topics")
-        related_titles = fetch_related(translated_title, lang_code)
-        if related_titles:
-            for title in related_titles:
-                data = fetch_summary(title, lang_code)
-                if data and data["summary"] not in summaries:
-                    summaries.append(data["summary"])
-                    final_text += f"🔗 {data['title']}\n{data['summary']}\n\n"
-                    with st.expander(data["title"]):
-                        st.write(data["summary"])
-                        st.markdown(f"[Read More →]({data['link']})", unsafe_allow_html=True)
         else:
             st.info("No related topics found.")
@@ -120,10 +118,9 @@ if topic_input:
         for bullet in summarize_bullets(summaries):
             st.markdown(bullet)
-        # 📥 Download
         st.download_button(
-            label="📥 Download Summary as TXT",
-            data=final_text,
             file_name=f"{main['title']}_summary.txt",
             mime="text/plain"
         )

 import os
+os.environ["HOME"] = "/tmp"  # ✅ Fix streamlit write permission on Hugging Face
 import streamlit as st
 import requests
 st.title("📚 WikiTrail")
 st.markdown("Explore Wikipedia topics visually and get a summarized journey.")
+# 🌐 Language options
 languages = {
     "English": "en",
     "Hindi (हिन्दी)": "hi",
 lang_name = st.selectbox("🌐 Select Language", list(languages.keys()))
 lang_code = languages[lang_name]
+# 🔍 Topic input
+topic_input = st.text_input("🔍 Enter a topic (in English)", placeholder="e.g., India, Telangana, Gandhi")
 topic_input = topic_input.strip()
+# 🔧 Get title (fallbacks if search fails)
 def get_translated_title(query, lang):
     try:
+        search_url = f"https://{lang}.wikipedia.org/w/api.php"
+        params = {
+            "action": "query",
+            "list": "search",
+            "srsearch": query,
+            "format": "json",
+            "origin": "*"
+        }
         res = requests.get(search_url, params=params)
         res.raise_for_status()
         data = res.json()
+        results = data.get("query", {}).get("search", [])
+        if results:
+            return results[0]["title"]
+        return query
     except:
+        return query
+# 🔍 Summary fetch
 def fetch_summary(title, lang):
+    title_encoded = urllib.parse.quote(title.replace(" ", "_"))
+    url = f"https://{lang}.wikipedia.org/api/rest_v1/page/summary/{title_encoded}"
     res = requests.get(url)
     if res.status_code == 200:
         data = res.json()
         }
     return None
+# 🔗 Related links
 def fetch_related(title, lang):
+    title_encoded = urllib.parse.quote(title.replace(" ", "_"))
+    url = f"https://{lang}.wikipedia.org/w/api.php?action=query&format=json&origin=*&titles={title_encoded}&prop=links&pllimit=5"
     res = requests.get(url)
     if res.status_code == 200:
         data = res.json()
+        pages = list(data["query"]["pages"].values())
+        if pages and "links" in pages[0]:
+            return [link["title"] for link in pages[0]["links"]]
     return []
+# 🧠 Bullet summary
+def summarize_bullets(summaries, limit=3):
+    full = ' '.join(set(summaries))
+    sentences = full.replace("।", ".").replace("!", ".").replace("?", ".").split(".")
     clean = [s.strip() for s in sentences if s.strip()]
     return ["• " + s + "." for s in clean[:limit]] if clean else ["No summary available."]
+# 🔍 Main logic
 if topic_input:
     with st.spinner("🔍 Searching Wikipedia..."):
+        all_text = ""
         summaries = []
+        title = get_translated_title(topic_input, lang_code)
+        st.caption(f"📄 Fetched title: {title}")
+        main = fetch_summary(title, lang_code)
         if not main:
             st.error(f"No matching page found in {lang_name} for '{topic_input}'")
             st.stop()
         st.subheader("🔷 Main Topic")
         st.markdown(f"### {main['title']}")
         st.write(main["summary"])
         st.markdown(f"[Read More →]({main['link']})", unsafe_allow_html=True)
+        summaries.append(main["summary"])
+        all_text += f"{main['title']} ({lang_name})\n\n{main['summary']}\n\n"
         st.subheader("🔗 Related Topics")
+        related = fetch_related(title, lang_code)
+        if related:
+            for r in related:
+                sub = fetch_summary(r, lang_code)
+                if sub and sub["summary"] not in summaries:
+                    summaries.append(sub["summary"])
+                    all_text += f"{sub['title']}\n{sub['summary']}\n\n"
+                    with st.expander(sub["title"]):
+                        st.write(sub["summary"])
+                        st.markdown(f"[Read More →]({sub['link']})", unsafe_allow_html=True)
         else:
             st.info("No related topics found.")
         for bullet in summarize_bullets(summaries):
             st.markdown(bullet)
         st.download_button(
+            label="📥 Download Summary",
+            data=all_text,
             file_name=f"{main['title']}_summary.txt",
             mime="text/plain"
         )