Spaces:

leonsimon23
/

MedResearchAgent

Sleeping

App Files Files Community

leonsimon23 commited on Sep 10, 2025

Commit

5a53f4f

verified ·

1 Parent(s): 09d7a27

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -24

app.py CHANGED Viewed

@@ -13,6 +13,7 @@ translations = {
         "language_option": "English",
         "language_label": "Language",
         "results_title": "Search Results",
         "error_message": "An error occurred while fetching data from PubMed.",
         "no_results": "No articles found for the given query.",
         "col_index": "Index",
@@ -20,7 +21,7 @@ translations = {
         "col_abstract": "Abstract",
         "col_authors": "Authors",
         "col_link": "Link",
-        "spinner_searching": "Searching PubMed and fetching articles...",
         "spinner_translating": "Translating results to Chinese...",
         "translation_warning": "Could not translate an entry. Displaying original text."
     },
@@ -31,6 +32,7 @@ translations = {
         "language_option": "中文",
         "language_label": "语言",
         "results_title": "检索结果",
         "error_message": "从 PubMed 获取数据时出错。",
         "no_results": "未找到相关文献。",
         "col_index": "序号",
@@ -38,7 +40,7 @@ translations = {
         "col_abstract": "文献摘要",
         "col_authors": "文献作者",
         "col_link": "文献链接",
-        "spinner_searching": "正在检索 PubMed 并获取文献...",
         "spinner_translating": "正在将结果翻译成中文...",
         "translation_warning": "部分条目翻译失败，将显示原文。"
     }
@@ -47,10 +49,10 @@ translations = {
 def get_translation(lang, key):
     return translations[lang][key]
-@st.cache_data(ttl=3600)  # 缓存1小时，避免重复请求
 def search_pubmed(query, retmax=200):
     """
-    使用PubMed API进行检索
     """
     base_url = "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/"
     search_url = f"{base_url}esearch.fcgi?db=pubmed&term={query}&retmax={retmax}"
@@ -64,14 +66,15 @@ def search_pubmed(query, retmax=200):
         st.error(f"Error during PubMed ID search: {e}")
         return []
-@st.cache_data(ttl=3600) # 缓存1小时
-def fetch_articles(_id_list): # _id_list to indicate it's cached based on this value
     """
     根据ID列表获取文献详情
     """
     if not _id_list:
         return None
     base_url = "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/"
     ids = ",".join(_id_list)
     fetch_url = f"{base_url}efetch.fcgi?db=pubmed&id={ids}&rettype=xml"
     try:
@@ -117,7 +120,6 @@ def parse_articles(xml_data):
 def main():
     st.set_page_config(layout="wide", page_title="PubMed Search Tool")
-    # 语言选择
     lang = st.sidebar.radio(
         get_translation("en", "language_label") + " / " + get_translation("zh", "language_label"),
         ("en", "zh"),
@@ -125,48 +127,45 @@ def main():
     )
     st.title(get_translation(lang, "title"))
-    # 搜索框
     search_query = st.text_input("", placeholder=get_translation(lang, "search_placeholder"))
     if st.button(get_translation(lang, "search_button")):
         if search_query:
             with st.spinner(get_translation(lang, "spinner_searching")):
-                id_list = search_pubmed(search_query)
                 if id_list:
-                    xml_data = fetch_articles(tuple(id_list)) # Use tuple for caching
-                    if xml_data:
-                        articles = parse_articles(xml_data)
-                    else:
-                        articles = []
                 else:
                     articles = []
             if articles:
                 st.subheader(get_translation(lang, "results_title"))
                 df = pd.DataFrame(articles)
-                # 如果是中文，则进行翻译
                 if lang == 'zh':
                     with st.spinner(get_translation(lang, "spinner_translating")):
                         translator = Translator()
-                        # 创建一个新的DataFrame来存储翻译结果
                         df_translated = df.copy()
                         for index, row in df.iterrows():
                             try:
-                                # 翻译标题
                                 if row['Title'] != "No Title":
                                     df_translated.at[index, 'Title'] = translator.translate(row['Title'], dest='zh-cn').text
-                                # 翻译摘要
                                 if row['Abstract'] != "No Abstract":
                                     df_translated.at[index, 'Abstract'] = translator.translate(row['Abstract'], dest='zh-cn').text
                             except Exception:
-                                st.warning(get_translation(lang, "translation_warning"), icon="⚠️")
-                                # 如果翻译失败，保留原文
                                 continue
                         df = df_translated
                 df.index = range(1, len(df) + 1)
                 df.rename(columns={
                     "Title": get_translation(lang, "col_title"),
@@ -175,7 +174,6 @@ def main():
                     "Link": get_translation(lang, "col_link")
                 }, inplace=True)
                 df.index.name = get_translation(lang, "col_index")
                 st.dataframe(df)
             else:
                 st.warning(get_translation(lang, "no_results"))

         "language_option": "English",
         "language_label": "Language",
         "results_title": "Search Results",
+        "showing_results": "Showing {count} articles.",
         "error_message": "An error occurred while fetching data from PubMed.",
         "no_results": "No articles found for the given query.",
         "col_index": "Index",
         "col_abstract": "Abstract",
         "col_authors": "Authors",
         "col_link": "Link",
+        "spinner_searching": "Searching PubMed and fetching up to 200 articles...",
         "spinner_translating": "Translating results to Chinese...",
         "translation_warning": "Could not translate an entry. Displaying original text."
     },
         "language_option": "中文",
         "language_label": "语言",
         "results_title": "检索结果",
+        "showing_results": "共找到 {count} 篇文献。",
         "error_message": "从 PubMed 获取数据时出错。",
         "no_results": "未找到相关文献。",
         "col_index": "序号",
         "col_abstract": "文献摘要",
         "col_authors": "文献作者",
         "col_link": "文献链接",
+        "spinner_searching": "正在检索 PubMed 并获取最多 200 篇文献...",
         "spinner_translating": "正在将结果翻译成中文...",
         "translation_warning": "部分条目翻译失败，将显示原文。"
     }
 def get_translation(lang, key):
     return translations[lang][key]
+@st.cache_data(ttl=3600)
 def search_pubmed(query, retmax=200):
     """
+    使用PubMed API进行检索，并明确指定retmax
     """
     base_url = "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/"
     search_url = f"{base_url}esearch.fcgi?db=pubmed&term={query}&retmax={retmax}"
         st.error(f"Error during PubMed ID search: {e}")
         return []
+@st.cache_data(ttl=3600)
+def fetch_articles(_id_list):
     """
     根据ID列表获取文献详情
     """
     if not _id_list:
         return None
     base_url = "https://eutils.ncbi.nlm.nih.gov/entrez/eutils/"
+    # PubMed efetch有URL长度限制，分批获取更稳妥，但为简化，此处仍一次性获取
     ids = ",".join(_id_list)
     fetch_url = f"{base_url}efetch.fcgi?db=pubmed&id={ids}&rettype=xml"
     try:
 def main():
     st.set_page_config(layout="wide", page_title="PubMed Search Tool")
     lang = st.sidebar.radio(
         get_translation("en", "language_label") + " / " + get_translation("zh", "language_label"),
         ("en", "zh"),
     )
     st.title(get_translation(lang, "title"))
     search_query = st.text_input("", placeholder=get_translation(lang, "search_placeholder"))
     if st.button(get_translation(lang, "search_button")):
         if search_query:
             with st.spinner(get_translation(lang, "spinner_searching")):
+                # *** 关键修正点 ***
+                # 明确传入 retmax=200
+                id_list = search_pubmed(search_query, retmax=200)
                 if id_list:
+                    xml_data = fetch_articles(tuple(id_list))
+                    articles = parse_articles(xml_data) if xml_data else []
                 else:
                     articles = []
             if articles:
                 st.subheader(get_translation(lang, "results_title"))
+                st.info(get_translation(lang, "showing_results").format(count=len(articles)))
                 df = pd.DataFrame(articles)
                 if lang == 'zh':
                     with st.spinner(get_translation(lang, "spinner_translating")):
                         translator = Translator()
                         df_translated = df.copy()
                         for index, row in df.iterrows():
                             try:
                                 if row['Title'] != "No Title":
                                     df_translated.at[index, 'Title'] = translator.translate(row['Title'], dest='zh-cn').text
                                 if row['Abstract'] != "No Abstract":
                                     df_translated.at[index, 'Abstract'] = translator.translate(row['Abstract'], dest='zh-cn').text
                             except Exception:
+                                # 只警告一次
+                                if 'translation_warning_shown' not in st.session_state:
+                                    st.warning(get_translation(lang, "translation_warning"), icon="⚠️")
+                                    st.session_state.translation_warning_shown = True
                                 continue
                         df = df_translated
                 df.index = range(1, len(df) + 1)
                 df.rename(columns={
                     "Title": get_translation(lang, "col_title"),
                     "Link": get_translation(lang, "col_link")
                 }, inplace=True)
                 df.index.name = get_translation(lang, "col_index")
                 st.dataframe(df)
             else:
                 st.warning(get_translation(lang, "no_results"))