Spaces:

JJS341
/

Coreference-Bot

Sleeping

App Files Files Community

JJS341 commited on May 28

Commit

75183ac

verified ·

1 Parent(s): 5bcbec9

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -14

app.py CHANGED Viewed

@@ -37,48 +37,64 @@ def coref_chat(user_input):
         return "請輸入內容", "等待輸入..."
     try:
-        # 1. 偵測語系並統一轉換為英文供模型運算
         has_chinese = any('\u4e00' <= char <= '\u9fff' for char in user_input)
         if has_chinese:
             working_text = GoogleTranslator(source='zh-CN', target='en').translate(user_input)
-            mode_notice = "【模式：中文 ➔ 英文解析】"
         else:
             working_text = user_input
-            mode_notice = "【模式：純英文解析】"
         # 2. 執行指代消解
         preds = model.predict(texts=[working_text])
         clusters = preds[0].get_clusters()
-        # 3. 整理輸出格式 (嚴格按照你的要求排版)
         result = f"✨ {mode_notice}\n"
         result += f"📝 英文邏輯空間: {working_text}\n"
-        # --- 英文翻譯中文 ---
         try:
             translation_back = GoogleTranslator(source='en', target='zh-TW').translate(working_text)
-            result += f"📖 中文句子: {translation_back}\n"
         except:
-            result += f"📖 中文句子: (翻譯暫時無法讀取)\n"
         result += "---------------------------------\n"
         if not clusters:
-            result += "🔍 分析結果：指代關係明確，或模型判定關聯度未達門檻。"
         else:
             result += "🎯【偵測到之實體鏈 (Entity Chains)】:\n"
             for i, cluster in enumerate(clusters):
                 cluster_str_en = ' ↔ '.join(cluster)
-                # 實體鏈個別翻譯
                 try:
                     translated_items = [GoogleTranslator(source='en', target='zh-TW').translate(item) for item in cluster]
                     cluster_str_zh = ' ↔ '.join(translated_items)
                 except:
-                    cluster_str_zh = "(鏈結翻譯失敗)"
                 result += f" 🔗 鏈結 {i+1} (繁中): {cluster_str_zh}\n"
-                result += f"    └─ (原文): {cluster_str_en}\n"
         return user_input, result

         return "請輸入內容", "等待輸入..."
     try:
+        # 1. 跨語言橋接
         has_chinese = any('\u4e00' <= char <= '\u9fff' for char in user_input)
         if has_chinese:
             working_text = GoogleTranslator(source='zh-CN', target='en').translate(user_input)
+            mode_notice = "【模式：中文輸入 ➔ 多維度 AI 學習系統】"
         else:
             working_text = user_input
+            mode_notice = "【模式：英文原語 ➔ 多維度 AI 學習系統】"
         # 2. 執行指代消解
         preds = model.predict(texts=[working_text])
         clusters = preds[0].get_clusters()
+        # 3. 建立基礎報告排版
         result = f"✨ {mode_notice}\n"
         result += f"📝 英文邏輯空間: {working_text}\n"
         try:
             translation_back = GoogleTranslator(source='en', target='zh-TW').translate(working_text)
+            result += f"📖 英翻中結果: {translation_back}\n"
         except:
+            pass
         result += "---------------------------------\n"
+        # 4. ✨ 新增：智慧學單字功能 (從實體鏈中自動提取核心單字) ✨
+        if clusters:
+            result += "📚【AI 智慧單字卡 / Vocabulary Cards】\n"
+            extracted_words = set()
+            # 抓取實體鏈裡的所有單字
+            for cluster in clusters:
+                for item in cluster:
+                    # 清理冠詞 (the, a, her 等)，只留下核心單字
+                    clean_word = item.lower().replace("the ", "").replace("a ", "").replace("her ", "").replace("his ", "").strip()
+                    if len(clean_word) > 2 and clean_word not in ['she', 'he', 'him', 'her', 'it', 'they']:
+                        extracted_words.add(clean_word)
+            # 翻譯單字並製作卡片
+            for word in extracted_words:
+                try:
+                    word_zh = GoogleTranslator(source='en', target='zh-TW').translate(word)
+                    result += f" 💡 單字: {word:<12} ➔ 中文釋義: {word_zh}\n"
+                except:
+                    pass
+            result += "---------------------------------\n"
+        # 5. 輸出實體鏈
         if not clusters:
+            result += "🔍 分析結果：指代關係明確，無需額外消解。"
         else:
             result += "🎯【偵測到之實體鏈 (Entity Chains)】:\n"
             for i, cluster in enumerate(clusters):
                 cluster_str_en = ' ↔ '.join(cluster)
                 try:
                     translated_items = [GoogleTranslator(source='en', target='zh-TW').translate(item) for item in cluster]
                     cluster_str_zh = ' ↔ '.join(translated_items)
                 except:
+                    cluster_str_zh = cluster_str_en
                 result += f" 🔗 鏈結 {i+1} (繁中): {cluster_str_zh}\n"
         return user_input, result