SentimentAnalyzerFinbert

Sleeping

App Files Files Community

KYTHY commited on Nov 15, 2025

Commit

f83555e

verified ·

1 Parent(s): 06006a5

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -22

app.py CHANGED Viewed

@@ -73,28 +73,47 @@ def analyze_text(text):
     return float(score)
 def summarize_texts(news_texts):
-    """สรุปข่าวแต่ละข่าว 1 พารากราฟ"""
     summaries = []
-    for text in news_texts:
         if not text.strip():
             summaries.append("")
-            continue
-        try:
-            summary = summarizer(text, max_length=100, min_length=30, do_sample=False)[0]["summary_text"]
-            summaries.append(summary)
-        except:
-            summaries.append(text)  # fallback ถ้าโมเดลล้ม
     return summaries
 def summarize_themes(news_texts):
-    """สรุปธีมข่าวด้วย Zero-shot classification"""
     themes = []
-    for text in news_texts:
         if not text.strip():
             themes.append("Unknown")
-            continue
-        result = theme_classifier(text, candidate_labels)
-        themes.append(result["labels"][0])
     return themes
 # --------------------------
@@ -219,10 +238,14 @@ def main():
     news_df["sentiment"] = news_df["text"].apply(analyze_text)
     news_df["date"] = pd.to_datetime(news_df["date"])
-    # สรุปข่าวเป็น 1 พารากราฟ
     st.info("กำลังสรุปเนื้อหาข่าว...")
     news_df["text"] = summarize_texts(news_df["text"].tolist())
     # Metrics
     avg_sentiment = news_df["sentiment"].mean()
     pos_pct = (news_df["sentiment"] > 0.1).mean() * 100
@@ -233,14 +256,6 @@ def main():
     col2.metric("ข่าวเชิงบวก", f"{pos_pct:.1f}%")
     col3.metric("ข่าวเชิงลบ", f"{neg_pct:.1f}%")
-    # ธีมข่าว
-    st.subheader("📰 ธีมข่าว (Top Theme per Article)")
-    news_df["theme"] = summarize_themes(news_df["text"].tolist())
-    theme_counts = news_df["theme"].value_counts()
-    st.bar_chart(theme_counts)
-    # ... ส่วนกราฟ Sentiment & Price เหมือนเดิม (ข้ามตรงนี้เพื่อไม่ให้ยาวเกินไป) ...
     # แสดงรายการข่าว
     st.subheader("📰 รายการข่าวทั้งหมด")
     st.dataframe(news_df[["date", "source", "text", "sentiment", "theme", "url"]], use_container_width=True)

     return float(score)
 def summarize_texts(news_texts):
+    """สรุปข่าวแต่ละข่าว 1 พารากราฟ พร้อม progress bar"""
     summaries = []
+    progress_text = st.empty()
+    progress_bar = st.progress(0)
+    total = len(news_texts)
+    for i, text in enumerate(news_texts):
         if not text.strip():
             summaries.append("")
+        else:
+            try:
+                summary = summarizer(text, max_length=100, min_length=30, do_sample=False)[0]["summary_text"]
+                summaries.append(summary)
+            except:
+                summaries.append(text)
+        progress_text.text(f"กำลังสรุปข่าว {i+1}/{total}")
+        progress_bar.progress((i+1)/total)
+    progress_bar.empty()
+    progress_text.empty()
     return summaries
 def summarize_themes(news_texts):
+    """สรุปธีมข่าวแต่ละข่าว พร้อม progress bar"""
     themes = []
+    progress_text = st.empty()
+    progress_bar = st.progress(0)
+    total = len(news_texts)
+    for i, text in enumerate(news_texts):
         if not text.strip():
             themes.append("Unknown")
+        else:
+            try:
+                result = theme_classifier(text, candidate_labels)
+                themes.append(result["labels"][0])
+            except:
+                themes.append("Unknown")
+        progress_text.text(f"กำลังสรุปธีมข่าว {i+1}/{total}")
+        progress_bar.progress((i+1)/total)
+    progress_bar.empty()
+    progress_text.empty()
     return themes
 # --------------------------
     news_df["sentiment"] = news_df["text"].apply(analyze_text)
     news_df["date"] = pd.to_datetime(news_df["date"])
+    # สรุปข่าวเป็น 1 พารากราฟ พร้อม progress bar
     st.info("กำลังสรุปเนื้อหาข่าว...")
     news_df["text"] = summarize_texts(news_df["text"].tolist())
+    # สรุปธีมข่าวพร้อม progress bar
+    st.info("กำลังสรุปธีมข่าว...")
+    news_df["theme"] = summarize_themes(news_df["text"].tolist())
     # Metrics
     avg_sentiment = news_df["sentiment"].mean()
     pos_pct = (news_df["sentiment"] > 0.1).mean() * 100
     col2.metric("ข่าวเชิงบวก", f"{pos_pct:.1f}%")
     col3.metric("ข่าวเชิงลบ", f"{neg_pct:.1f}%")
     # แสดงรายการข่าว
     st.subheader("📰 รายการข่าวทั้งหมด")
     st.dataframe(news_df[["date", "source", "text", "sentiment", "theme", "url"]], use_container_width=True)