SentimentAnalyzerFinbert

Sleeping

App Files Files Community

KYTHY commited on Nov 11, 2025

Commit

d4665fe

verified ·

1 Parent(s): b935242

Update app.py

Browse files

Files changed (1) hide show

app.py +155 -121

app.py CHANGED Viewed

@@ -1,44 +1,55 @@
 import streamlit as st
-import pandas as pd
 import requests
-import numpy as np
-import plotly.express as px
-import nltk
-import time
 from datetime import datetime, timedelta
 from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
 from textblob import TextBlob
-from transformers import pipeline
 from wordcloud import WordCloud
 from sklearn.linear_model import LinearRegression
-import matplotlib.pyplot as plt
-# =========================================
-# SETUP
-# =========================================
-st.set_page_config(page_title="Financial Sentiment Analyzer", layout="wide")
-nltk.download("stopwords", quiet=True)
-# โหลดโมเดล sentiment ของ BERT
 @st.cache_resource
-def load_bert_model():
-    return pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")
-bert_model = load_bert_model()
-vader = SentimentIntensityAnalyzer()
-# ใส่ API key ของคุณ
-API_KEY = st.secrets["NEWS_API_KEY"]  # ใส่ใน .streamlit/secrets.toml
-# หรือถ้ารัน local:
-# API_KEY = "88bc396d4eab4be494a4b86ec842db47"
-# =========================================
-# FUNCTION: ดึงข่าวจาก NewsAPI.org
-# =========================================
-@st.cache_data(ttl=3600, show_spinner="Fetching financial news...")
 def fetch_financial_news(keyword, days=7, limit=50):
-    """ดึงข่าวการเงินย้อนหลังจาก NewsAPI.org"""
     to_date = datetime.now().strftime('%Y-%m-%d')
     from_date = (datetime.now() - timedelta(days=days)).strftime('%Y-%m-%d')
@@ -46,116 +57,139 @@ def fetch_financial_news(keyword, days=7, limit=50):
         f"https://newsapi.org/v2/everything?"
         f"q={keyword}+finance+stock&"
         f"from={from_date}&to={to_date}&"
-        f"language=en&"
-        f"sortBy=publishedAt&"
-        f"pageSize={limit}&"
-        f"apiKey={API_KEY}"
     )
-    response = requests.get(url)
-    data = response.json()
     if data.get("status") != "ok":
-        st.error(f"Error fetching news: {data.get('message', 'Unknown error')}")
         return pd.DataFrame()
     articles = []
     for a in data["articles"]:
-        articles.append({
-            "date": pd.to_datetime(a["publishedAt"]),
-            "text": f"{a['title']}\n{a.get('description', '')}",
-            "source": a["source"]["name"],
-            "url": a["url"]
-        })
     return pd.DataFrame(articles)
-# =========================================
-# FUNCTION: วิเคราะห์อารมณ์
-# =========================================
-def analyze_sentiment(text):
-    """รวมผลจาก BERT, VADER, TextBlob"""
-    try:
-        bert_label = bert_model(text[:512])[0]["label"]
-        vader_score = vader.polarity_scores(text)["compound"]
-        blob_score = TextBlob(text).sentiment.polarity
-        bert_score = (
-            1 if "5" in bert_label or "4" in bert_label
-            else -1 if "1" in bert_label or "2" in bert_label
-            else 0
-        )
-        final_score = np.mean([bert_score, np.sign(vader_score), np.sign(blob_score)])
-        return final_score
-    except Exception:
-        return 0
-# =========================================
-# FUNCTION: สร้า��� Word Cloud
-# =========================================
-def create_wordcloud(texts):
-    text = " ".join(texts)
-    wc = WordCloud(width=800, height=400, background_color="white",
-                   stopwords=set(nltk.corpus.stopwords.words("english"))).generate(text)
-    return wc
-# =========================================
-# FUNCTION: พยากรณ์แนวโน้มอารมณ์
-# =========================================
-def forecast_sentiment_trend(df):
-    df = df.sort_values("date")
-    df["timestamp"] = (df["date"] - df["date"].min()).dt.days
-    model = LinearRegression()
-    model.fit(df[["timestamp"]], df["sentiment"])
-    future = pd.DataFrame({"timestamp": np.arange(df["timestamp"].max()+1, df["timestamp"].max()+8)})
-    pred = model.predict(future)
-    return pred
-# =========================================
 # MAIN APP
-# =========================================
-st.title("💹 Financial News Sentiment Analyzer (NewsAPI.org version)")
-st.markdown("วิเคราะห์อารมณ์ของข่าวการเงินย้อนหลังจาก **NewsAPI.org** โดยใช้ BERT + VADER + TextBlob")
-keyword = st.text_input("🔍 ใส่ชื่อบริษัท / หุ้น / คำค้นหา", "Tesla")
-limit = st.slider("จำนวนข่าวที่ต้องการดึง", 10, 100, 50)
-if st.button("เริ่มวิเคราะห์ข่าว"):
-    with st.spinner(f"กำลังดึงข่าวเกี่ยวกับ '{keyword}' ..."):
-        news_df = fetch_financial_news(keyword, days=7, limit=limit)
-    if news_df.empty:
-        st.error("❌ ไม่พบข่าวในช่วง 7 วันที่ผ่านมา")
-        st.stop()
-    st.success(f"✅ ดึงข่าวได้ {len(news_df)} รายการจาก NewsAPI.org")
-    # วิเคราะห์ sentiment
-    st.info("🔎 กำลังวิเคราะห์อารมณ์ของข่าวแต่ละรายการ...")
-    news_df["sentiment"] = news_df["text"].apply(analyze_sentiment)
-    # แสดงผลรวม
-    avg_sentiment = news_df["sentiment"].mean()
-    st.metric("📊 ค่าเฉลี่ยอารมณ์โดยรวม", f"{avg_sentiment:.2f}")
-    # กราฟแนวโน้ม
-    fig = px.line(news_df.sort_values("date"), x="date", y="sentiment",
-                  title=f"แนวโน้มอารมณ์ของข่าว '{keyword}'",
-                  markers=True)
     st.plotly_chart(fig, use_container_width=True)
-    # Word Cloud
-    st.subheader("☁️ คำที่ถูกใช้บ่อยในข่าว")
-    wc = create_wordcloud(news_df["text"].tolist())
-    st.image(wc.to_array())
-    # พยากรณ์แนวโน้ม
-    st.subheader("📈 พยากรณ์แนวโน้มอารมณ์ใน 7 วันข้างหน้า")
-    forecast = forecast_sentiment_trend(news_df)
-    st.line_chart(forecast)
-    # แสดงข่าวต้นฉบับ
-    st.subheader("📰 ข่าวที่ใช้ในการวิเคราะห์")
-    for _, row in news_df.iterrows():
-        st.markdown(f"**[{row['source']}]({row['url']})** — {row['date'].strftime('%Y-%m-%d')}  \n{row['text']}")

 import streamlit as st
 import requests
+import pandas as pd
 from datetime import datetime, timedelta
+from transformers import pipeline
 from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
 from textblob import TextBlob
+import nltk
 from wordcloud import WordCloud
+import base64
+from io import BytesIO
+import numpy as np
 from sklearn.linear_model import LinearRegression
+import plotly.graph_objects as go
+import os
+# --------------------------
+# CONFIG
+# --------------------------
+st.set_page_config(page_title="📰 SentimentSync NewsAI", layout="wide")
+API_KEY = "88bc396d4eab4be494a4b86ec842db47"
+# --------------------------
+# UTILITIES
+# --------------------------
 @st.cache_resource
+def load_models():
+    st.info("Loading sentiment models...")
+    bert_model = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")
+    vader = SentimentIntensityAnalyzer()
+    return bert_model, vader
+def analyze_text(text, bert_model, vader):
+    if not text.strip():
+        return 0
+    vader_score = vader.polarity_scores(text)["compound"]
+    textblob_score = TextBlob(text).sentiment.polarity
+    bert_result = bert_model(text[:512])[0]
+    label_map = {
+        "1 star": -1,
+        "2 stars": -0.5,
+        "3 stars": 0,
+        "4 stars": 0.5,
+        "5 stars": 1
+    }
+    bert_score = label_map.get(bert_result["label"], 0)
+    return np.mean([vader_score, textblob_score, bert_score])
+@st.cache_data(ttl=3600)
 def fetch_financial_news(keyword, days=7, limit=50):
+    """ดึงข่าวย้อนหลังจาก NewsAPI.org"""
     to_date = datetime.now().strftime('%Y-%m-%d')
     from_date = (datetime.now() - timedelta(days=days)).strftime('%Y-%m-%d')
         f"https://newsapi.org/v2/everything?"
         f"q={keyword}+finance+stock&"
         f"from={from_date}&to={to_date}&"
+        f"language=en&sortBy=publishedAt&"
+        f"pageSize={limit}&apiKey={API_KEY}"
     )
+    r = requests.get(url)
+    data = r.json()
     if data.get("status") != "ok":
+        st.error(f"API Error: {data}")
         return pd.DataFrame()
     articles = []
     for a in data["articles"]:
+        if a["description"]:
+            articles.append({
+                "date": pd.to_datetime(a["publishedAt"]),
+                "text": f"{a['title']} {a['description']}",
+                "source": a["source"]["name"],
+                "url": a["url"]
+            })
     return pd.DataFrame(articles)
+def generate_wordcloud(text):
+    stopwords = nltk.corpus.stopwords.words('english')
+    wordcloud = WordCloud(width=800, height=400, background_color="white", stopwords=stopwords).generate(text)
+    buf = BytesIO()
+    wordcloud.to_image().save(buf, format="PNG")
+    return base64.b64encode(buf.getvalue()).decode()
+# --------------------------
 # MAIN APP
+# --------------------------
+def main():
+    st.title("📰 SentimentSync NewsAI")
+    st.markdown("วิเคราะห์แนวโน้มอารมณ์ของข่าวการเงินย้อนหลัง 7 วัน พร้อมพยากรณ์ในอนาคต")
+    # Sidebar
+    with st.sidebar:
+        keyword = st.text_input("ค้นหาคำ (เช่น Tesla, Bitcoin, Inflation):", "")
+        limit = st.slider("จำนวนข่าวที่ดึง:", 10, 100, 40)
+        analyze_btn = st.button("วิเคราะห์เลย")
+    if not analyze_btn:
+        st.info("กรอกคำค้นแล้วกด 'วิเคราะห์เลย' เพื่อเริ่มต้น")
+        return
+    bert_model, vader = load_models()
+    # ดึงข่าว
+    st.info(f"กำลังดึงข่าวจาก NewsAPI.org สำหรับ '{keyword}' ...")
+    news_df = fetch_financial_news(keyword, limit=limit)
+    if news_df.empty:
+        st.warning("ไม่พบบทความข่าวในช่วง 7 วันที่ผ่านมา")
+        return
+    # วิเคราะห์ sentiment
+    st.info("กำลังวิเคราะห์อารมณ์ของข่าว...")
+    news_df["sentiment"] = news_df["text"].apply(lambda x: analyze_text(x, bert_model, vader))
+    news_df["date"] = pd.to_datetime(news_df["date"])
+    avg_sentiment = news_df["sentiment"].mean()
+    pos_pct = (news_df["sentiment"] > 0.1).mean() * 100
+    neg_pct = (news_df["sentiment"] < -0.1).mean() * 100
+    col1, col2, col3 = st.columns(3)
+    col1.metric("ค่าเฉลี่ยอารมณ์ข่าว", f"{avg_sentiment:.2f}",
+                "Positive" if avg_sentiment > 0 else "Negative" if avg_sentiment < 0 else "Neutral")
+    col2.metric("ข่าวเชิงบวก", f"{pos_pct:.1f}%")
+    col3.metric("ข่าวเชิงลบ", f"{neg_pct:.1f}%")
+    # Wordcloud
+    st.subheader("☁️ Word Cloud ของข่าว")
+    all_text = " ".join(news_df["text"].tolist())
+    img = generate_wordcloud(all_text)
+    st.image(f"data:image/png;base64,{img}", use_column_width=True)
+    # แนวโน้มและพยากรณ์ในกราฟเดียว
+    st.subheader("📈 แนวโน้มและพยากรณ์อารมณ์ของข่าว")
+    df_sorted = news_df.sort_values("date").copy()
+    df_sorted["timestamp"] = (df_sorted["date"] - df_sorted["date"].min()).dt.days
+    # Train model
+    model = LinearRegression()
+    model.fit(df_sorted[["timestamp"]], df_sorted["sentiment"])
+    # Forecast next 7 days
+    future_days = 7
+    future_timestamps = np.arange(df_sorted["timestamp"].max() + 1, df_sorted["timestamp"].max() + future_days + 1)
+    future_dates = [df_sorted["date"].max() + timedelta(days=i) for i in range(1, future_days + 1)]
+    future_preds = model.predict(future_timestamps.reshape(-1, 1))
+    # Plot both actual + prediction
+    fig = go.Figure()
+    # Actual data
+    fig.add_trace(go.Scatter(
+        x=df_sorted["date"], y=df_sorted["sentiment"],
+        mode="lines+markers", name="Actual Sentiment",
+        line=dict(color="blue")
+    ))
+    # Prediction line
+    fig.add_trace(go.Scatter(
+        x=future_dates, y=future_preds,
+        mode="lines+markers", name="Predicted Sentiment (7-day Forecast)",
+        line=dict(color="orange", dash="dash")
+    ))
+    # Confidence range (±0.1)
+    fig.add_trace(go.Scatter(
+        x=future_dates + future_dates[::-1],
+        y=list(future_preds + 0.1) + list((future_preds - 0.1)[::-1]),
+        fill='toself', fillcolor='rgba(255,165,0,0.2)',
+        line=dict(color='rgba(255,255,255,0)'),
+        hoverinfo="skip",
+        showlegend=False
+    ))
+    fig.update_layout(
+        title=f"แนวโน้มและพยากรณ์อารมณ์ของข่าว '{keyword}'",
+        xaxis_title="วันที่",
+        yaxis_title="ค่าอารมณ์ (Sentiment)",
+        hovermode="x unified",
+        template="plotly_white"
+    )
     st.plotly_chart(fig, use_container_width=True)
+    # ตารางข่าว (optional)
+    st.subheader("📰 รายการข่าว")
+    st.dataframe(news_df[["date", "source", "text", "sentiment", "url"]], use_container_width=True)
+if __name__ == "__main__":
+    nltk.download("stopwords", quiet=True)
+    main()