SentimentAnalyzerFinbert

Sleeping

App Files Files Community

KYTHY commited on Nov 11

Commit

064e28f

verified ·

1 Parent(s): 9bca51b

Update app.py

Browse files

Files changed (1) hide show

app.py +134 -178

app.py CHANGED Viewed

@@ -1,203 +1,159 @@
 import streamlit as st
 import requests
 import pandas as pd
 from datetime import datetime, timedelta
-from transformers import pipeline
-from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
 from textblob import TextBlob
-import nltk
-from wordcloud import WordCloud
-import base64
-from io import BytesIO
-import numpy as np
 from sklearn.linear_model import LinearRegression
 import plotly.graph_objects as go
-# --------------------------
-# CONFIG
-# --------------------------
-st.set_page_config(page_title="📰 SentimentSync NewsAI", layout="wide")
-API_KEY = "88bc396d4eab4be494a4b86ec842db47"
-# --------------------------
-# UTILITIES
-# --------------------------
-@st.cache_resource
-def load_models():
-    st.info("Loading sentiment models...")
-    bert_model = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")
-    vader = SentimentIntensityAnalyzer()
-    return bert_model, vader
-def analyze_text(text, bert_model, vader):
-    if not text.strip():
-        return 0
-    vader_score = vader.polarity_scores(text)["compound"]
-    textblob_score = TextBlob(text).sentiment.polarity
-    bert_result = bert_model(text[:512])[0]
-    label_map = {
-        "1 star": -1,
-        "2 stars": -0.5,
-        "3 stars": 0,
-        "4 stars": 0.5,
-        "5 stars": 1
-    }
-    bert_score = label_map.get(bert_result["label"], 0)
-    return np.mean([vader_score, textblob_score, bert_score])
-@st.cache_data(ttl=3600)
-def fetch_financial_news(keyword):
-    """ดึงข่าวย้อนหลัง 7 วันจาก NewsAPI.org"""
-    to_date = datetime.now().strftime('%Y-%m-%d')
-    from_date = (datetime.now() - timedelta(days=7)).strftime('%Y-%m-%d')
     all_articles = []
-    page = 1
-    while True:
         url = (
             f"https://newsapi.org/v2/everything?"
-            f"q={keyword}+finance+stock&"
             f"from={from_date}&to={to_date}&"
             f"language=en&sortBy=publishedAt&"
-            f"pageSize=100&page={page}&apiKey={API_KEY}"
         )
-        r = requests.get(url)
-        data = r.json()
-        if data.get("status") != "ok":
-            st.error(f"API Error: {data}")
-            break
-        articles = data.get("articles", [])
-        if not articles:
             break
-        for a in articles:
-            if a["description"]:
-                all_articles.append({
-                    "date": pd.to_datetime(a["publishedAt"]),
-                    "text": f"{a['title']} {a['description']}",
-                    "source": a["source"]["name"],
-                    "url": a["url"]
-                })
-        if len(articles) < 100:
-            break  # หมดแล้ว
-        page += 1
-    return pd.DataFrame(all_articles)
-def generate_wordcloud(text):
-    stopwords = nltk.corpus.stopwords.words('english')
-    wordcloud = WordCloud(width=800, height=400, background_color="white", stopwords=stopwords).generate(text)
-    buf = BytesIO()
-    wordcloud.to_image().save(buf, format="PNG")
-    return base64.b64encode(buf.getvalue()).decode()
-# --------------------------
-# MAIN APP
-# --------------------------
-def main():
-    st.title("📰 SentimentSync NewsAI")
-    st.markdown("วิเคราะห์แนวโน้มอารมณ์ของข่าวการเงินย้อนหลัง 7 วัน พร้อมพยากรณ์แนวโน้มในอนาคต")
-    # Sidebar
-    with st.sidebar:
-        keyword = st.text_input("ค้นหาคำ (เช่น Tesla, Bitcoin, Inflation):", "")
-        analyze_btn = st.button("วิเคราะห์เลย")
-    if not analyze_btn:
-        st.info("กรอกคำค้นแล้วกด 'วิเคราะห์เลย' เพื่อเริ่มต้น")
-        return
-    bert_model, vader = load_models()
-    # ดึงข่าว
-    st.info(f"กำลังดึงข่าวย้อนหลัง 7 วันจาก NewsAPI.org สำหรับ '{keyword}' ...")
-    news_df = fetch_financial_news(keyword)
-    if news_df.empty:
-        st.warning("ไม่พบบทความข่าวในช่วง 7 วันที่ผ่านมา")
-        return
-    # วิเคราะห์ sentiment
-    st.info("กำลังวิเคราะห์อารมณ์ของข่าว...")
-    news_df["sentiment"] = news_df["text"].apply(lambda x: analyze_text(x, bert_model, vader))
-    news_df["date"] = pd.to_datetime(news_df["date"])
-    avg_sentiment = news_df["sentiment"].mean()
-    pos_pct = (news_df["sentiment"] > 0.1).mean() * 100
-    neg_pct = (news_df["sentiment"] < -0.1).mean() * 100
-    col1, col2, col3 = st.columns(3)
-    col1.metric("ค่าเฉลี่ยอารมณ์ข่าว", f"{avg_sentiment:.2f}",
-                "Positive" if avg_sentiment > 0 else "Negative" if avg_sentiment < 0 else "Neutral")
-    col2.metric("ข่าวเชิงบวก", f"{pos_pct:.1f}%")
-    col3.metric("ข่าวเชิงลบ", f"{neg_pct:.1f}%")
-    # Wordcloud
-    st.subheader("☁️ Word Cloud ของข่าว")
-    all_text = " ".join(news_df["text"].tolist())
-    img = generate_wordcloud(all_text)
-    st.image(f"data:image/png;base64,{img}", use_column_width=True)
-    # แนวโน้มและพยากรณ์ในกราฟเดียว
-    st.subheader("📈 แนวโน้มและพยากรณ์อารมณ์ของข่าว")
-    df_sorted = news_df.sort_values("date").copy()
     df_sorted["timestamp"] = (df_sorted["date"] - df_sorted["date"].min()).dt.days
-    # Train model
     model = LinearRegression()
     model.fit(df_sorted[["timestamp"]], df_sorted["sentiment"])
-    # Forecast next 7 days
     future_days = 7
-    future_timestamps = np.arange(df_sorted["timestamp"].max() + 1, df_sorted["timestamp"].max() + future_days + 1)
     future_dates = [df_sorted["date"].max() + timedelta(days=i) for i in range(1, future_days + 1)]
     future_preds = model.predict(future_timestamps.reshape(-1, 1))
-    # Plot both actual + prediction
-    fig = go.Figure()
-    fig.add_trace(go.Scatter(
-        x=df_sorted["date"], y=df_sorted["sentiment"],
-        mode="lines+markers", name="Actual Sentiment",
-        line=dict(color="blue")
-    ))
-    fig.add_trace(go.Scatter(
-        x=future_dates, y=future_preds,
-        mode="lines+markers", name="Predicted Sentiment (7-day Forecast)",
-        line=dict(color="orange", dash="dash")
-    ))
-    fig.add_trace(go.Scatter(
-        x=future_dates + future_dates[::-1],
-        y=list(future_preds + 0.1) + list((future_preds - 0.1)[::-1]),
-        fill='toself', fillcolor='rgba(255,165,0,0.2)',
-        line=dict(color='rgba(255,255,255,0)'),
-        hoverinfo="skip",
-        showlegend=False
-    ))
-    fig.update_layout(
-        title=f"แนวโน้มและพยากรณ์อารมณ์ของข่าว '{keyword}'",
-        xaxis_title="วันที่",
-        yaxis_title="ค่าอารมณ์ (Sentiment)",
-        hovermode="x unified",
-        template="plotly_white"
-    )
-    st.plotly_chart(fig, use_container_width=True)
-    st.subheader("📰 รายการข่าว")
-    st.dataframe(news_df[["date", "source", "text", "sentiment", "url"]], use_container_width=True)
-if __name__ == "__main__":
-    nltk.download("stopwords", quiet=True)
-    main()

 import streamlit as st
 import requests
 import pandas as pd
+import numpy as np
+import yfinance as yf
 from datetime import datetime, timedelta
 from textblob import TextBlob
 from sklearn.linear_model import LinearRegression
 import plotly.graph_objects as go
+# -------------------------------
+# 🔧 ตั้งค่า API Key
+# -------------------------------
+NEWS_API_KEY = "88bc396d4eab4be494a4b86ec842db47"
+st.set_page_config(page_title="📊 วิเคราะห์อารมณ์ข่าวหุ้น", layout="wide")
+st.title("📈 วิเคราะห์แนวโน้มอารมณ์ข่าวหุ้นด้วย AI")
+st.caption("ใช้ NewsAPI + yfinance เพื่อค้นหาข่าวหุ้น และพยากรณ์อารมณ์ข่าว 7 วันข้างหน้า")
+# -------------------------------
+# 🧠 ฟังก์ชัน: แปลงชื่อบริษัท ↔️ Symbol โดยอัตโนมัติ
+# -------------------------------
+def resolve_company_symbol(keyword: str):
+    keyword = keyword.strip()
+    ticker = None
+    name = None
+    try:
+        data = yf.Ticker(keyword)
+        info = data.info
+        if "symbol" in info and info["symbol"]:  # ถ้าเป็น ticker
+            ticker = info["symbol"]
+            name = info.get("longName", info.get("shortName", keyword))
+        else:
+            # ถ้าไม่ใช่ ticker → ค้นจากชื่อบริษัท
+            url = f"https://query2.finance.yahoo.com/v1/finance/search?q={keyword}"
+            res = requests.get(url).json()
+            if "quotes" in res and len(res["quotes"]) > 0:
+                q = res["quotes"][0]
+                ticker = q.get("symbol", keyword.upper())
+                name = q.get("longname", q.get("shortname", keyword.capitalize()))
+    except Exception:
+        ticker = keyword.upper()
+        name = keyword.capitalize()
+    return name, ticker
+# -------------------------------
+# 📰 ฟังก์ชัน: ดึงข่าวจาก NewsAPI
+# -------------------------------
+def fetch_financial_news(keyword: str):
+    company, symbol = resolve_company_symbol(keyword)
+    query = f"({company} OR {symbol})"
+    to_date = datetime.utcnow().isoformat()  # ดึงถึงเวลาปัจจุบัน (UTC)
+    from_date = (datetime.utcnow() - timedelta(days=7)).strftime('%Y-%m-%d')
     all_articles = []
+    for page in range(1, 6):  # ดึงได้สูงสุด 500 ข่าว (100 x 5 หน้า)
         url = (
             f"https://newsapi.org/v2/everything?"
+            f"q={query}+finance+stock&"
             f"from={from_date}&to={to_date}&"
             f"language=en&sortBy=publishedAt&"
+            f"pageSize=100&page={page}&apiKey={NEWS_API_KEY}"
         )
+        response = requests.get(url).json()
+        if response.get("status") != "ok" or not response.get("articles"):
             break
+        all_articles.extend(response["articles"])
+    if not all_articles:
+        return pd.DataFrame()
+    df = pd.DataFrame(all_articles)
+    df["publishedAt"] = pd.to_datetime(df["publishedAt"])
+    df["date"] = df["publishedAt"].dt.date
+    df["title"] = df["title"].fillna("")
+    df["description"] = df["description"].fillna("")
+    df["content"] = df["content"].fillna("")
+    df["url"] = df["url"].fillna("")
+    df["source"] = df["source"].apply(lambda x: x.get("name") if isinstance(x, dict) else x)
+    df["company"] = company
+    df["symbol"] = symbol
+    return df
+# -------------------------------
+# 😊 ฟังก์ชัน: วิเคราะห์อารมณ์ข่าว
+# -------------------------------
+def analyze_sentiment(text):
+    if not text:
+        return 0
+    analysis = TextBlob(text)
+    return analysis.sentiment.polarity  # ค่า -1 (ลบ) → +1 (บวก)
+# -------------------------------
+# 🧮 ฟังก์ชัน: พยากรณ์แนวโน้มด้วย Linear Regression
+# -------------------------------
+def forecast_sentiment_trend(df):
+    df_sorted = df.groupby("date")["sentiment"].mean().reset_index()
     df_sorted["timestamp"] = (df_sorted["date"] - df_sorted["date"].min()).dt.days
     model = LinearRegression()
     model.fit(df_sorted[["timestamp"]], df_sorted["sentiment"])
     future_days = 7
+    future_timestamps = np.arange(df_sorted["timestamp"].max() + 1,
+                                  df_sorted["timestamp"].max() + future_days + 1)
     future_dates = [df_sorted["date"].max() + timedelta(days=i) for i in range(1, future_days + 1)]
     future_preds = model.predict(future_timestamps.reshape(-1, 1))
+    forecast_df = pd.DataFrame({"date": future_dates, "predicted_sentiment": future_preds})
+    return df_sorted, forecast_df
+# -------------------------------
+# 🎯 ส่วนหลักของแอป
+# -------------------------------
+keyword = st.text_input("🔍 พิมพ์ชื่อบริษัทหรืออักษรย่อหุ้น (เช่น Apple หรือ AAPL):", "AAPL")
+if st.button("ค้นหาข่าว"):
+    with st.spinner("กำลังดึงข่าวและวิเคราะห์อารมณ์..."):
+        news_df = fetch_financial_news(keyword)
+    if news_df.empty:
+        st.warning("ไม่พบข่าวในช่วง 7 วันที่ผ่านมา 😢")
+    else:
+        st.success(f"✅ พบข่าวทั้งหมด {len(news_df)} รายการ")
+        # วิเคราะห์อารมณ์
+        news_df["sentiment"] = news_df["title"].apply(analyze_sentiment)
+        # แสดงตารางข่าว
+        st.subheader("📰 ข่าวล่าสุด")
+        st.dataframe(news_df[["date", "title", "source", "sentiment", "url"]])
+        # สร้างกราฟแนวโน้ม + พยากรณ์
+        st.subheader("📊 แนวโน้มและพยากรณ์อารมณ์ข่าว 7 วันข้างหน้า")
+        df_actual, df_forecast = forecast_sentiment_trend(news_df)
+        fig = go.Figure()
+        fig.add_trace(go.Scatter(
+            x=df_actual["date"], y=df_actual["sentiment"],
+            mode="lines+markers",
+            name="Actual Sentiment",
+            line=dict(color="blue")
+        ))
+        fig.add_trace(go.Scatter(
+            x=df_forecast["date"], y=df_forecast["predicted_sentiment"],
+            mode="lines+markers",
+            name="Predicted Trend (Next 7 Days)",
+            line=dict(color="orange", dash="dash")
+        ))
+        fig.update_layout(
+            title=f"📈 แนวโน้มอารมณ์ข่าวของ {df_actual['date'].min()} ถึง {df_forecast['date'].max()}",
+            xaxis_title="วันที่",
+            yaxis_title="ค่าอารมณ์ (Sentiment)",
+            hovermode="x unified",
+            template="plotly_white"
+        )
+        st.plotly_chart(fig, use_container_width=True)