SentimentAnalyzerOriginal

Sleeping

App Files Files Community

KYTHY commited on Nov 11, 2025

Commit

3439737

verified ·

1 Parent(s): 6a35887

Update app.py

Browse files

Files changed (1) hide show

app.py +167 -106

app.py CHANGED Viewed

@@ -1,26 +1,40 @@
 import streamlit as st
-import requests
 import pandas as pd
-import numpy as np
 import yfinance as yf
-from datetime import datetime, timedelta
 from textblob import TextBlob
-from sklearn.linear_model import LinearRegression
 import plotly.graph_objects as go
 # -------------------------------
-# 🔧 ตั้งค่า API Key
 # -------------------------------
-NEWS_API_KEY = "88bc396d4eab4be494a4b86ec842db47"
-st.set_page_config(page_title="📊 วิเคราะห์อารมณ์ข่าวหุ้น", layout="wide")
-st.title("📈 วิเคราะห์แนวโน้มอารมณ์ข่าวหุ้นด้วย AI")
-st.caption("ใช้ NewsAPI + yfinance เพื่อค้นหาข่าวหุ้น และพยากรณ์อารมณ์ข่าว 7 วันข้างหน้า")
 # -------------------------------
-# 🧠 ฟังก์ชัน: แปลงชื่อบริษัท ↔️ Symbol โดยอัตโนมัติ
 # -------------------------------
 def resolve_company_symbol(keyword: str):
     keyword = keyword.strip()
     ticker = None
@@ -28,132 +42,179 @@ def resolve_company_symbol(keyword: str):
     try:
         data = yf.Ticker(keyword)
         info = data.info
-        if "symbol" in info and info["symbol"]:  # ถ้าเป็น ticker
             ticker = info["symbol"]
             name = info.get("longName", info.get("shortName", keyword))
         else:
-            # ถ้าไม่ใช่ ticker → ค้นจากชื่อบริษัท
             url = f"https://query2.finance.yahoo.com/v1/finance/search?q={keyword}"
             res = requests.get(url).json()
             if "quotes" in res and len(res["quotes"]) > 0:
                 q = res["quotes"][0]
-                ticker = q.get("symbol", keyword.upper())
-                name = q.get("longname", q.get("shortname", keyword.capitalize()))
-    except Exception:
         ticker = keyword.upper()
         name = keyword.capitalize()
     return name, ticker
 # -------------------------------
-# 📰 ฟังก์ชัน: ดึงข่าวจาก NewsAPI
 # -------------------------------
-def fetch_financial_news(keyword: str):
-    company, symbol = resolve_company_symbol(keyword)
-    query = f"({company} OR {symbol})"
-    to_date = datetime.utcnow().isoformat()  # ดึงถึงเวลาปัจจุบัน (UTC)
-    from_date = (datetime.utcnow() - timedelta(days=7)).strftime('%Y-%m-%d')
-    all_articles = []
-    for page in range(1, 6):  # ดึงได้สูงสุด 500 ข่าว (100 x 5 หน้า)
-        url = (
-            f"https://newsapi.org/v2/everything?"
-            f"q={query}+finance+stock&"
-            f"from={from_date}&to={to_date}&"
-            f"language=en&sortBy=publishedAt&"
-            f"pageSize=100&page={page}&apiKey={NEWS_API_KEY}"
-        )
-        response = requests.get(url).json()
-        if response.get("status") != "ok" or not response.get("articles"):
-            break
-        all_articles.extend(response["articles"])
-    if not all_articles:
         return pd.DataFrame()
-    df = pd.DataFrame(all_articles)
-    df["publishedAt"] = pd.to_datetime(df["publishedAt"])
-    df["date"] = df["publishedAt"].dt.date
-    df["title"] = df["title"].fillna("")
-    df["description"] = df["description"].fillna("")
-    df["content"] = df["content"].fillna("")
-    df["url"] = df["url"].fillna("")
-    df["source"] = df["source"].apply(lambda x: x.get("name") if isinstance(x, dict) else x)
     df["company"] = company
     df["symbol"] = symbol
     return df
 # -------------------------------
-# 😊 ฟังก์ชัน: วิเคราะห์อารมณ์ข่าว
 # -------------------------------
-def analyze_sentiment(text):
-    if not text:
         return 0
-    analysis = TextBlob(text)
-    return analysis.sentiment.polarity  # ค่า -1 (ลบ) → +1 (บวก)
 # -------------------------------
-# 🧮 ฟังก์ชัน: พยากรณ์แนวโน้มด้วย Linear Regression
 # -------------------------------
 def forecast_sentiment_trend(df):
-    df_sorted = df.groupby("date")["sentiment"].mean().reset_index()
-    df_sorted["timestamp"] = (df_sorted["date"] - df_sorted["date"].min()).dt.days
-    model = LinearRegression()
-    model.fit(df_sorted[["timestamp"]], df_sorted["sentiment"])
-    future_days = 7
-    future_timestamps = np.arange(df_sorted["timestamp"].max() + 1,
-                                  df_sorted["timestamp"].max() + future_days + 1)
-    future_dates = [df_sorted["date"].max() + timedelta(days=i) for i in range(1, future_days + 1)]
-    future_preds = model.predict(future_timestamps.reshape(-1, 1))
     forecast_df = pd.DataFrame({"date": future_dates, "predicted_sentiment": future_preds})
-    return df_sorted, forecast_df
 # -------------------------------
-# 🎯 ส่วนหลักของแอป
 # -------------------------------
-keyword = st.text_input("🔍 พิมพ์ชื่อบริษัทหรืออักษรย่อหุ้น (เช่น Apple หรือ AAPL):", "AAPL")
-if st.button("ค้นหาข่าว"):
-    with st.spinner("กำลังดึงข่าวและวิเคราะห์อารมณ์..."):
-        news_df = fetch_financial_news(keyword)
     if news_df.empty:
-        st.warning("ไม่พบข่าวในช่วง 7 วันที่ผ่านมา 😢")
-    else:
-        st.success(f"✅ พบข่าวทั้งหมด {len(news_df)} รายการ")
-        # วิเคราะห์อารมณ์
-        news_df["sentiment"] = news_df["title"].apply(analyze_sentiment)
-        # แสดงตารางข่าว
-        st.subheader("📰 ข่าวล่าสุด")
-        st.dataframe(news_df[["date", "title", "source", "sentiment", "url"]])
-        # สร้างกราฟแนวโน้ม + พยากรณ์
-        st.subheader("📊 แนวโน้มและพยากรณ์อารมณ์ข่าว 7 วันข้างหน้า")
-        df_actual, df_forecast = forecast_sentiment_trend(news_df)
-        fig = go.Figure()
-        fig.add_trace(go.Scatter(
-            x=df_actual["date"], y=df_actual["sentiment"],
-            mode="lines+markers",
-            name="Actual Sentiment",
-            line=dict(color="blue")
-        ))
-        fig.add_trace(go.Scatter(
-            x=df_forecast["date"], y=df_forecast["predicted_sentiment"],
-            mode="lines+markers",
-            name="Predicted Trend (Next 7 Days)",
-            line=dict(color="orange", dash="dash")
-        ))
-        fig.update_layout(
-            title=f"📈 แนวโน้มอารมณ์ข่าวของ {df_actual['date'].min()} ถึง {df_forecast['date'].max()}",
-            xaxis_title="วันที่",
-            yaxis_title="ค่าอารมณ์ (Sentiment)",
-            hovermode="x unified",
-            template="plotly_white"
-        )
-        st.plotly_chart(fig, use_container_width=True)

 import streamlit as st
 import pandas as pd
+import requests
 import yfinance as yf
+from transformers import pipeline
+from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
 from textblob import TextBlob
+from datetime import datetime, timedelta
 import plotly.graph_objects as go
+import nltk
+import numpy as np
+from sklearn.linear_model import Ridge
+from sklearn.preprocessing import PolynomialFeatures
+from sklearn.pipeline import make_pipeline
+import os
 # -------------------------------
+# 🔧 CONFIG
 # -------------------------------
+st.set_page_config(page_title="📈 News Sentiment & Stock Tracker", layout="wide")
+API_KEY = "88bc396d4eab4be494a4b86ec842db47"
+# -------------------------------
+# 📦 โหลดโมเดล
+# -------------------------------
+@st.cache_resource
+def load_models():
+    bert = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")
+    vader = SentimentIntensityAnalyzer()
+    return bert, vader
+bert_model, vader_analyzer = load_models()
 # -------------------------------
+# 🧠 ฟังก์ชันแปลงชื่อบริษัท <-> ตัวย่อหุ้น
 # -------------------------------
+@st.cache_data(ttl=86400)
 def resolve_company_symbol(keyword: str):
     keyword = keyword.strip()
     ticker = None
     try:
         data = yf.Ticker(keyword)
         info = data.info
+        if "symbol" in info and info["symbol"]:
             ticker = info["symbol"]
             name = info.get("longName", info.get("shortName", keyword))
         else:
             url = f"https://query2.finance.yahoo.com/v1/finance/search?q={keyword}"
             res = requests.get(url).json()
             if "quotes" in res and len(res["quotes"]) > 0:
                 q = res["quotes"][0]
+                ticker = q.get("symbol")
+                name = q.get("longname", q.get("shortname", keyword))
+    except Exception as e:
+        st.warning(f"⚠️ ไม่สามารถค้นหาข้อมูลบริษัทได้: {e}")
+    if not ticker:
         ticker = keyword.upper()
+    if not name:
         name = keyword.capitalize()
     return name, ticker
 # -------------------------------
+# 📰 ดึงข่าวย้อนหลัง 7 วัน
 # -------------------------------
+@st.cache_data(ttl=3600)
+def fetch_news(company, symbol):
+    to_date = datetime.utcnow()
+    from_date = to_date - timedelta(days=7)
+    query = f"({company} OR {symbol}) finance stock"
+    url = (
+        f"https://newsapi.org/v2/everything?"
+        f"q={query}&from={from_date.date()}&to={to_date.isoformat()}&"
+        f"language=en&sortBy=publishedAt&pageSize=100&apiKey={API_KEY}"
+    )
+    res = requests.get(url)
+    data = res.json()
+    if data.get("status") != "ok":
+        st.error("❌ ดึงข้อมูลข่าวไม่สำเร็จ")
         return pd.DataFrame()
+    articles = data.get("articles", [])
+    df = pd.DataFrame([{
+        "date": datetime.fromisoformat(a["publishedAt"].replace("Z", "+00:00")),
+        "title": a["title"],
+        "description": a["description"],
+        "source": a["source"]["name"],
+        "url": a["url"],
+    } for a in articles])
+    df["text"] = df["title"].fillna('') + " " + df["description"].fillna('')
     df["company"] = company
     df["symbol"] = symbol
     return df
 # -------------------------------
+# 💬 วิเคราะห์อารมณ์ข่าว
 # -------------------------------
+def analyze_sentiment(text, models):
+    bert, vader = models
+    if not text.strip():
+        return 0
+    try:
+        vader_score = vader.polarity_scores(text)["compound"]
+        tb_score = TextBlob(text).sentiment.polarity
+        bert_res = bert(text[:512])[0]
+        label_map = {
+            "1 star": -1, "2 stars": -0.5, "3 stars": 0,
+            "4 stars": 0.5, "5 stars": 1
+        }
+        bert_score = label_map.get(bert_res["label"], 0)
+        return np.mean([vader_score, tb_score, bert_score])
+    except Exception:
         return 0
 # -------------------------------
+# 📈 สร้างโมเดลพยากรณ์
 # -------------------------------
 def forecast_sentiment_trend(df):
+    # ensure datetime format
+    df["date"] = pd.to_datetime(df["date"], errors="coerce")
+    df = df.dropna(subset=["date"])
+    df_daily = df.groupby(df["date"].dt.date)["sentiment"].mean().reset_index()
+    df_daily["date"] = pd.to_datetime(df_daily["date"])
+    df_daily["days"] = (df_daily["date"] - df_daily["date"].min()).dt.days
+    X = df_daily["days"].values.reshape(-1, 1)
+    y = df_daily["sentiment"].values
+    model = make_pipeline(PolynomialFeatures(2), Ridge(alpha=1.0))
+    model.fit(X, y)
+    last_day = df_daily["days"].max()
+    future_days = np.arange(last_day + 1, last_day + 8).reshape(-1, 1)
+    future_preds = model.predict(future_days)
+    future_dates = [df_daily["date"].max() + timedelta(days=i) for i in range(1, 8)]
     forecast_df = pd.DataFrame({"date": future_dates, "predicted_sentiment": future_preds})
+    return df_daily, forecast_df
 # -------------------------------
+# 📊 ส่วนแสดงผลหลัก
 # -------------------------------
+st.title("📈 News Sentiment & Stock Tracker")
+keyword = st.text_input("🔍 ค้นหาบริษัทหรือตัวย่อหุ้น (เช่น Apple หรือ AAPL):", "AAPL")
+if st.button("Analyze"):
+    company, symbol = resolve_company_symbol(keyword)
+    st.info(f"📊 กำลังวิเคราะห์ข่าวของ **{company} ({symbol})**...")
+    news_df = fetch_news(company, symbol)
     if news_df.empty:
+        st.warning("ไม่พบข่าวในช่วง 7 วันที่ผ่านมา")
+        st.stop()
+    news_df["sentiment"] = news_df["text"].apply(lambda x: analyze_sentiment(x, (bert_model, vader_analyzer)))
+    avg_sent = news_df["sentiment"].mean()
+    st.metric("📈 ค่าเฉลี่ยอารมณ์ข่าว (7 วัน)", f"{avg_sent:.2f}",
+              "Positive" if avg_sent > 0 else "Negative" if avg_sent < 0 else "Neutral")
+    # -------------------------------
+    # 📈 แนวโน้มอารมณ์ + ราคาหุ้น
+    # -------------------------------
+    st.subheader("📊 แนวโน้มอารมณ์ข่าว & ราคาหุ้น")
+    df_actual, df_forecast = forecast_sentiment_trend(news_df)
+    # ดึงราคาหุ้นจาก yfinance
+    price_df = yf.download(symbol, period="14d", interval="1d")
+    price_df = price_df.reset_index()[["Date", "Close"]]
+    price_df.rename(columns={"Date": "date"}, inplace=True)
+    price_df["date"] = pd.to_datetime(price_df["date"]).dt.date
+    df_actual["date"] = pd.to_datetime(df_actual["date"]).dt.date
+    df_forecast["date"] = pd.to_datetime(df_forecast["date"]).dt.date
+    # สร้างกราฟรวม
+    fig = go.Figure()
+    fig.add_trace(go.Scatter(
+        x=df_actual["date"], y=df_actual["sentiment"],
+        mode="lines+markers", name="Actual Sentiment", line=dict(color="blue")
+    ))
+    fig.add_trace(go.Scatter(
+        x=df_forecast["date"], y=df_forecast["predicted_sentiment"],
+        mode="lines+markers", name="Predicted Sentiment (Next 7 Days)",
+        line=dict(color="orange", dash="dash")
+    ))
+    fig.add_trace(go.Scatter(
+        x=price_df["date"], y=price_df["Close"],
+        mode="lines+markers", name=f"{symbol} Stock Price",
+        line=dict(color="green"), yaxis="y2"
+    ))
+    fig.update_layout(
+        title=f"📈 แนวโน้มอารมณ์ข่าว & ราคาหุ้น ({symbol})",
+        xaxis=dict(title="วันที่"),
+        yaxis=dict(title="Sentiment", side="left", range=[-1, 1]),
+        yaxis2=dict(title="Stock Price (USD)", overlaying="y", side="right", showgrid=False),
+        legend=dict(x=0, y=1.1, orientation="h"),
+        hovermode="x unified",
+        template="plotly_white"
+    )
+    st.plotly_chart(fig, use_container_width=True)
+    # -------------------------------
+    # 📰 แสดงข่าวที่ใช้วิเคราะห์
+    # -------------------------------
+    st.subheader("📰 ข่าวที่ใช้วิเคราะห์")
+    st.dataframe(news_df[["date", "source", "title", "sentiment"]])
+# -------------------------------
+# 📚 โหลด NLTK
+# -------------------------------
+try:
+    nltk.download("punkt", quiet=True)
+    nltk.download("stopwords", quiet=True)
+except:
+    pass