SentimentAnalyzerFinbert

Sleeping

App Files Files Community

KYTHY commited on Nov 11

Commit

0456220

verified ·

1 Parent(s): 95ceb05

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -45

app.py CHANGED Viewed

@@ -2,7 +2,6 @@ import streamlit as st
 import requests
 import pandas as pd
 from datetime import datetime, timedelta
-from transformers import pipeline
 from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
 from textblob import TextBlob
 import nltk
@@ -23,29 +22,12 @@ API_KEY = "88bc396d4eab4be494a4b86ec842db47"
 # --------------------------
 # UTILITIES
 # --------------------------
-@st.cache_resource
-def load_models():
-    st.info("Loading sentiment models...")
-    bert_model = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")
-    vader = SentimentIntensityAnalyzer()
-    return bert_model, vader
-def analyze_text(text, bert_model, vader):
     if not text.strip():
         return 0
     vader_score = vader.polarity_scores(text)["compound"]
     textblob_score = TextBlob(text).sentiment.polarity
-    bert_result = bert_model(text[:512])[0]
-    label_map = {
-        "1 star": -1,
-        "2 stars": -0.5,
-        "3 stars": 0,
-        "4 stars": 0.5,
-        "5 stars": 1
-    }
-    bert_score = label_map.get(bert_result["label"], 0)
-    return np.mean([vader_score, textblob_score, bert_score])
 def generate_wordcloud(text):
@@ -57,46 +39,60 @@ def generate_wordcloud(text):
 # --------------------------
-# ฟังก์ชันใหม่: แปลงตัวย่อหุ้น -> ชื่อบริษัท
 # --------------------------
-@st.cache_data(ttl=86400)
-def resolve_company_name(symbol):
-    """รับตัวย่อหุ้น เช่น AAPL แล้วดึงชื่อบริษัท เช่น Apple Inc."""
     try:
-        ticker = yf.Ticker(symbol)
-        info = ticker.info
-        company_name = info.get("longName") or info.get("shortName")
-        if company_name:
-            return company_name
-    except Exception:
-        pass
-    return symbol  # ถ้าไม่เจอ ใช้ symbol เอง
 # --------------------------
-# ดึงข่าว 7 วัน สำหรับ symbol + company name
 # --------------------------
 @st.cache_data(ttl=3600)
-def fetch_financial_news(symbol):
-    company_name = resolve_company_name(symbol)
     to_date = datetime.now().strftime('%Y-%m-%d')
     from_date = (datetime.now() - timedelta(days=7)).strftime('%Y-%m-%d')
-    query = f"({symbol} OR \"{company_name}\") finance stock"
     all_articles = []
     page = 1
     while True:
         url = (
             f"https://newsapi.org/v2/everything?"
-            f"q={query}&"
             f"from={from_date}&to={to_date}&"
             f"language=en&sortBy=publishedAt&"
             f"pageSize=100&page={page}&apiKey={API_KEY}"
         )
         r = requests.get(url)
         data = r.json()
         if data.get("status") != "ok":
             st.error(f"API Error: {data}")
             break
@@ -142,7 +138,7 @@ def fetch_stock_price(symbol):
 # --------------------------
 def main():
     st.title("📰 SentimentSync NewsAI")
-    st.markdown("วิเคราะห์แนวโน้มอารมณ์ของข่าวย้อนหลัง 7 วัน พร้อมพยากรณ์ และรวมราคาหุ้น")
     # Sidebar
     with st.sidebar:
@@ -153,7 +149,7 @@ def main():
         st.info("กรอกคำค้นแล้วกด 'วิเคราะห์เลย' เพื่อเริ่มต้น")
         return
-    bert_model, vader = load_models()
     # ดึงข่าว
     st.info(f"กำล��งดึงข่าวย้อนหลัง 7 วันสำหรับ '{keyword}' ...")
@@ -164,7 +160,7 @@ def main():
     # วิเคราะห์ sentiment
     st.info("กำลังวิเคราะห์อารมณ์ของข่าว...")
-    news_df["sentiment"] = news_df["text"].apply(lambda x: analyze_text(x, bert_model, vader))
     news_df["date"] = pd.to_datetime(news_df["date"])
     avg_sentiment = news_df["sentiment"].mean()
@@ -184,7 +180,7 @@ def main():
     st.image(f"data:image/png;base64,{img}", use_column_width=True)
     # แนวโน้ม + พยากรณ์ + ราคาหุ้น
-    st.subheader("📈 แนวโน้มและพยากรณ์อารมณ์ของข่าว & ราคาหุ้น")
     df_sorted = news_df.sort_values("date").copy()
     df_sorted["timestamp"] = (df_sorted["date"] - df_sorted["date"].min()).dt.days
@@ -199,11 +195,11 @@ def main():
     future_preds = model.predict(future_timestamps.reshape(-1, 1))
     # ดึงราคาหุ้น
-    stock_df = fetch_stock_price(keyword)
     # Plot
     fig = go.Figure()
     # Actual sentiment
     fig.add_trace(go.Scatter(
         x=df_sorted["date"], y=df_sorted["sentiment"],
@@ -220,7 +216,7 @@ def main():
     if not stock_df.empty:
         fig.add_trace(go.Scatter(
             x=stock_df["date"], y=stock_df["price"],
-            mode="lines+markers", name=f"{keyword} Stock Price",
             line=dict(color="green"), yaxis="y2"
         ))

 import requests
 import pandas as pd
 from datetime import datetime, timedelta
 from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
 from textblob import TextBlob
 import nltk
 # --------------------------
 # UTILITIES
 # --------------------------
+def analyze_text(text, vader):
     if not text.strip():
         return 0
     vader_score = vader.polarity_scores(text)["compound"]
     textblob_score = TextBlob(text).sentiment.polarity
+    return np.mean([vader_score, textblob_score])
 def generate_wordcloud(text):
 # --------------------------
+# แปลงชื่อ/ตัวย่อ → (Company Name, Symbol)
 # --------------------------
+def resolve_company_symbol(keyword: str):
+    keyword = keyword.strip()
+    ticker = None
+    name = None
     try:
+        data = yf.Ticker(keyword)
+        info = data.info
+        if "symbol" in info and info["symbol"]:
+            ticker = info["symbol"]
+            name = info.get("longName", info.get("shortName", keyword))
+        else:
+            url = f"https://query2.finance.yahoo.com/v1/finance/search?q={keyword}"
+            res = requests.get(url).json()
+            if "quotes" in res and len(res["quotes"]) > 0:
+                q = res["quotes"][0]
+                ticker = q.get("symbol")
+                name = q.get("longname", q.get("shortname", keyword))
+    except Exception as e:
+        print("Lookup failed:", e)
+    if not ticker:
+        ticker = keyword.upper()
+    if not name:
+        name = keyword.capitalize()
+    return name, ticker
 # --------------------------
+# ดึงข่าว 7 วัน สำหรับ Company + Symbol
 # --------------------------
 @st.cache_data(ttl=3600)
+def fetch_financial_news(keyword):
+    company, symbol = resolve_company_symbol(keyword)
     to_date = datetime.now().strftime('%Y-%m-%d')
     from_date = (datetime.now() - timedelta(days=7)).strftime('%Y-%m-%d')
+    query_keyword = f"({company} OR {symbol}) finance stock"
     all_articles = []
     page = 1
     while True:
         url = (
             f"https://newsapi.org/v2/everything?"
+            f"q={query_keyword}&"
             f"from={from_date}&to={to_date}&"
             f"language=en&sortBy=publishedAt&"
             f"pageSize=100&page={page}&apiKey={API_KEY}"
         )
         r = requests.get(url)
         data = r.json()
         if data.get("status") != "ok":
             st.error(f"API Error: {data}")
             break
 # --------------------------
 def main():
     st.title("📰 SentimentSync NewsAI")
+    st.markdown("วิเคราะห์แนวโน้มอารมณ์ของข่าวย้อนหลัง 7 วัน พร้อมราคาหุ้น")
     # Sidebar
     with st.sidebar:
         st.info("กรอกคำค้นแล้วกด 'วิเคราะห์เลย' เพื่อเริ่มต้น")
         return
+    vader = SentimentIntensityAnalyzer()
     # ดึงข่าว
     st.info(f"กำล��งดึงข่าวย้อนหลัง 7 วันสำหรับ '{keyword}' ...")
     # วิเคราะห์ sentiment
     st.info("กำลังวิเคราะห์อารมณ์ของข่าว...")
+    news_df["sentiment"] = news_df["text"].apply(lambda x: analyze_text(x, vader))
     news_df["date"] = pd.to_datetime(news_df["date"])
     avg_sentiment = news_df["sentiment"].mean()
     st.image(f"data:image/png;base64,{img}", use_column_width=True)
     # แนวโน้ม + พยากรณ์ + ราคาหุ้น
+    st.subheader("📈 แนวโน้มอารมณ์ของข่าว & ราคาหุ้น")
     df_sorted = news_df.sort_values("date").copy()
     df_sorted["timestamp"] = (df_sorted["date"] - df_sorted["date"].min()).dt.days
     future_preds = model.predict(future_timestamps.reshape(-1, 1))
     # ดึงราคาหุ้น
+    _, symbol = resolve_company_symbol(keyword)
+    stock_df = fetch_stock_price(symbol)
     # Plot
     fig = go.Figure()
     # Actual sentiment
     fig.add_trace(go.Scatter(
         x=df_sorted["date"], y=df_sorted["sentiment"],
     if not stock_df.empty:
         fig.add_trace(go.Scatter(
             x=stock_df["date"], y=stock_df["price"],
+            mode="lines+markers", name=f"{symbol} Stock Price",
             line=dict(color="green"), yaxis="y2"
         ))