Spaces:

AlanRex
/

AITEST

Running

App Files Files Community

AlanRex commited on Sep 19, 2025

Commit

9bb6ac9

verified ·

1 Parent(s): 819d41a

Update app.py

Browse files

Files changed (1) hide show

app.py +65 -130

app.py CHANGED Viewed

@@ -29,7 +29,7 @@ from model_predictor import XGBoostModel
 # 【【【模型切換開關】】】
 # False: 使用簡易統計模型 (預設)
 # True:  使用 model_predictor.py 中的進階 XGBoost 模型
-USE_ADVANCED_MODEL = True
 # ========================= CACHE 設定 START =========================
 # 分析結果的快取字典
@@ -242,7 +242,7 @@ def simple_statistical_predict(data, predict_days=5):
 def advanced_xgboost_predict(predict_days=5):
     """
-    【進階模型】使用 XGBoost 模型進行預測
     """
     try:
         print(f"開始使用 XGBoost 模型進行 {predict_days} 天預測...")
@@ -259,12 +259,6 @@ def advanced_xgboost_predict(predict_days=5):
         # 計算技術指標
         taiex_data = calculate_technical_indicators(taiex_data)
-        # 獲取美股市場數據
-        us_market = get_us_market_data()
-        # 獲取匯率數據
-        exchange_rate = get_exchange_rate()
         # 獲取新聞情緒分數
         try:
             if predictor is not None:
@@ -279,127 +273,71 @@ def advanced_xgboost_predict(predict_days=5):
         # 準備特徵數據 (使用最新的數據點)
         latest_data = taiex_data.iloc[-1]
-        # 建立特徵向量 (按照訓練數據記錄的順序)
-        # 先檢查每個技術指標是否存在並記錄狀態
         tech_indicators_status = {}
-        # RSI 檢查
-        rsi_value = latest_data['RSI'] if not pd.isna(latest_data['RSI']) else 50
-        tech_indicators_status['RSI'] = {
-            'value': rsi_value,
-            'is_real': not pd.isna(latest_data['RSI']),
-            'source': 'calculated' if not pd.isna(latest_data['RSI']) else 'default'
-        }
-        # MACD 相關檢查
-        macd_value = latest_data['MACD'] if not pd.isna(latest_data['MACD']) else 0
-        macd_signal_value = latest_data['MACD_Signal'] if not pd.isna(latest_data['MACD_Signal']) else 0
-        macd_hist_value = latest_data['MACD_Histogram'] if not pd.isna(latest_data['MACD_Histogram']) else 0
-        tech_indicators_status['MACD'] = {
-            'value': macd_value,
-            'is_real': not pd.isna(latest_data['MACD']),
-            'source': 'calculated' if not pd.isna(latest_data['MACD']) else 'default'
-        }
-        tech_indicators_status['MACD_Signal'] = {
-            'value': macd_signal_value,
-            'is_real': not pd.isna(latest_data['MACD_Signal']),
-            'source': 'calculated' if not pd.isna(latest_data['MACD_Signal']) else 'default'
-        }
-        tech_indicators_status['MACD_Histogram'] = {
-            'value': macd_hist_value,
-            'is_real': not pd.isna(latest_data['MACD_Histogram']),
-            'source': 'calculated' if not pd.isna(latest_data['MACD_Histogram']) else 'default'
-        }
-        # KD 指標檢查
-        k_value = latest_data['K'] if not pd.isna(latest_data['K']) else 50
-        d_value = latest_data['D'] if not pd.isna(latest_data['D']) else 50
-        tech_indicators_status['K'] = {
-            'value': k_value,
-            'is_real': not pd.isna(latest_data['K']),
-            'source': 'calculated' if not pd.isna(latest_data['K']) else 'default'
-        }
-        tech_indicators_status['D'] = {
-            'value': d_value,
-            'is_real': not pd.isna(latest_data['D']),
-            'source': 'calculated' if not pd.isna(latest_data['D']) else 'default'
         }
-        # DMI 指標檢查
-        plus_di_value = latest_data['+DI'] if not pd.isna(latest_data['+DI']) else 25
-        minus_di_value = latest_data['-DI'] if not pd.isna(latest_data['-DI']) else 25
-        adx_value = latest_data['ADX'] if not pd.isna(latest_data['ADX']) else 25
-        tech_indicators_status['+DI'] = {
-            'value': plus_di_value,
-            'is_real': not pd.isna(latest_data['+DI']),
-            'source': 'calculated' if not pd.isna(latest_data['+DI']) else 'default'
-        }
-        tech_indicators_status['-DI'] = {
-            'value': minus_di_value,
-            'is_real': not pd.isna(latest_data['-DI']),
-            'source': 'calculated' if not pd.isna(latest_data['-DI']) else 'default'
-        }
-        tech_indicators_status['ADX'] = {
-            'value': adx_value,
-            'is_real': not pd.isna(latest_data['ADX']),
-            'source': 'calculated' if not pd.isna(latest_data['ADX']) else 'default'
-        }
-        # 建立特徵向量
         features_list = [
-            latest_data['Close'],  # close
-            latest_data['Volume'],  # volume
-            exchange_rate,  # rate
-            us_market['DJI'],  # DJI
-            us_market['NAS'],  # NAS
-            us_market['SOX'],  # SOX
-            us_market['S&P_500'],  # S&P_500
-            us_market['TSM_ADR'],  # TSM_ADR
-            sentiment_score_raw,  # NEWS (使用原始 sentiment_score_raw)
-            rsi_value,  # RSI
-            macd_value,  # MACD
-            macd_signal_value,  # MACDsign
-            macd_hist_value,  # MACDvol
-            k_value,  # K
-            d_value,  # D
-            plus_di_value,  # +DI
-            minus_di_value,  # -DI
-            adx_value,  # ADX
-            15,    # business_climate (手動填入值)
-            46.7   # PMI (手動填入值)
         ]
-        # 轉換為 DataFrame (XGBoost 模型期望的格式)
         column_names = [
-            'close', 'volume', 'rate', 'DJI', 'NAS', 'SOX', 'S&P_500', 'TSM_ADR',
-            'NEWS', 'RSI', 'MACD', 'MACDsign', 'MACDvol', 'K', 'D',
-            '+DI', '-DI', 'ADX', 'business_climate', 'PMI'
         ]
         input_df = pd.DataFrame([features_list], columns=column_names)
         # 詳細的資料驗證日誌
         print("=" * 50)
-        print("XGBoost 模型輸入特徵詳細檢查報告")
         print("=" * 50)
-        # 基本市場數據
-        print("📊 基本市場數據:")
-        print(f"  收盤價 (close): {latest_data['Close']:.2f}")
-        print(f"  成交量 (volume): {latest_data['Volume']:,.0f}")
-        print(f"  匯率 (rate): {exchange_rate:.4f}")
-        # 美股指數
-        print("\n🇺🇸 美股指數數據:")
-        for key, value in us_market.items():
-            status = "✅ 正常" if value > 0 else "⚠️ 可能異常(=0)"
-            print(f"  {key}: {value:.2f} {status}")
-        # 新聞情緒
-        print(f"\n📰 新聞情緒 (NEWS): {sentiment_score_raw:.6f}")
         if sentiment_score_raw == 0:
             print("  ⚠️ 新聞情緒分數為0，可能無新聞數據")
         else:
@@ -407,32 +345,28 @@ def advanced_xgboost_predict(predict_days=5):
         # 技術指標詳細狀態
         print("\n📈 技術指標狀態:")
-        for indicator, status in tech_indicators_status.items():
             status_symbol = "✅" if status['is_real'] else "⚠️"
-            source_info = "實際計算值" if status['is_real'] else "預設替代值"
-            print(f"  {indicator}: {status['value']:.4f} {status_symbol} ({source_info})")
-        # 手動填入數據
-        print("\n🔧 手動填入數據:")
-        print(f"  business_climate: 15 ✅")
-        print(f"  PMI: 46.7 ✅")
-        # 統計資料完整性
         real_indicators = sum(1 for status in tech_indicators_status.values() if status['is_real'])
         total_indicators = len(tech_indicators_status)
         completeness = (real_indicators / total_indicators) * 100
-        print(f"\n📋 技術指標完整性統計:")
         print(f"  實際計算指標: {real_indicators}/{total_indicators} ({completeness:.1f}%)")
-        if completeness < 80:
-            print("  ⚠️ 警告：超過20%的技術指標使用預設值，可能影響預測準確性")
         else:
-            print("  ✅ 技術指標完整性良好")
-        # 顯示完整輸入向量
         print(f"\n🔢 完整特徵向量 (共{len(features_list)}個特徵):")
         for i, (name, value) in enumerate(zip(column_names, features_list)):
-            print(f"  [{i:2d}] {name:15s}: {value:10.4f}")
         print("=" * 50)
@@ -453,7 +387,7 @@ def advanced_xgboost_predict(predict_days=5):
         pred_key = pred_mapping[closest_day]
         predicted_price = predictions[pred_key]
-        current_price = features_list[0]  # close price
         change_pct = ((predicted_price - current_price) / current_price) * 100
         print(f"XGBoost 預測完成:")
@@ -461,6 +395,7 @@ def advanced_xgboost_predict(predict_days=5):
         print(f"- 當前價格: {current_price:.2f}")
         print(f"- 預測價格: {predicted_price:.2f}")
         print(f"- 預測變化: {change_pct:+.2f}%")
         return {
             'predicted_price': predicted_price,
@@ -619,12 +554,12 @@ def generate_gemini_analysis(stock_name, stock_symbol, period, data):
         **你的任務:**
         1.  **基本面分析 (約 150 字):**
             -   評論這家公司的產業地位、近期營運亮點或挑戰。
-            -   提及任何可能影響其基本面的關鍵因素 (例如：公告財報的最近日期、法說會最近日期、最近一次的EPS數值、最近一個月的MOM%的數值、政策、供應鏈變化等)。
             -   請用專業、客觀的語氣撰寫。
         2.  **市場展望與投資建議 (約 150 字):**
             -   基於上述所有資訊，提供對該股票的短期和中期市場展望。
-            -   提出具體的投資建議，例如：適合何種類型的投資(價值投資、波段投資、動能投資)、潛在的風險點。
             -   請直接提供分析內容，不要包含任何問候語。
         **輸出格式:**

 # 【【【模型切換開關】】】
 # False: 使用簡易統計模型 (預設)
 # True:  使用 model_predictor.py 中的進階 XGBoost 模型
+USE_ADVANCED_MODEL = False
 # ========================= CACHE 設定 START =========================
 # 分析結果的快取字典
 def advanced_xgboost_predict(predict_days=5):
     """
+    【進階模型】使用 XGBoost 模型進行預測 - 簡化版 (11個特徵)
     """
     try:
         print(f"開始使用 XGBoost 模型進行 {predict_days} 天預測...")
         # 計算技術指標
         taiex_data = calculate_technical_indicators(taiex_data)
         # 獲取新聞情緒分數
         try:
             if predictor is not None:
         # 準備特徵數據 (使用最新的數據點)
         latest_data = taiex_data.iloc[-1]
+        # 技術指標檢查和狀態記錄
         tech_indicators_status = {}
+        # 檢查各技術指標並記錄狀態
+        indicators_map = {
+            'RSI': (latest_data['RSI'], 50),
+            'MACD': (latest_data['MACD'], 0),
+            'MACDsign': (latest_data['MACD_Signal'], 0),
+            'MACDvol': (latest_data['MACD_Histogram'], 0),
+            'K': (latest_data['K'], 50),
+            'D': (latest_data['D'], 50),
+            '+DI': (latest_data['+DI'], 25),
+            '-DI': (latest_data['-DI'], 25),
+            'ADX': (latest_data['ADX'], 25),
         }
+        processed_values = {}
+        for indicator, (value, default) in indicators_map.items():
+            if pd.isna(value):
+                processed_values[indicator] = default
+                tech_indicators_status[indicator] = {
+                    'value': default,
+                    'is_real': False,
+                    'source': 'default'
+                }
+            else:
+                processed_values[indicator] = value
+                tech_indicators_status[indicator] = {
+                    'value': value,
+                    'is_real': True,
+                    'source': 'calculated'
+                }
+        # 建立簡化的特徵向量 (按您指定的順序)
         features_list = [
+            latest_data['Close'],           # close
+            sentiment_score_raw,            # NEWS
+            processed_values['MACD'],       # MACD
+            processed_values['MACDsign'],   # MACDsign
+            processed_values['MACDvol'],    # MACDvol
+            processed_values['K'],          # K
+            processed_values['D'],          # D
+            processed_values['+DI'],        # +DI
+            processed_values['-DI'],        # -DI
+            processed_values['ADX'],        # ADX
+            processed_values['RSI'],        # RSI
         ]
+        # 對應的欄位名稱
         column_names = [
+            'close', 'NEWS', 'MACD', 'MACDsign', 'MACDvol',
+            'K', 'D', '+DI', '-DI', 'ADX', 'RSI'
         ]
+        # 轉換為 DataFrame (XGBoost 模型期望的格式)
         input_df = pd.DataFrame([features_list], columns=column_names)
         # 詳細的資料驗證日誌
         print("=" * 50)
+        print("XGBoost 簡化模型輸入特徵檢查報告")
         print("=" * 50)
+        # 基本資料
+        print(f"收盤價 (close): {latest_data['Close']:.2f}")
+        print(f"新聞情緒 (NEWS): {sentiment_score_raw:.6f}")
         if sentiment_score_raw == 0:
             print("  ⚠️ 新聞情緒分數為0，可能無新聞數據")
         else:
         # 技術指標詳細狀態
         print("\n📈 技術指標狀態:")
+        for indicator in ['MACD', 'MACDsign', 'MACDvol', 'K', 'D', '+DI', '-DI', 'ADX', 'RSI']:
+            status = tech_indicators_status[indicator]
             status_symbol = "✅" if status['is_real'] else "⚠️"
+            source_info = "實際計算" if status['is_real'] else "預設值"
+            print(f"  {indicator:10s}: {status['value']:8.4f} {status_symbol} ({source_info})")
+        # 統計完整性
         real_indicators = sum(1 for status in tech_indicators_status.values() if status['is_real'])
         total_indicators = len(tech_indicators_status)
         completeness = (real_indicators / total_indicators) * 100
+        print(f"\n📋 技術指標完整性:")
         print(f"  實際計算指標: {real_indicators}/{total_indicators} ({completeness:.1f}%)")
+        if completeness < 70:
+            print("  ⚠️ 警告：超過30%的指標使用預設值，可能影響預測準確性")
         else:
+            print("  ✅ 指標完整性良好")
+        # 顯示完整特徵向量
         print(f"\n🔢 完整特徵向量 (共{len(features_list)}個特徵):")
         for i, (name, value) in enumerate(zip(column_names, features_list)):
+            print(f"  [{i:2d}] {name:10s}: {value:12.6f}")
         print("=" * 50)
         pred_key = pred_mapping[closest_day]
         predicted_price = predictions[pred_key]
+        current_price = latest_data['Close']
         change_pct = ((predicted_price - current_price) / current_price) * 100
         print(f"XGBoost 預測完成:")
         print(f"- 當前價格: {current_price:.2f}")
         print(f"- 預測價格: {predicted_price:.2f}")
         print(f"- 預測變化: {change_pct:+.2f}%")
+        print(f"- 使用特徵數: {len(features_list)} 個")
         return {
             'predicted_price': predicted_price,
         **你的任務:**
         1.  **基本面分析 (約 150 字):**
             -   評論這家公司的產業地位、近期營運亮點或挑戰。
+            -   提及任何可能影響其基本面的關鍵因素 (例如：財報、法說會、政策、供應鏈變化等)。
             -   請用專業、客觀的語氣撰寫。
         2.  **市場展望與投資建議 (約 150 字):**
             -   基於上述所有資訊，提供對該股票的短期和中期市場展望。
+            -   提出具體的投資建議，例如：適合何種類型的投資人、潛在的風險點。
             -   請直接提供分析內容，不要包含任何問候語。
         **輸出格式:**