Spaces:

Thivjan11
/

KIA_FX_Project

Sleeping

App Files Files Community

Thivjan11 commited on May 26, 2025

Commit

1f6124c

verified ·

1 Parent(s): d599779

Upload 5 files

Browse files

Files changed (5) hide show

READ.ME +118 -0
app.py +130 -0
best_forex_model.pkl +3 -0
final_dataset.csv +0 -0
requirement.txt +8 -0

READ.ME ADDED Viewed

	@@ -0,0 +1,118 @@

+# Forex Wechselkurs Prognose
+## Projektbeschreibung
+Prognostiziert zukünftige Wechselkurse für wichtige Währungspaare (EUR/USD, GBP/USD, AUD/USD, USD/CHF, USD/JPY) mithilfe von Machine Learning-Modellen und Wirtschaftsindikatoren. Das Projekt kombiniert Finanzmarktdaten mit makroökonomischen Variablen zur Vorhersage von Währungsbewegungen.
+## Installation & Setup
+### Voraussetzungen PIP
+!pip install yfinance pandas_datareader gradio matplotlib scikit-learn statsmodels
+# Abhängigkeiten installieren
+pip install -r requirements.txt
+# Web-App starten
+python app.py
+```
+Die Gradio-App startet auf: http://127.0.0.1:7860
+### Vollständige Analyse ausführen
+```bash
+jupyter notebook project.ipynb
+```
+## Ergebnisse
+Linear Regression erwies sich als das beste Modell für alle Währungspaare und erreichte R²-Werte über 0,89 für alle Paare. Das Modell für AUD/USD zeigte die beste Performance mit einem R² von 0,9291. ARIMA-Modelle zeigten durchweg schlechte Performance mit stark negativen R²-Werten, was auf deren Ungeeignetheit für diese Datenstruktur hinweist.
+## Name & URL
+| Name | URL |
+|------|-----|
+| Gradio App | Lokale Anwendung (http://127.0.0.1:7860) |
+| Code | GitHub Repository |
+## Datenquellen und Features pro Quelle
+| Datenquelle | Features |
+|-------------|----------|
+| Yahoo Finance | EUR/USD, GBP/USD, AUD/USD, USD/CHF, USD/JPY (Schlusskurse) |
+| FRED (Federal Reserve Economic Data) | CPI (Verbraucherpreisindex), FEDFUNDS (Leitzins), UNRATE (Arbeitslosenquote) |
+## Erstellte Features
+| Feature | Beschreibung |
+|---------|--------------|
+| lag_1, lag_2, lag_3 | Verzögerte Werte (1, 2 und 3 Tage) für alle Währungspaare |
+| ma_3, ma_7, ma_14 | Gleitende Durchschnitte (3, 7, 14 Tage) für Kurse und Wirtschaftsdaten |
+| std_7, std_14 | Standardabweichung (7 und 14 Tage) für Volatilitätsmessung |
+| CPI_lag1, Rate_lag1, Unemployment_lag1 | Verzögerte Wirtschaftsindikatoren |
+| month, quarter, day_of_week, day_of_year | Zeitbasierte Features |
+| target | Verschobener Zielwert (nächster Tag) für jedes Währungspaar |
+## Modelltraining
+### Datenmenge
+* Insgesamt 2.557 Tageswerte pro Währungspaar (2015-2025)
+* 5 Währungspaare × 3 Modelle = 15 trainierte Modelle
+### Datenaufteilung (Train/Test)
+* Zeitbasierte Aufteilung: Training bis 31.12.2023, Test ab 01.01.2024
+* Verwendung von TimeSeriesSplit für zeitreihengerechte Validierung
+## Performance
+| Nr. | Modell | Performance | Features | Beschreibung |
+|-----|--------|-------------|----------|--------------|
+| 1 | Random Forest (EUR/USD) | R²: 0,8947, RMSE: 0,0072 | Alle technischen + fundamentalen Features | Gute Performance, robust |
+| 2 | Linear Regression (EUR/USD) | R²: 0,9168, RMSE: 0,0064 | Alle Features | Beste Performance für EUR/USD |
+| 3 | Random Forest (GBP/USD) | R²: 0,8760, RMSE: 0,0083 | Alle Features | Solide Performance |
+| 4 | Linear Regression (GBP/USD) | R²: 0,8959, RMSE: 0,0076 | Alle Features | Beste Performance für GBP/USD |
+| 5 | Random Forest (AUD/USD) | R²: 0,7959, RMSE: 0,0079 | Alle Features | Schwächere Performance |
+| 6 | Linear Regression (AUD/USD) | R²: 0,9291, RMSE: 0,0047 | Alle Features | **Bestes Gesamtmodell** |
+| 7 | Random Forest (USD/CHF) | R²: 0,9088, RMSE: 0,0064 | Alle Features | Starke Performance |
+| 8 | Linear Regression (USD/CHF) | R²: 0,9248, RMSE: 0,0058 | Alle Features | Beste Performance für USD/CHF |
+| 9 | Random Forest (USD/JPY) | R²: 0,2209, RMSE: 4,1909 | Alle Features | Schwache Performance bei JPY |
+| 10 | Linear Regression (USD/JPY) | R²: 0,9236, RMSE: 1,3126 | Alle Features | Sehr gute Performance |
+| 11 | ARIMA (alle Paare) | R²: -36.703.921 (Durchschnitt) | Nur Zeitreihe | Durchweg schlechte Performance |
+**Bestes Modell**: Linear Regression für AUD/USD mit R² = 0,9291 und einer Richtungsgenauigkeit von 51,1%
+## Feature Importance (Top Features - Random Forest)
+**Wichtigste Features über alle Währungspaare:**
+- **ma30**: Gleitender 30-Tage-Durchschnitt (höchste Vorhersagekraft)
+- **lag1**: Vorheriger Tageskurs
+- **month**: Saisonale Effekte
+- **day_of_year**: Jahreszeit-Indikatoren
+- **CPI/Rate Features**: Makroökonomische Indikatoren
+## Technische Hinweise
+### Bekannte Einschränkungen
+- ARIMA-Modelle zeigten extrem schlechte Performance aufgrund der Forex-Datencharakteristika
+- Verwendung von Random Walk als Baseline für Vergleichszwecke
+- Feature Engineering fokussiert auf technische und makroökonomische Indikatoren
+### Dateistruktur
+```
+├── project.ipynb          # Hauptanalyse & Training
+├── app.py                 # Gradio Web-App für Deployment
+├── requirements.txt       # Python-Abhängigkeiten
+├── final_dataset.csv      # Verarbeiteter Datensatz
+├── best_forex_model.pkl   # Trainiertes Modell
+└── README.md             # Projektdokumentation
+```
+### Dependencies (requirements.txt)
+```
+yfinance==0.2.61
+pandas_datareader==0.10.0
+gradio==5.21.0
+matplotlib==3.9.3
+scikit-learn==1.6.1
+statsmodels==0.14.4
+pandas==2.2.3
+numpy==2.2.6
+```

app.py ADDED Viewed

	@@ -0,0 +1,130 @@

+import gradio as gr
+import pickle
+import numpy as np
+import pandas as pd
+# Modell und Zielspalte laden
+with open("best_forex_model.pkl", "rb") as f:
+    model_data = pickle.load(f)
+model = model_data['model']
+model_name = model_data['model_name']
+model_type = model_data['model_type']
+features = model_data['features']
+performance = model_data['performance']
+target_col = model_data['target_column']
+print(f"🚀 Modell geladen: {model_name} für {target_col}")
+print(f"📊 Performance: R² = {performance.get('R²', 'N/A'):.4f}")
+def predict_best_forex_model(current_value, cpi, rate, unemployment):
+    try:
+        # Aktuelle Datenbasis laden
+        final_df = pd.read_csv("final_dataset.csv", parse_dates=['Date'], index_col='Date')
+        # Einfache Feature-Map basierend auf Input
+        # Für die meisten Features verwenden wir den aktuellen Input oder 0
+        feature_values = []
+        for feat in features:
+            if 'lag1' in feat and target_col in feat:
+                # Lag1 des Zielpaares = aktueller Input
+                feature_values.append(current_value)
+            elif 'ma' in feat and target_col in feat:
+                # Moving Averages des Zielpaares ≈ aktueller Wert
+                feature_values.append(current_value)
+            elif 'CPI' in feat:
+                if 'lag1' in feat:
+                    feature_values.append(cpi)
+                elif 'ma30' in feat:
+                    feature_values.append(cpi)
+                elif 'change' in feat:
+                    feature_values.append(0.02)  # ~2% typische CPI Änderung
+                else:
+                    feature_values.append(cpi)
+            elif 'Rate' in feat:
+                if 'lag1' in feat:
+                    feature_values.append(rate)
+                elif 'ma30' in feat:
+                    feature_values.append(rate)
+                elif 'diff' in feat:
+                    feature_values.append(0.0)  # Keine Rate-Änderung angenommen
+                else:
+                    feature_values.append(rate)
+            elif 'Unemployment' in feat:
+                if 'lag1' in feat:
+                    feature_values.append(unemployment)
+                elif 'ma30' in feat:
+                    feature_values.append(unemployment)
+                elif 'diff' in feat:
+                    feature_values.append(0.0)  # Keine Unemployment-Änderung
+                else:
+                    feature_values.append(unemployment)
+            elif feat in ['month', 'quarter', 'day_of_week', 'day_of_year']:
+                # Zeitfeatures: Verwende letzte bekannte Werte
+                if not final_df.empty:
+                    last_date = final_df.index[-1]
+                    if feat == 'month':
+                        feature_values.append(last_date.month)
+                    elif feat == 'quarter':
+                        feature_values.append(last_date.quarter)
+                    elif feat == 'day_of_week':
+                        feature_values.append(last_date.dayofweek)
+                    elif feat == 'day_of_year':
+                        feature_values.append(last_date.dayofyear)
+                else:
+                    feature_values.append(1)  # Default
+            else:
+                # Andere Currency Pairs oder unbekannte Features
+                # Verwende Durchschnittswerte oder 0
+                if any(pair in feat for pair in ['EUR/USD', 'GBP/USD', 'AUD/USD', 'USD/CHF', 'USD/JPY']):
+                    feature_values.append(1.0)  # Typischer FX-Wert
+                else:
+                    feature_values.append(0.0)
+        # Feature-Vektor erstellen
+        X_pred = np.array([feature_values])
+        # Vorhersage
+        if model_type == "regression":
+            prediction = model.predict(X_pred)[0]
+            confidence = "Hoch" if performance.get('R²', 0) > 0.9 else "Mittel"
+            return f"📈 Prognose für {target_col}: {prediction:.4f}\n🎯 Modell: {model_name}\n📊 Konfidenz: {confidence} (R² = {performance.get('R²', 0):.3f})"
+        else:
+            return f"⚠️ Zeitreihenmodell nicht unterstützt in dieser Demo"
+    except Exception as e:
+        error_msg = str(e)
+        return f"❌ Fehler bei Vorhersage: {error_msg}\n\n🔍 Debug Info:\n- Features benötigt: {len(features)}\n- Target: {target_col}\n- Model: {model_name}"
+# Gradio-Interface definieren
+iface = gr.Interface(
+    fn=predict_best_forex_model,
+    inputs=[
+        gr.Number(value=1.0500, label=f"Aktueller Kurs von {target_col}", precision=4),
+        gr.Number(value=310.0, label="US Verbraucherpreisindex (CPI)", precision=1),
+        gr.Number(value=5.25, label="US Leitzins (%)", precision=2),
+        gr.Number(value=4.0, label="US Arbeitslosenquote (%)", precision=1),
+    ],
+    outputs=gr.Textbox(label="📈 Forex Prognose", lines=4),
+    title="🚀 Forex-Kursprognose mit Machine Learning",
+    description=f"""
+    Dieses Tool prognostiziert den zukünftigen Wechselkurs für **{target_col}** basierend auf US-Wirtschaftsdaten.
+    **Modell**: {model_name} | **Performance**: R² = {performance.get('R²', 'N/A'):.4f}
+    Geben Sie US-Wirtschaftsdaten ein, um eine Prognose zu erhalten.
+    """,
+    theme=gr.themes.Soft(),
+    examples=[
+        [1.0500, 310.0, 5.25, 4.0],
+        [1.0600, 315.0, 5.50, 3.8],
+        [1.0400, 308.0, 5.00, 4.2]
+    ]
+)
+# App starten
+if __name__ == "__main__":
+    print(f"\n🎯 Starting Gradio App für {target_col} Prognose...")
+    print(f"📊 Features verwendet: {len(features)}")
+    iface.launch(share=True, debug=True)

best_forex_model.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:38d95a73112674ab3b175ebc3f13757c88de1a4123e63cabfc6e8604d0864a16
+size 2911

final_dataset.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

requirement.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+yfinance==0.2.61
+pandas_datareader==0.10.0
+gradio==5.21.0
+matplotlib==3.9.3
+scikit-learn==1.6.1
+statsmodels==0.14.4
+pandas==2.2.3
+numpy==2.2.6