Spaces:

noah33565
/

NoahsKI

Sleeping

{
  "success": true,
  "content": "...",
  "tokens": {
    "used": 125,
    "total": 5230,
    "remaining": 9994770,
    "max": 10000000,
    "percentage": 0.05
  }
}

Was wird damit gemacht:

used: Tokens in dieser Anfrage (Frage + Antwort)
total: Gesamte Tokens in dieser Session
remaining: Noch verfügbare Tokens
percentage: Prozentuale Nutzung

2️⃣ Optional Token Display in Response Text

Den Chat mit show_tokens: true aufrufen:

curl -X POST http://localhost:5000/api/chat \
  -H "Content-Type: application/json" \
  -d '{
    "message": "Hello AI",
    "session_id": "user_123",
    "show_tokens": true
  }'

Die KI wird dann ihre Token-Nutzung selbst in die Antwort schreiben:

Your response...

---
💾 Token Usage: 125 (Session Total: 5230 / 10,000,000)

3️⃣ Neuer Endpoint: /api/tokens-info

Jederzeit aktuelle Token-Nutzung abfragen:

curl http://localhost:5000/api/tokens-info

Response:

{
  "success": true,
  "tokens": {
    "used": 5230,
    "remaining": 9994770,
    "max": 10000000,
    "percentage_used": 0.052,
    "message": "Tokens used: 5230 / 10,000,000 (0.05%)"
  }
}

📊 Token-Berechnung

Tokens = (Frage-Länge + Antwort-Länge) / 4

Beispiel:
  Frage: "What is AI?" (12 Zeichen)
  Antwort: "AI is..." (500 Zeichen)
  Tokens: (12 + 500) / 4 = 128 Tokens

Limits

Max Total: 10,000,000 Tokens pro Sitzung
Warnung: Bei 80% Nutzung (8,000,000 Tokens)
Optimization: Wird automatisch ausgelöst

🎯 Übergeordnete Integration

Token-Tracking ist überall integriert:

context_manager.py
- Trackt Token pro Session
- Berechnet Nutzungspercentage
- Speichert in Token-Budget
server.py
- /api/chat zeigt Tokens in Response
- /api/tokens-info Abfrage-Endpoint
- Optional show_tokens in Chat-Anfrage
Response Format
- JSON Tokens-Struktur standard
- Human-readable Message optional
- Prozentuale Berechnung

📁 Verbleibende Dateien (Kernfunktionalität)

KERN CODE FILES:
✅ server.py                  - Haupt-API Server
✅ context_manager.py         - Chat-Kontext & Token-Tracking
✅ python_analyzer.py         - Python-Code Analyse
✅ google_search_learner.py   - Web-Learning
✅ feedback_learner.py        - Nutzer-Feedback Learning
✅ enhanced_ml_learner.py     - Vereinheitlichter ML-Learner
✅ ai_improvements.py         - Code-Verbesserungen
✅ custom_image_generator.py  - Bild-Generierung
✅ ml_image_generator.py      - ML Bild-Generierung
✅ image_learning.py          - Bild-Learning
✅ ml_universal_learner.py    - Universelles Lerner-System
✅ autonomous_learning.py     - Autonomes Learning
✅ whatsapp_integration.py    - WhatsApp Integration
✅ docker-compose.yml         - Docker Setup
✅ Dockerfile                 - Docker Config
✅ requirements.txt           - Python Dependencies

DATA/CONFIG:
✅ translations.json          - Sprach-Übersetzungen
✅ training_*.json            - Trainings-Daten (19 Dateien)
✅ noahski_data/              - Persistenter Speicher
✅ static/                    - Frontend-Dateien
✅ plugins/                   - Plugin-System
✅ logs/                      - Log-Dateien
✅ ml_image_cache/            - Bild-Cache (ML)
✅ ml_universal_data/         - ML Daten
✅ auth_*.html                - Authentifizierung UI
✅ settings.html              - Einstellungs-UI
✅ index_ultimate.html        - Haupt-UI

TEST UTILITIES:
✅ demo_enhanced_learning.py  - Demo-Script
✅ test_tokens.py             - Token-Tracking Test

🚀 Verwendungsbeispiele

Beispiel 1: Basic Chat mit Token-Info

import requests

response = requests.post('http://localhost:5000/api/chat', json={
    "message": "Schreib einen Python Code",
    "session_id": "user_123"
})

data = response.json()
print(f"Response: {data['content']}")
print(f"Tokens used: {data['tokens']['used']}")
print(f"Session total: {data['tokens']['total']}")
print(f"Usage: {data['tokens']['percentage']}%")

Beispiel 2: Chat mit Token-Display in Response

response = requests.post('http://localhost:5000/api/chat', json={
    "message": "Schreib einen Python Code",
    "session_id": "user_123",
    "show_tokens": True,
    "debug": True
})

# Die Antwort enthält jetzt Token-Info am Ende:
# "Your answer...\n---\n💾 Token Usage: 230 (Session Total: 5525 / 10,000,000)"

Beispiel 3: Token-Status abfragen

response = requests.get('http://localhost:5000/api/tokens-info')
data = response.json()

if data['tokens']['percentage_used'] > 80:
    print("⚠️ Achtung: Mehr als 80% Tokens verwendet!")
    print(f"Tokens remaining: {data['tokens']['remaining']}")
else:
    print(f"✅ Genug Tokens verfügbar: {data['tokens']['message']}")

📝 API Endpoints (Token-Related)

POST /api/chat

Mit Token-Info in Response

Request: {"message": "...", "session_id": "...", "show_tokens": true}
Response: {...content..., "tokens": {"used": N, "total": M, ...}}

GET /api/tokens-info

Token-Status abrufen

Response: {"tokens": {"used": N, "remaining": M, "percentage_used": P}}

GET /api/learning-status

Lern-Status inkl. Token-Info

Response: {...learning_metrics..., "tokens": {...}}

✨ Zusammenfassung der Änderungen

Kategorie	Vorher	Nachher	Status
Dokumentationen	67	0	✅ Gelöscht
Test-Dateien	45	1	✅ Konsolidiert
Doppelte Dateien	29	0	✅ Gelöscht
Kern Code-Dateien	45+	16	✅ Aktiv
Total Dateien	~250	~100	✅ 60% Reduzierung
Token-Tracking	Nein	Ja	✅ Implementiert
Token-Info Endpoint	Nein	Ja	✅ Implementiert
Token in Response	Nein	Ja	✅ Implementiert

🔧 Server starten

python server.py

Token-Tracking testen:

# Chat senden und Token-Info anzeigen
curl -X POST http://localhost:5000/api/chat \
  -H "Content-Type: application/json" \
  -d '{"message":"Hello!","session_id":"test","show_tokens":true}'

# Aktuelle Token-Nutzung abfragen
curl http://localhost:5000/api/tokens-info

📈 Wichtige Statistiken

Gelöschte Dateien: 141 unnötige Dateien
Code-Größe reduziert: ~60%
Neue Features: 3 (Token in Response, Tokens-Endpoint, Debug-Output)
Performance: ⚡ Schneller Startup (weniger Dateien zu laden)
Wartung: 📦 Einfacher (weniger Dubletten/alte Versionen)

✅ Fertig!

Das System ist jetzt:

✅ Aufgeräumt (keine Dubletten mehr)
✅ Schlanker (141 unnötige Dateien gelöscht)
✅ Token-fähig (automatisches Tracking)
✅ Transparent (AI meldet Tokens)
✅ Wartungsfreundlich (nur Kern-Code übrig)

Alle Real-Code-Funktionen bleiben erhalten!