Spaces:

jeanbaptdzd
/

open-finance-llm-8b

Paused

open-finance-llm-8b / docs /qwen3_specifications.md

Reorganize tests and clean up documentation

6d3bf74 23 days ago

2.87 kB

Spécifications Qwen-3 8B - Fenêtre de contexte

Le modèle DragonLLM/Qwen-Open-Finance-R-8B (basé sur Qwen-3 8B) supporte:

Quand vous envoyez une requête, le contexte total inclut:

Contexte total = Prompt système + Messages conversation + Réponse générée

Type de requête	Prompt + Messages	Réponse max	Total
Question simple	~100 tokens	800 tokens	~900 tokens
Analyse complexe	~500 tokens	1500 tokens	~2000 tokens
Document long	~5000 tokens	2000 tokens	~7000 tokens
Analyse très longue	~15000 tokens	4000 tokens	~19000 tokens

Limite pratique recommandée: 30 000 tokens pour laisser de la marge.

Limite théorique maximale: 20 000 tokens en sortie

Limite pratique: Dépend de la fenêtre de contexte disponible:

Formule: max_tokens_generable = fenêtre_contexte - tokens_entrée - marge_sécurité

Dans notre application:

max_tokens (génération): 1500 tokens (configurable via API)
Contexte d'entrée: Illimité jusqu'à ~30K tokens (pour laisser de la marge)
Contexte total: Jusqu'à 32K tokens (base) ou 128K (avec YaRN)
Limite théorique max: 20K tokens en sortie (mais contrainte par contexte disponible)

max_tokens = 800-1000  # Suffisant pour la plupart des réponses

max_tokens = 1500-2000  # Permet raisonnement + réponse complète

Si vous avez besoin de plus de 32K tokens: