Finisha-LLM
/

Lam-6

@@ -31,9 +31,9 @@ L'objectif de Lam-6 est de combler le fossé entre les modèles ultra-spécialis
 ### État Actuel
-* **Compréhension du Langage Général :** Le modèle a été pré-entraîné sur **68 843 paires Question/Réponse**, lui permettant de comprendre une vaste gamme de sujets (histoire, géographie, sciences, technologie, etc.).
 * **Capacités Émergentes :** Lam-6 montre des signes prometteurs de généralisation, capable d'aborder divers domaines même si la cohérence factuelle est encore en cours de stabilisation (ex: "la capitale du brésil est la capitale de la france et la capitale de la thailande est la capitale du japon est oslo." 😅). Ces "hallucinations" initiales sont une étape normale de l'apprentissage.
-* **Vocabulaire Étendu :** Avec 14 073 tokens, Lam-6 dispose d'une base lexicale robuste pour des générations variées.
 ### Objectifs d'Entraînement
@@ -55,7 +55,7 @@ Lam-6 est propulsé par l'architecture **Aricate v4**, conçue pour être perfor
 ## 📈 Statistiques d'Entraînement
-* **Taille du vocabulaire :** 14073 tokens 📖 (vs 13618 pour Lam-5)
 * **Nombre de paires d'entraînement :** 68843 📊
 * **Longueur maximale d'entrée (max_len) :** 72 tokens
 * **Nombre de batches par époque :** 538 📦

 ### État Actuel
+* **Compréhension du Langage Général :** Le modèle a été pré-entraîné sur **68 843 paires de données**, lui permettant de comprendre une vaste gamme de sujets (histoire, géographie, sciences, technologie, etc.).
 * **Capacités Émergentes :** Lam-6 montre des signes prometteurs de généralisation, capable d'aborder divers domaines même si la cohérence factuelle est encore en cours de stabilisation (ex: "la capitale du brésil est la capitale de la france et la capitale de la thailande est la capitale du japon est oslo." 😅). Ces "hallucinations" initiales sont une étape normale de l'apprentissage.
+* **Vocabulaire Étendu :** Avec 14 073 mots, Lam-6 dispose d'une base lexicale robuste pour des générations variées.
 ### Objectifs d'Entraînement
 ## 📈 Statistiques d'Entraînement
+* **Taille du vocabulaire :** 14073 mots 📖 (vs 13618 pour Lam-5)
 * **Nombre de paires d'entraînement :** 68843 📊
 * **Longueur maximale d'entrée (max_len) :** 72 tokens
 * **Nombre de batches par époque :** 538 📦