Update README.md
Browse files
README.md
CHANGED
|
@@ -317,4 +317,6 @@ Le comportement de ce modèle est fortement influencé par les paramètres de **
|
|
| 317 |
| :--- | :--- | :--- | :--- |
|
| 318 |
| **Temperature ($T$)** | Contrôle l'aléa des probabilités. | Élevée $\rightarrow$ créativité / Basse $\rightarrow$ conservatisme. | $0.7$ à $1.0$ |
|
| 319 |
| **Top-K ($K$)** | Limite le choix du mots aux $K$ plus probables. | Élevé $\rightarrow$ vocabulaire élargi / Bas $\rightarrow$ vocabulaire ciblé. | $5$ à $15$ |
|
| 320 |
-
| **Top-P ($P$)** | *Optionnel :* Contrôle l'échantillonnage par probabilité cumulée (Nucléus Sampling). | Alternatif à Top-K, souvent plus dynamique. | $0.9$ (si K est désactivé) |
|
|
|
|
|
|
|
|
|
| 317 |
| :--- | :--- | :--- | :--- |
|
| 318 |
| **Temperature ($T$)** | Contrôle l'aléa des probabilités. | Élevée $\rightarrow$ créativité / Basse $\rightarrow$ conservatisme. | $0.7$ à $1.0$ |
|
| 319 |
| **Top-K ($K$)** | Limite le choix du mots aux $K$ plus probables. | Élevé $\rightarrow$ vocabulaire élargi / Bas $\rightarrow$ vocabulaire ciblé. | $5$ à $15$ |
|
| 320 |
+
| **Top-P ($P$)** | *Optionnel :* Contrôle l'échantillonnage par probabilité cumulée (Nucléus Sampling). | Alternatif à Top-K, souvent plus dynamique. | $0.9$ (si K est désactivé) |
|
| 321 |
+
|
| 322 |
+
**Fichier du modèle quantifier** : pikachu_quantized.arica (présent a côté des fichiers de poids dans ce depot)
|