Spaces:
Sleeping
Sleeping
Update help/chd.md
Browse files- help/chd.md +0 -38
help/chd.md
CHANGED
|
@@ -7,8 +7,6 @@
|
|
| 7 |
- Si une classe terminale a un effectif `< mincl`, elle peut être écartée telle quelle.
|
| 8 |
- Dans la logique IRaMuTeQ, l'algorithme peut alors remonter dans l'arbre vers une classe mère pour garder une partition interprétable.
|
| 9 |
|
| 10 |
-
Autrement dit, `mincl` ne règle pas directement la segmentation du texte : il intervient surtout dans le **post-traitement de l'arbre CHD**.
|
| 11 |
-
|
| 12 |
---
|
| 13 |
|
| 14 |
## 2) Comment IRaMuTeQ applique `mincl` ?
|
|
@@ -63,39 +61,3 @@ Puis un plancher est imposé :
|
|
| 63 |
- si `mincl < 3` alors `mincl = 3`.
|
| 64 |
|
| 65 |
---
|
| 66 |
-
|
| 67 |
-
## 4) Différence avec le script Rainette de ce projet
|
| 68 |
-
|
| 69 |
-
Dans ce projet, la classification est obtenue via `rainette(...)` / `rainette2(...)`, puis les groupes sont utilisés directement comme classes.
|
| 70 |
-
|
| 71 |
-
- Le paramètre `min_split_members` sert principalement à contraindre `k` (nombre de classes faisable).
|
| 72 |
-
- Ce n'est **pas** l'équivalent exact de `mincl` d'IRaMuTeQ.
|
| 73 |
-
|
| 74 |
-
Conséquence : sans post-traitement "classes terminales" à la manière IRaMuTeQ, le nombre et l'identité des classes finales peuvent varier.
|
| 75 |
-
|
| 76 |
-
---
|
| 77 |
-
|
| 78 |
-
## 5) Recommandation d'implémentation (optionnelle)
|
| 79 |
-
|
| 80 |
-
Pour rapprocher le comportement d'IRaMuTeQ sans casser l'existant :
|
| 81 |
-
|
| 82 |
-
1. Ajouter un réglage `mode_mincl` :
|
| 83 |
-
- `manuel`
|
| 84 |
-
- `auto_iramuteq`
|
| 85 |
-
2. Ajouter `mincl_manuel` (actif seulement en mode manuel).
|
| 86 |
-
3. En mode `auto_iramuteq`, calculer `mincl` avec la formule texte ci-dessus.
|
| 87 |
-
4. Appliquer ensuite un post-traitement de classes terminales (inspiré de `find.terminales`/`make.classes`).
|
| 88 |
-
|
| 89 |
-
Ainsi, l'utilisateur peut choisir entre :
|
| 90 |
-
|
| 91 |
-
- un mode Rainette "direct" (plus simple),
|
| 92 |
-
- un mode "IRa-like" (plus proche des sorties IRaMuTeQ).
|
| 93 |
-
|
| 94 |
-
---
|
| 95 |
-
|
| 96 |
-
## 6) Vocabulaire rapide
|
| 97 |
-
|
| 98 |
-
- **UCE / segment** : unité de texte classée.
|
| 99 |
-
- **Classe terminale** : classe feuille dans l'arbre CHD.
|
| 100 |
-
- **Classe mère / filles** : relation hiérarchique dans l'arbre de partition.
|
| 101 |
-
- **`mincl`** : effectif minimal exigé pour conserver une classe terminale telle quelle.
|
|
|
|
| 7 |
- Si une classe terminale a un effectif `< mincl`, elle peut être écartée telle quelle.
|
| 8 |
- Dans la logique IRaMuTeQ, l'algorithme peut alors remonter dans l'arbre vers une classe mère pour garder une partition interprétable.
|
| 9 |
|
|
|
|
|
|
|
| 10 |
---
|
| 11 |
|
| 12 |
## 2) Comment IRaMuTeQ applique `mincl` ?
|
|
|
|
| 61 |
- si `mincl < 3` alors `mincl = 3`.
|
| 62 |
|
| 63 |
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|