Spaces:
Sleeping
Sleeping
CHD — Clarification de mincl et de la sélection des classes terminales
1) À quoi sert mincl ?
mincl est le seuil minimal d'effectif d'une classe (en pratique : nombre d'UCE/segments) utilisé au moment de la sélection finale des classes terminales.
- Si une classe terminale a un effectif
< mincl, elle peut être écartée telle quelle. - Dans la logique IRaMuTeQ, l'algorithme peut alors remonter dans l'arbre vers une classe mère pour garder une partition interprétable.
2) Comment IRaMuTeQ applique mincl ?
Dans les scripts historiques d'IRaMuTeQ :
find.terminales(...)conserve d'abord les classes terminales dont l'effectif est>= mincl.- Pour les classes trop petites, il existe une logique de remontée vers la classe mère (via les liens mère/filles) avant de figer la solution.
make.classes(...)reconstruit ensuite les classes finales et l'arbre filtré.
Cette étape explique pourquoi, à corpus identique, les classes finales peuvent différer d'une implémentation CHD qui n'a pas ce post-traitement.
3) Valeur "auto" de mincl dans IRaMuTeQ
3.1 CHD texte (Rchdtxt)
Convention utilisée :
mincl = 0
→ mode automatique
Formule auto :
[ mincl = round(nrow(classeuce1) / ind) ]
avec :
ind = nbcl * 2siclassif_mode == 0(double classification)- sinon
ind = nbcl
et nbcl = nbt + 1.
3.2 CHD questionnaire (Rchdquest)
Convention différente :
mincl = 2
→ mode automatique
Formule auto :
[ mincl = round(nrow(classeuce1) / (nbt + 1)) ]
Puis un plancher est imposé :
- si
mincl < 3alorsmincl = 3.