IRaMuTeQ-lite / help /chd.md
stephane09's picture
Update help/chd.md
f41cbaa verified

CHD — Clarification de mincl et de la sélection des classes terminales

1) À quoi sert mincl ?

mincl est le seuil minimal d'effectif d'une classe (en pratique : nombre d'UCE/segments) utilisé au moment de la sélection finale des classes terminales.

  • Si une classe terminale a un effectif < mincl, elle peut être écartée telle quelle.
  • Dans la logique IRaMuTeQ, l'algorithme peut alors remonter dans l'arbre vers une classe mère pour garder une partition interprétable.

2) Comment IRaMuTeQ applique mincl ?

Dans les scripts historiques d'IRaMuTeQ :

  • find.terminales(...) conserve d'abord les classes terminales dont l'effectif est >= mincl.
  • Pour les classes trop petites, il existe une logique de remontée vers la classe mère (via les liens mère/filles) avant de figer la solution.
  • make.classes(...) reconstruit ensuite les classes finales et l'arbre filtré.

Cette étape explique pourquoi, à corpus identique, les classes finales peuvent différer d'une implémentation CHD qui n'a pas ce post-traitement.


3) Valeur "auto" de mincl dans IRaMuTeQ

3.1 CHD texte (Rchdtxt)

Convention utilisée :

  • mincl = 0
    → mode automatique

Formule auto :

[ mincl = round(nrow(classeuce1) / ind) ]

avec :

  • ind = nbcl * 2 si classif_mode == 0 (double classification)
  • sinon ind = nbcl

et nbcl = nbt + 1.

3.2 CHD questionnaire (Rchdquest)

Convention différente :

  • mincl = 2
    → mode automatique

Formule auto :

[ mincl = round(nrow(classeuce1) / (nbt + 1)) ]

Puis un plancher est imposé :

  • si mincl < 3 alors mincl = 3.