Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Sleeping

Claude commited on 9 days ago

Commit

dd38857

unverified ·

1 Parent(s): 1992441

docs(reference): remove sprint narrative (Phase 2 L3)

Couche reference/ : 6 fichiers nettoyés.

views.md (22 mentions → 0) : transformation du tableau « Bloc /
Origine (Sprint X) / Données nécessaires » en « Bloc / Données
nécessaires ». Pour un lecteur actuel, savoir que la métrique CER
existe « depuis le Sprint 2 » n'apporte rien — l'information utile
c'est « disponible toujours ». Le titre H1 « chantier 3 post-Sprint
97 » devient simplement « Vues HTML du rapport ».

text-view.md, alto-view.md, comparing-views.md : intro « Sprint
A14-S14/S15/S16 livre X » → « X est la première/deuxième/troisième
vue canonique ». Section « Statut » avec liste « ✅ Sprint S14
livré → ⏳ Sprint S17/S18 » → liste sans tags sprint, juste l'état
fonctionnel.

normalization-profiles.md : titre « chantier 2 post-Sprint 97 » →
« Profils de calcul ». Annotations « (Sprint XX) » dans la colonne
de description du tableau de profils → contenu fonctionnel.

reproducibility-snapshots.md : 5 mentions sprint en header, dans
les sous-sections « Préparation Sprint A12 » et dans les noms de
tests → suppressions.

Aucun contenu technique modifié : tableaux de métriques, exemples
de code, commandes, tout est identique.

Ratchet : ACTIVE_NARRATIVE_BASELINE 59 → 23 (-36).

Files changed (7) hide show

docs/reference/alto-view.md +8 -8
docs/reference/comparing-views.md +8 -9
docs/reference/normalization-profiles.md +5 -5
docs/reference/reproducibility-snapshots.md +4 -6
docs/reference/text-view.md +8 -9
docs/reference/views.md +39 -41
tests/architecture/test_doc_governance.py +1 -1

docs/reference/alto-view.md CHANGED Viewed

@@ -1,12 +1,12 @@
 # AltoView — fidélité documentaire ALTO
-Sprint A14-S15 du rewrite ciblé livre `AltoView`, la deuxième vue
-canonique.  Elle répond à la question : **"quel pipeline produit
-le meilleur ALTO exploitable ?"**
 ## Distinct de TextView
-| Aspect | TextView (S14) | AltoView (S15) |
 |---|---|---|
 | Question | "meilleur texte final ?" | "meilleur ALTO exploitable ?" |
 | Types acceptés | RAW_TEXT, CORRECTED_TEXT, ALTO, PAGE, CANONICAL | ALTO_XML uniquement |
@@ -107,7 +107,7 @@ Reportées à des sprints suivants :
 ## Statut
-- ✅ Sprint S15 — `AltoView` livré (3 métriques + pattern d'omission)
-- ⏳ Sprint S16 — `SearchView` (recherchabilité fuzzy)
-- ⏳ Sprint S17 — intégration runner + RunManifest
-- ⏳ Sprint S18 — tests E2E sur le cas BnF central

 # AltoView — fidélité documentaire ALTO
+`AltoView` est la deuxième vue canonique.  Elle répond à la
+question : **"quel pipeline produit le meilleur ALTO
+exploitable ?"**
 ## Distinct de TextView
+| Aspect | TextView | AltoView |
 |---|---|---|
 | Question | "meilleur texte final ?" | "meilleur ALTO exploitable ?" |
 | Types acceptés | RAW_TEXT, CORRECTED_TEXT, ALTO, PAGE, CANONICAL | ALTO_XML uniquement |
 ## Statut
+- ✅ `AltoView` (3 métriques + pattern d'omission)
+- ✅ `SearchView` (recherchabilité fuzzy)
+- ⏳ Intégration runner + RunManifest
+- ⏳ Tests E2E sur le cas BnF central

docs/reference/comparing-views.md CHANGED Viewed

@@ -1,9 +1,8 @@
 # Lire les 3 vues canoniques ensemble
-Sprint A14-S16 livre la troisième vue canonique du rewrite ciblé :
-`SearchView`.  Avec `TextView` (S14) et `AltoView` (S15), on a
-maintenant **trois lentilles complémentaires** pour évaluer un
-même pipeline.
 ## Le tableau des 3 vues
@@ -110,8 +109,8 @@ cette grille de lecture :
 ## Statut
-- ✅ Sprint S14 — `TextView`
-- ✅ Sprint S15 — `AltoView`
-- ✅ Sprint S16 — `SearchView` + cohérence inter-vues
-- ⏳ Sprint S17 — intégration runner + RunManifest
-- ⏳ Sprint S18 — tests E2E sur le cas BnF central

 # Lire les 3 vues canoniques ensemble
+`TextView`, `AltoView` et `SearchView` forment **trois lentilles
+complémentaires** pour évaluer un même pipeline OCR sur un corpus
+patrimonial.
 ## Le tableau des 3 vues
 ## Statut
+- ✅ `TextView`
+- ✅ `AltoView`
+- ✅ `SearchView` + cohérence inter-vues
+- ⏳ Intégration runner + RunManifest
+- ⏳ Tests E2E sur le cas BnF central

docs/reference/normalization-profiles.md CHANGED Viewed

@@ -1,4 +1,4 @@
-# Profils de calcul — chantier 2 post-Sprint 97
 Picarones expose **7 profils de calcul** qui modulent les métriques
 calculées par le runner selon le use case. Chaque profil active un
@@ -55,10 +55,10 @@ Active les 12 hooks document-level historiques :
 | `line_metrics` | 10 | `line_metrics` | Distribution CER + Gini |
 | `hallucination` | 10 | `hallucination_metrics` | Détection VLM |
 | `calibration` | 42 | `calibration_metrics` | ECE/MCE (si confidences) |
-| `philological` | 61 | `philological_metrics` | 6 modules (Sprints 55-60) |
-| `searchability` | 86 | `searchability_metrics` | Fuzzy recall (Sprint 84) |
-| `numerical_sequences` | 86 | `numerical_sequence_metrics` | Sprint 85 |
-| `readability` | 87 | `readability_metrics` | Δ Flesch (Sprint 52) |
 12 agrégateurs corpus-level correspondants remplissent les attributs
 `aggregated_*` de chaque `EngineReport`.

+# Profils de calcul
 Picarones expose **7 profils de calcul** qui modulent les métriques
 calculées par le runner selon le use case. Chaque profil active un
 | `line_metrics` | 10 | `line_metrics` | Distribution CER + Gini |
 | `hallucination` | 10 | `hallucination_metrics` | Détection VLM |
 | `calibration` | 42 | `calibration_metrics` | ECE/MCE (si confidences) |
+| `philological` | 61 | `philological_metrics` | 6 modules philologiques |
+| `searchability` | 86 | `searchability_metrics` | Fuzzy recall |
+| `numerical_sequences` | 86 | `numerical_sequence_metrics` | Repérage et alignement de séquences numériques |
+| `readability` | 87 | `readability_metrics` | Δ Flesch |
 12 agrégateurs corpus-level correspondants remplissent les attributs
 `aggregated_*` de chaque `EngineReport`.

docs/reference/reproducibility-snapshots.md CHANGED Viewed

@@ -1,7 +1,5 @@
 # Snapshots de reproductibilité
-> Sprint A8 (item M-12 du plan de remédiation).
 ## Pourquoi des snapshots ?
 Pour qu'un benchmark Picarones soit **citable scientifiquement**, un
@@ -116,7 +114,7 @@ git checkout 17cc5474abc
 ### Étape 2 — Récréer l'environnement Python
-Sprint A8 livre les lock files :
 ```bash
 python -m venv .venv && source .venv/bin/activate
@@ -167,7 +165,7 @@ Différences possibles légitimes :
   plus tard peut donner d'autres résultats. Le snapshot des prompts
   reste utile mais ne reproduit pas le LLM lui-même.
-## Snapshot et publication scientifique (préparation Sprint A12)
 Pour un papier scientifique, citer Picarones doit indiquer :
@@ -208,13 +206,13 @@ reproductible (cf. Stodden et al., *Computational reproducibility*).
 ## Tests
-`tests/report/test_reproducibility_snapshots.py` (Sprint 27)
 valide que `snapshot_all()` est :
 - déterministe (même input → même bytes en sortie),
 - complet (toutes les clés top-level présentes),
 - robuste (ne crashe pas si git absent, si pricing.yaml manquant…).
-`tests/test_reproducibility_ops.py` (Sprint A8) ajoute la validation
 de la chaîne **lock file + Docker digest + snapshot** comme contrat
 opérationnel.

 # Snapshots de reproductibilité
 ## Pourquoi des snapshots ?
 Pour qu'un benchmark Picarones soit **citable scientifiquement**, un
 ### Étape 2 — Récréer l'environnement Python
+Picarones livre des lock files :
 ```bash
 python -m venv .venv && source .venv/bin/activate
   plus tard peut donner d'autres résultats. Le snapshot des prompts
   reste utile mais ne reproduit pas le LLM lui-même.
+## Snapshot et publication scientifique
 Pour un papier scientifique, citer Picarones doit indiquer :
 ## Tests
+`tests/report/test_reproducibility_snapshots.py`
 valide que `snapshot_all()` est :
 - déterministe (même input → même bytes en sortie),
 - complet (toutes les clés top-level présentes),
 - robuste (ne crashe pas si git absent, si pricing.yaml manquant…).
+`tests/test_reproducibility_ops.py` ajoute la validation
 de la chaîne **lock file + Docker digest + snapshot** comme contrat
 opérationnel.

docs/reference/text-view.md CHANGED Viewed

@@ -1,9 +1,8 @@
 # TextView — première vue canonique
-Sprint A14-S14 du rewrite ciblé livre `TextView`, la première vue
-d'évaluation canonique.  Elle répond à la question patrimoniale la
-plus fréquente : **"quel pipeline produit le meilleur texte
-final ?"**
 ## Cas d'usage central BnF
@@ -137,8 +136,8 @@ ViewResult(
 ## Statut
-- ✅ Sprint S14 — `TextView` livré (codé + testé)
-- ⏳ Sprint S15 — `AltoView` (fidélité documentaire)
-- ⏳ Sprint S16 — `SearchView` (recherchabilité fuzzy)
-- ⏳ Sprint S17 — intégration runner + RunManifest
-- ⏳ Sprint S18 — tests E2E sur le cas BnF central avec 3 pipelines

 # TextView — première vue canonique
+`TextView` est la première vue d'évaluation canonique.  Elle répond
+à la question patrimoniale la plus fréquente : **"quel pipeline
+produit le meilleur texte final ?"**
 ## Cas d'usage central BnF
 ## Statut
+- ✅ `TextView` (codé + testé)
+- ✅ `AltoView` (fidélité documentaire)
+- ✅ `SearchView` (recherchabilité fuzzy)
+- ⏳ Intégration runner + RunManifest
+- ⏳ Tests E2E sur le cas BnF central avec 3 pipelines

docs/reference/views.md CHANGED Viewed

@@ -1,8 +1,8 @@
-# Vues HTML du rapport — chantier 3 post-Sprint 97
-Le rapport HTML Picarones est composé de **5 vues principales** historiques
-(navigables via la nav top) et de **3 nouvelles vues thématiques** (chantier 3)
-qui s'affichent comme cartes dans la vue `analyses`.
 Toutes les vues sont **adaptive** : une vue/section ne s'affiche que si elle
 a du signal à montrer (au moins une sous-section avec données exploitables).
@@ -33,32 +33,31 @@ pleine largeur, avec un patron commun :
 Si `some_html` est `""` (adaptive masking parce qu'aucune donnée), la
 carte n'apparaît pas.
-### Sous-sections historiques (Sprints 5+10+39+42+55-60+86+87+89)
-| Bloc | Origine | Données nécessaires |
-|---|---|---|
-| Distribution CER | Sprint 2 | toujours |
-| Radar profil moteur | Sprint 2 | ≥ 1 moteur |
-| CER par document | Sprint 2 | toujours |
-| Temps d'exécution | Sprint 2 | durations propagées |
-| Qualité image ↔ CER | Sprint 5 | `aggregated_image_quality` |
-| Taxonomie | Sprint 5 | `aggregated_taxonomy` |
-| Courbes de fiabilité | Sprint 7 | `aggregated_calibration` |
-| NER (P/R/F1) | Sprint 41 | `aggregated_ner` (opt-in spaCy) |
-| Calibration ECE/MCE | Sprint 43 | `aggregated_calibration` |
-| Stratification | Sprint 46 | `script_type` par doc |
-| Profil philologique | Sprint 62 | `aggregated_philological` |
-| Recherchabilité fuzzy | Sprint 86 | `aggregated_searchability` |
-| Séquences numériques | Sprint 86 | `aggregated_numerical_sequences` |
-| Lisibilité (Δ Flesch) | Sprint 87 | `aggregated_readability` |
-| Spécialisation inter-moteurs | Sprint 89 | ≥ 2 moteurs avec taxonomie |
-| Analyse inter-moteurs | Sprint 37 | ≥ 2 moteurs |
-| Matrice de corrélation | Sprint 7 | toujours |
-### Sous-sections du chantier 3 (post-Sprint 97)
-3 nouvelles vues thématiques composables qui regroupent les **16 renderers
-orphelins** identifiés dans l'audit initial :
 #### Vue « Coût et performance » (`build_economics_view_html`)
@@ -101,8 +100,8 @@ Sous-sections :
 ## Vues spécifiques (rapport autonome)
-Deux vues du chantier 3 ne s'intègrent pas au rapport classique mais
-servent à composer des **rapports autonomes** :
 ### Vue « Pipeline composée » (`build_pipeline_view_html`)
@@ -112,13 +111,12 @@ Utilisée par `picarones pipeline run` (ou par tout outil qui consomme un
 `PipelineBenchmarkResult`). Sous-sections :
 - **Résumé pipeline** (`build_pipeline_summary_html` + `build_pipeline_steps_table_html`).
-- **DAG visuel** (`pipeline_dag_render.py` Sprint 95) — opt-in.
-- **Absorption d'erreur** par jonction (`error_absorption_render.py`
-  Sprint 94) — opt-in.
-- **Comparaison incrémentale** par slot (`incremental_comparison_render.py`
-  Sprint 96) — opt-in.
-- **Audit des modules** contribués (`module_audit_render.py`
-  Sprint 97) — opt-in.
 ### Vue « Robustesse projetée » (`build_robustness_view_html`)
@@ -126,8 +124,8 @@ Module : [`picarones/reports/html/views/robustness.py`](../picarones/reports/htm
 Utilisée par le workflow `picarones robustness`. Sous-sections :
-- **Déficit projeté de robustesse** (`robustness_projection_render.py`
-  Sprint 88).
 ## Convention de rendu partagée

+# Vues HTML du rapport
+Le rapport HTML Picarones est composé de **5 vues principales** (navigables
+via la nav top) et de **3 vues thématiques** qui s'affichent comme cartes
+dans la vue `analyses`.
 Toutes les vues sont **adaptive** : une vue/section ne s'affiche que si elle
 a du signal à montrer (au moins une sous-section avec données exploitables).
 Si `some_html` est `""` (adaptive masking parce qu'aucune donnée), la
 carte n'apparaît pas.
+### Sous-sections principales
+| Bloc | Données nécessaires |
+|---|---|
+| Distribution CER | toujours |
+| Radar profil moteur | ≥ 1 moteur |
+| CER par document | toujours |
+| Temps d'exécution | durations propagées |
+| Qualité image ↔ CER | `aggregated_image_quality` |
+| Taxonomie | `aggregated_taxonomy` |
+| Courbes de fiabilité | `aggregated_calibration` |
+| NER (P/R/F1) | `aggregated_ner` (opt-in spaCy) |
+| Calibration ECE/MCE | `aggregated_calibration` |
+| Stratification | `script_type` par doc |
+| Profil philologique | `aggregated_philological` |
+| Recherchabilité fuzzy | `aggregated_searchability` |
+| Séquences numériques | `aggregated_numerical_sequences` |
+| Lisibilité (Δ Flesch) | `aggregated_readability` |
+| Spécialisation inter-moteurs | ≥ 2 moteurs avec taxonomie |
+| Analyse inter-moteurs | ≥ 2 moteurs |
+| Matrice de corrélation | toujours |
+### Vues thématiques composables
+3 vues thématiques composables qui regroupent les renderers spécialisés :
 #### Vue « Coût et performance » (`build_economics_view_html`)
 ## Vues spécifiques (rapport autonome)
+Deux vues ne s'intègrent pas au rapport classique mais servent à
+composer des **rapports autonomes** :
 ### Vue « Pipeline composée » (`build_pipeline_view_html`)
 `PipelineBenchmarkResult`). Sous-sections :
 - **Résumé pipeline** (`build_pipeline_summary_html` + `build_pipeline_steps_table_html`).
+- **DAG visuel** (`pipeline_dag_render.py`) — opt-in.
+- **Absorption d'erreur** par jonction
+  (`error_absorption_render.py`) — opt-in.
+- **Comparaison incrémentale** par slot
+  (`incremental_comparison_render.py`) — opt-in.
+- **Audit des modules** contribués (`module_audit_render.py`) — opt-in.
 ### Vue « Robustesse projetée » (`build_robustness_view_html`)
 Utilisée par le workflow `picarones robustness`. Sous-sections :
+- **Déficit projeté de robustesse**
+  (`robustness_projection_render.py`).
 ## Convention de rendu partagée

tests/architecture/test_doc_governance.py CHANGED Viewed

@@ -339,7 +339,7 @@ def test_mkdocs_nav_excludes_archive_subdirs() -> None:
 #: - quelques fichiers à la racine (README, GOVERNANCE, SECURITY).
 #:
 #: Cible : 0 (Phase 2 — convergence narrative, lot D9 à prévoir).
-ACTIVE_NARRATIVE_BASELINE = 59
 def test_no_active_doc_contains_sprint_narrative() -> None:

 #: - quelques fichiers à la racine (README, GOVERNANCE, SECURITY).
 #:
 #: Cible : 0 (Phase 2 — convergence narrative, lot D9 à prévoir).
+ACTIVE_NARRATIVE_BASELINE = 23
 def test_no_active_doc_contains_sprint_narrative() -> None: