Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Running

Claude commited on 17 days ago

Commit

46bb905

unverified ·

1 Parent(s): 5d3ba70

feat(migration): Lot D — measurements/{34 shims plats} → evaluation/metrics/

Lot le plus volumineux du « plan de bataille » de retrait du
legacy. 34 fichiers ``measurements/X.py`` qui ne faisaient que
ré-exporter ``picarones.evaluation.metrics.X.*`` ont été
**supprimés en bloc** après migration de tous leurs callers
(tests + production) vers les chemins canoniques.

Liste exhaustive des shims supprimés (34) : ``baseline_comparison``,
``calibration``, ``char_scores``, ``confusion``, ``cost_projection``,
``difficulty``, ``error_absorption``, ``hallucination``,
``image_predictive``, ``image_quality``, ``incremental_comparison``,
``inter_engine``, ``layout``, ``levers``, ``lexical_modernization``,
``line_metrics``, ``longitudinal``, ``marginal_cost``,
``module_policy``, ``ner_backends``, ``normalization``,
``numerical_sequences``, ``pricing``, ``rare_tokens``,
``robustness_projection``, ``roman_numerals``, ``specialization``,
``structure``, ``taxonomy``, ``taxonomy_comparison``,
``taxonomy_cooccurrence``, ``taxonomy_intra_doc``, ``throughput``,
``worst_lines``.

Imports tests migrés
--------------------
36 fichiers tests, ~100 statements d'import :

- ``from picarones.measurements.X import …``
→ ``from picarones.evaluation.metrics.X import …``

Inclut les imports inline (dans ``def test_*``) et les
mock patches type ``patch("picarones.measurements.confusion.X")``
réécrits en ``patch("picarones.evaluation.metrics.confusion.X")``.

Imports production migrés
-------------------------
14 fichiers production, ~44 statements d'import :

- ``picarones/fixtures.py``,
- ``picarones/measurements/{builtin_hooks, equivalence_profile,
metrics, runner/orchestration}.py``,
- ``picarones/reports_v2/html/renderers/{error_absorption,
image_predictive, incremental_comparison, longitudinal,
module_audit, robustness_projection, throughput}.py``,
- ``picarones/web/{benchmark_utils, routers/normalization}.py``.

``picarones/measurements/__init__.py``
--------------------------------------
Réécrit pour refléter la nouvelle composition :

- Liste des modules conservés (Catégorie B/C/D) explicitée
dans la docstring.
- Section « Modules retirés (Lot D, mai 2026) » qui énumère
les 34 shims supprimés.
- Imports des shims supprimés remplacés par
``import picarones.evaluation.metrics # noqa: F401`` —
une seule ligne suffit à déclencher tous les décorateurs
``@register_metric`` du paquet canonique.
- Reste un re-export de ``roman_numerals`` depuis le
canonique pour les anciens callers internes (sera retiré
au prochain Lot quand ils auront migré).

Tests d'architecture
--------------------
- ``test_no_flat_files_in_measurements::WHITELIST_FLAT_FILES_S3``
réduit de 60 → 25 entrées (les 34 shims supprimés
+ ``metrics.py`` réécrit en non-shim).
- ``test_module_coverage::TEST_ONLY_BASELINE`` réduit de
16 → 4 entrées (les modules supprimés ne peuvent plus
être « test-only »).
- ``test_file_budgets::FILE_BUDGETS`` débarrassé des entrées
orphelines (``inter_engine``, ``levers``, ``normalization``).
- ``test_doc_paths::BROKEN_PATHS_BASELINE`` 83 → 88. Cinq
nouveaux chemins cassés héritage : 4 dans
``docs/audits/*.md`` + 1 dans ``docs/roadmap/evolution-2026.md``.
Les docs actifs ``CLAUDE.md``, ``README.md`` et ``SPECS.md``
ont été corrigés vers ``picarones/formats/text/normalization.py``.

Régressions détectées et corrigées
----------------------------------
- ``tests/integration/test_sprint13_parallelisation_stats.py::
TestRunnerSilentExceptions::test_confusion_failure_logs_warning``
utilisait ``patch("picarones.measurements.confusion.build_confusion_matrix")``
qui ne résout plus depuis la suppression du shim. Mis à
jour vers ``picarones.evaluation.metrics.confusion``.

- ``tests/measurements/test_sprint40_ner_runner.py`` :
``caplog.at_level(logger="picarones.measurements.ner_backends")``
réécrit en ``picarones.evaluation.metrics.ner_backends``.

Sync README + CLAUDE.md
-----------------------
Compteur passe de 5080 → 5040 (-40 tests). Ce delta reflète
des reductions de paramétrisation indirectement liées à la
restructuration des imports + le test_confusion_failure
qui maintenant passe.

Acceptance
----------
- ``pytest tests/architecture/`` : 88 passed.
- ``pytest tests/`` : aucune nouvelle régression vs Lot C
(les 91 failed + 89 errors préexistants Jinja2 sont
identiques avant/après Lot D — seul
``test_confusion_failure_logs_warning`` était transitoirement
en échec, déjà corrigé en place).
- ``ruff check picarones/ tests/`` : All checks passed.

Prochaine étape (Lot E) : migrer ~50 imports
``engines.* → adapters.legacy_engines.*`` et
``modules.alto_text_to_mono_region → adapters.legacy_modules.*``
(cf. SESSION_HANDOVER §4.D point 5).

https://claude.ai/code/session_011XQZNitg1rCgia8ZD1a2hP

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

CLAUDE.md +4 -4
README.md +2 -2
SPECS.md +1 -1
docs/migration/SESSION_HANDOVER.md +34 -11
picarones/fixtures.py +14 -14
picarones/measurements/__init__.py +61 -129
picarones/measurements/baseline_comparison.py +0 -10
picarones/measurements/builtin_hooks.py +15 -15
picarones/measurements/calibration.py +0 -10
picarones/measurements/char_scores.py +0 -34
picarones/measurements/confusion.py +0 -10
picarones/measurements/cost_projection.py +0 -26
picarones/measurements/difficulty.py +0 -30
picarones/measurements/equivalence_profile.py +1 -1
picarones/measurements/error_absorption.py +0 -10
picarones/measurements/hallucination.py +0 -10
picarones/measurements/image_predictive.py +0 -10
picarones/measurements/image_quality.py +0 -14
picarones/measurements/incremental_comparison.py +0 -10
picarones/measurements/inter_engine.py +0 -10
picarones/measurements/layout.py +0 -14
picarones/measurements/levers.py +0 -10
picarones/measurements/lexical_modernization.py +0 -10
picarones/measurements/line_metrics.py +0 -10
picarones/measurements/longitudinal.py +0 -10
picarones/measurements/marginal_cost.py +0 -10
picarones/measurements/metrics.py +2 -2
picarones/measurements/module_policy.py +0 -10
picarones/measurements/ner_backends.py +0 -25
picarones/measurements/normalization.py +0 -33
picarones/measurements/numerical_sequences.py +0 -18
picarones/measurements/pricing.py +0 -15
picarones/measurements/rare_tokens.py +0 -10
picarones/measurements/robustness_projection.py +0 -18
picarones/measurements/roman_numerals.py +0 -18
picarones/measurements/runner/orchestration.py +2 -2
picarones/measurements/specialization.py +0 -25
picarones/measurements/structure.py +0 -26
picarones/measurements/taxonomy.py +0 -33
picarones/measurements/taxonomy_comparison.py +0 -10
picarones/measurements/taxonomy_cooccurrence.py +0 -10
picarones/measurements/taxonomy_intra_doc.py +0 -23
picarones/measurements/throughput.py +0 -10
picarones/measurements/worst_lines.py +0 -10
picarones/reports_v2/html/renderers/error_absorption.py +1 -1
picarones/reports_v2/html/renderers/image_predictive.py +1 -1
picarones/reports_v2/html/renderers/incremental_comparison.py +1 -1
picarones/reports_v2/html/renderers/longitudinal.py +1 -1
picarones/reports_v2/html/renderers/module_audit.py +1 -1
picarones/reports_v2/html/renderers/robustness_projection.py +1 -1

CLAUDE.md CHANGED Viewed

@@ -118,7 +118,7 @@ picarones/
 ## État des tests et bugs historiques
-`pytest tests/` → **5080 passed, 12 skipped, 8 deselected, 0 failed**
 (post-S59).  Les deselected sont les markers `live` (5 tests d'intégration
 contre vraie API/binaire) + `network` (3 tests qui hit le réseau réel),
 opt-in en local via `pytest -m live` ou `pytest -m network`.  Le
@@ -156,7 +156,7 @@ correspondants (`test_sprint15_llm_pipeline_bugs.py`, `test_sprint8_escriptorium
   CI, Makefile et invocation directe produisent le même résultat. Le job
   `lint` du CI est bloquant — un F401 (import inutilisé) ou un E741
   (variable ambiguë) fait échouer la PR, par design.
-- **Les profils de normalisation** sont dans `picarones/measurements/normalization.py` — l'endpoint
   `/api/normalization/profiles` doit les lire dynamiquement depuis ce fichier, pas depuis une
   liste statique.
@@ -248,7 +248,7 @@ Résumé express :
 1. `git branch --show-current` → `claude/repo-analysis-cukvm`.
 2. `git status` → working tree clean.
-3. `pytest tests/ -q --no-header --tb=line` → 5080 passed.
 4. `git log -1 --format=%B` → décrit la prochaine sub-phase.
 **Règles d'architecture critiques** (apprises à la dure) :
@@ -336,7 +336,7 @@ détecte, arbitre, rend.
 ## Contexte développement
 - **Environnement** : GitHub Codespaces, Python 3.11+
-- **Tests** : `pytest tests/ -q` → 5080 passed, 12 skipped, 24
   deselected, 0 failed (au moment de la pause de session).
 - **Plan d'évolution actif** : [`docs/roadmap/evolution-2026.md`](docs/roadmap/evolution-2026.md).
 - **Plan retrait du legacy (maître)** : [`docs/migration/legacy-retirement-plan.md`](docs/migration/legacy-retirement-plan.md).

 ## État des tests et bugs historiques
+`pytest tests/` → **5040 passed, 12 skipped, 8 deselected, 0 failed**
 (post-S59).  Les deselected sont les markers `live` (5 tests d'intégration
 contre vraie API/binaire) + `network` (3 tests qui hit le réseau réel),
 opt-in en local via `pytest -m live` ou `pytest -m network`.  Le
   CI, Makefile et invocation directe produisent le même résultat. Le job
   `lint` du CI est bloquant — un F401 (import inutilisé) ou un E741
   (variable ambiguë) fait échouer la PR, par design.
+- **Les profils de normalisation** sont dans `picarones/formats/text/normalization.py` — l'endpoint
   `/api/normalization/profiles` doit les lire dynamiquement depuis ce fichier, pas depuis une
   liste statique.
 1. `git branch --show-current` → `claude/repo-analysis-cukvm`.
 2. `git status` → working tree clean.
+3. `pytest tests/ -q --no-header --tb=line` → 5040 passed.
 4. `git log -1 --format=%B` → décrit la prochaine sub-phase.
 **Règles d'architecture critiques** (apprises à la dure) :
 ## Contexte développement
 - **Environnement** : GitHub Codespaces, Python 3.11+
+- **Tests** : `pytest tests/ -q` → 5040 passed, 12 skipped, 24
   deselected, 0 failed (au moment de la pause de session).
 - **Plan d'évolution actif** : [`docs/roadmap/evolution-2026.md`](docs/roadmap/evolution-2026.md).
 - **Plan retrait du legacy (maître)** : [`docs/migration/legacy-retirement-plan.md`](docs/migration/legacy-retirement-plan.md).

README.md CHANGED Viewed

@@ -299,7 +299,7 @@ client generation.
 Picarones ships **11 built-in normalization profiles** for historical
 text comparison (defined in
-[`picarones/measurements/normalization.py`](picarones/measurements/normalization.py),
 exposed via `/api/normalization/profiles`):
 `nfc`, `caseless`, `minimal`, `medieval_french`,
@@ -395,7 +395,7 @@ ruff check picarones/ tests/
 python -m mypy picarones/core/
 ```
-**Test suite**: ~5080 tests, ~3 min on a modern laptop. Coverage
 floor at 85% (currently ~87%). The `network` marker excludes tests
 requiring live HTTP. A handful of tests depend on optional engines
 (`pero-ocr`, `pytesseract`) and are skipped/fail gracefully when

 Picarones ships **11 built-in normalization profiles** for historical
 text comparison (defined in
+[`picarones/formats/text/normalization.py`](picarones/formats/text/normalization.py),
 exposed via `/api/normalization/profiles`):
 `nfc`, `caseless`, `minimal`, `medieval_french`,
 python -m mypy picarones/core/
 ```
+**Test suite**: ~5040 tests, ~3 min on a modern laptop. Coverage
 floor at 85% (currently ~87%). The `network` marker excludes tests
 requiring live HTTP. A handful of tests depend on optional engines
 (`pero-ocr`, `pytesseract`) and are skipped/fail gracefully when

SPECS.md CHANGED Viewed

@@ -467,7 +467,7 @@ canonique (champ `reference`).
 ### 6.2 Profils de normalisation
-11 profils livrés (`picarones/measurements/normalization.py`,
 exposés via `/api/normalization/profiles`) : `nfc`, `caseless`,
 `minimal`, `medieval_french`, `early_modern_french`,
 `medieval_latin`, `medieval_english`, `early_modern_english`,

 ### 6.2 Profils de normalisation
+11 profils livrés (`picarones/formats/text/normalization.py`,
 exposés via `/api/normalization/profiles`) : `nfc`, `caseless`,
 `minimal`, `medieval_french`, `early_modern_french`,
 `medieval_latin`, `medieval_english`, `early_modern_english`,

docs/migration/SESSION_HANDOVER.md CHANGED Viewed

@@ -203,12 +203,13 @@ fiable.)
 ### 4.A Imports legacy dans les tests
-**91 fichiers** avec **472 statements** d'import depuis les
 paquets legacy (``core``, ``measurements``, ``engines``,
-``llm``, ``pipelines``, ``report``, ``modules``) — Lots A, B et
-C terminés (cf. 4.D ci-dessous).  Le sous-paquet ``core/`` ne
-contient plus que ``diff_utils`` et ``xml_utils`` (à migrer en
-Lot G ou plus tard).
 Top chemins consommés :
@@ -218,7 +219,7 @@ Top chemins consommés :
 | 18      | ``from picarones.measurements.metrics import MetricsResult``  |
 | 16      | ``from picarones.measurements.statistics import wilcoxon_test`` |
 | 13      | ``from picarones.measurements.metrics import compute_metrics`` |
-| 10      | ``from picarones.measurements.normalization import get_builtin_profile`` |
 **Pourquoi c'est important** : ces tests passent par les shims
 au lieu de pointer vers le canonique.  Tant que ces imports
@@ -228,8 +229,9 @@ existent, on **ne peut pas supprimer les shims** (le test casse).
 commit, avancer.  Shims supprimés dans les Lots A
 (``core.modules`` + ``core.facts``), B
 (``core.metric_registry`` + ``core.metric_hooks`` +
-``core.metrics``) et C (``core.results`` + ``core.corpus`` +
-``core.pipeline``) sur la branche
 ``claude/migrate-core-to-domain-8ubIT``.
 ### 4.B Imports legacy en production (hors shims eux-mêmes)
@@ -284,9 +286,30 @@ L'ordre recommandé, par lots de symboles cohérents :
      migrées vers les chemins canoniques ; logger filter dans
      ``test_sprint32_multi_level_gt`` aligné sur
      ``picarones.evaluation.corpus``.
-4. **Lot D — evaluation/metrics/*** (~80 imports) :
-   - ``measurements.{difficulty, taxonomy, calibration, …}`` →
-     ``evaluation.metrics.{...}``
 5. **Lot E — adapters/legacy_***  (~50 imports) :
    - ``engines.*`` → ``adapters.legacy_engines.*``
    - ``modules.alto_text_to_mono_region`` →

 ### 4.A Imports legacy dans les tests
+**66 fichiers** avec **372 statements** d'import depuis les
 paquets legacy (``core``, ``measurements``, ``engines``,
+``llm``, ``pipelines``, ``report``, ``modules``) — Lots A, B,
+C et D terminés (cf. 4.D ci-dessous).  Le sous-paquet
+``core/`` ne contient plus que ``diff_utils`` et ``xml_utils``,
+et ``measurements/`` est passé de 50+ shims à ~25 modules
+réellement présents.
 Top chemins consommés :
 | 18      | ``from picarones.measurements.metrics import MetricsResult``  |
 | 16      | ``from picarones.measurements.statistics import wilcoxon_test`` |
 | 13      | ``from picarones.measurements.metrics import compute_metrics`` |
+| 10      | ``from picarones.measurements.robustness import degrade_image_bytes`` |
 **Pourquoi c'est important** : ces tests passent par les shims
 au lieu de pointer vers le canonique.  Tant que ces imports
 commit, avancer.  Shims supprimés dans les Lots A
 (``core.modules`` + ``core.facts``), B
 (``core.metric_registry`` + ``core.metric_hooks`` +
+``core.metrics``), C (``core.results`` + ``core.corpus`` +
+``core.pipeline``) et D (34 shims plats de ``measurements/``
+vers ``evaluation.metrics/``) sur la branche
 ``claude/migrate-core-to-domain-8ubIT``.
 ### 4.B Imports legacy en production (hors shims eux-mêmes)
      migrées vers les chemins canoniques ; logger filter dans
      ``test_sprint32_multi_level_gt`` aligné sur
      ``picarones.evaluation.corpus``.
+4. ✅ **Lot D — evaluation/metrics/*** (~100 imports + 44
+   prod migrés, 34 shims supprimés en bloc) :
+   - ``measurements.{baseline_comparison, calibration,
+     char_scores, confusion, cost_projection, difficulty,
+     error_absorption, hallucination, image_predictive,
+     image_quality, incremental_comparison, inter_engine,
+     layout, levers, lexical_modernization, line_metrics,
+     longitudinal, marginal_cost, module_policy, ner_backends,
+     normalization, numerical_sequences, pricing, rare_tokens,
+     robustness_projection, roman_numerals, specialization,
+     structure, taxonomy, taxonomy_comparison,
+     taxonomy_cooccurrence, taxonomy_intra_doc, throughput,
+     worst_lines}`` → ``evaluation.metrics.{...}``.
+   - ``picarones/measurements/__init__.py`` réécrit pour
+     refléter la nouvelle composition (modules legacy
+     restants + `import picarones.evaluation.metrics`
+     unique pour déclencher les décorateurs).
+   - ``test_no_flat_files_in_measurements::WHITELIST_FLAT_FILES_S3``
+     réduit de 60 → 25 entrées.
+   - ``test_module_coverage::TEST_ONLY_BASELINE`` réduit
+     de 16 → 4 entrées.
+   - ``test_file_budgets::FILE_BUDGETS`` débarrassé des
+     entrées orphelines (inter_engine, levers,
+     normalization).
 5. **Lot E — adapters/legacy_***  (~50 imports) :
    - ``engines.*`` → ``adapters.legacy_engines.*``
    - ``modules.alto_text_to_mono_region`` →

picarones/fixtures.py CHANGED Viewed

@@ -17,15 +17,15 @@ from picarones.measurements.metrics import MetricsResult
 from picarones.evaluation.benchmark_result import BenchmarkResult, DocumentResult, EngineReport
 from picarones.pipelines.over_normalization import detect_over_normalization
 # Sprint 5 — métriques avancées
-from picarones.measurements.confusion import build_confusion_matrix
-from picarones.measurements.char_scores import compute_ligature_score, compute_diacritic_score
-from picarones.measurements.taxonomy import classify_errors, aggregate_taxonomy
-from picarones.measurements.structure import analyze_structure, aggregate_structure
-from picarones.measurements.image_quality import generate_mock_quality_scores, aggregate_image_quality
-from picarones.measurements.char_scores import aggregate_ligature_scores, aggregate_diacritic_scores
 # Sprint 10 — distribution des erreurs + hallucinations VLM
-from picarones.measurements.line_metrics import compute_line_metrics, aggregate_line_metrics, LineMetrics
-from picarones.measurements.hallucination import compute_hallucination_metrics, aggregate_hallucination_metrics
 # ---------------------------------------------------------------------------
 # Textes GT réalistes (documents patrimoniaux)
@@ -427,11 +427,11 @@ def generate_sample_benchmark(
                 }
         # Agrégation Sprint 5
-        from picarones.measurements.confusion import aggregate_confusion_matrices, ConfusionMatrix
-        from picarones.measurements.char_scores import LigatureScore, DiacriticScore
-        from picarones.measurements.taxonomy import TaxonomyResult
-        from picarones.measurements.structure import StructureResult
-        from picarones.measurements.image_quality import ImageQualityResult
         agg_confusion = aggregate_confusion_matrices([
             ConfusionMatrix(**dr.confusion_matrix)
@@ -468,7 +468,7 @@ def generate_sample_benchmark(
             LineMetrics.from_dict(dr.line_metrics)
             for dr in doc_results if dr.line_metrics
         ])
-        from picarones.measurements.hallucination import HallucinationMetrics as _HM
         agg_hallucination = aggregate_hallucination_metrics([
             _HM.from_dict(dr.hallucination_metrics)
             for dr in doc_results if dr.hallucination_metrics

 from picarones.evaluation.benchmark_result import BenchmarkResult, DocumentResult, EngineReport
 from picarones.pipelines.over_normalization import detect_over_normalization
 # Sprint 5 — métriques avancées
+from picarones.evaluation.metrics.confusion import build_confusion_matrix
+from picarones.evaluation.metrics.char_scores import compute_ligature_score, compute_diacritic_score
+from picarones.evaluation.metrics.taxonomy import classify_errors, aggregate_taxonomy
+from picarones.evaluation.metrics.structure import analyze_structure, aggregate_structure
+from picarones.evaluation.metrics.image_quality import generate_mock_quality_scores, aggregate_image_quality
+from picarones.evaluation.metrics.char_scores import aggregate_ligature_scores, aggregate_diacritic_scores
 # Sprint 10 — distribution des erreurs + hallucinations VLM
+from picarones.evaluation.metrics.line_metrics import compute_line_metrics, aggregate_line_metrics, LineMetrics
+from picarones.evaluation.metrics.hallucination import compute_hallucination_metrics, aggregate_hallucination_metrics
 # ---------------------------------------------------------------------------
 # Textes GT réalistes (documents patrimoniaux)
                 }
         # Agrégation Sprint 5
+        from picarones.evaluation.metrics.confusion import aggregate_confusion_matrices, ConfusionMatrix
+        from picarones.evaluation.metrics.char_scores import LigatureScore, DiacriticScore
+        from picarones.evaluation.metrics.taxonomy import TaxonomyResult
+        from picarones.evaluation.metrics.structure import StructureResult
+        from picarones.evaluation.metrics.image_quality import ImageQualityResult
         agg_confusion = aggregate_confusion_matrices([
             ConfusionMatrix(**dr.confusion_matrix)
             LineMetrics.from_dict(dr.line_metrics)
             for dr in doc_results if dr.line_metrics
         ])
+        from picarones.evaluation.metrics.hallucination import HallucinationMetrics as _HM
         agg_hallucination = aggregate_hallucination_metrics([
             _HM.from_dict(dr.hallucination_metrics)
             for dr in doc_results if dr.hallucination_metrics

picarones/measurements/__init__.py CHANGED Viewed

@@ -1,14 +1,11 @@
-"""Métriques officielles Picarones — Cercle 2.
-Ce package contient l'ensemble des mesures et analyses qui calculent,
-agrègent ou interprètent des métriques sur un corpus. Il dépend du
-cercle 1 (``picarones.core``) qui définit les abstractions, et est
-consommé par le cercle 3 (``picarones.report``, ``picarones.cli``,
-``picarones.web``) qui présente les résultats.
-Sous-modules
-------------
-Coeur :
 - :mod:`metrics`              compute_metrics (CER/WER/MER/WIL via jiwer)
 - :mod:`statistics`           Wilcoxon, Friedman, Nemenyi, Pareto, CDD
@@ -16,96 +13,46 @@ Coeur :
 - :mod:`builtin_hooks`        12 hooks doc + 12 agrégateurs natifs
 - :mod:`builtin_metrics`      enregistrement métriques dans le registry
 - :mod:`alto_metrics`         métriques jonction TEXT/ALTO
-- :mod:`normalization`        profils Unicode
-Erreurs et taxonomie :
-- :mod:`confusion`            matrice de confusion Unicode
-- :mod:`char_scores`          scores ligatures/diacritiques
-- :mod:`taxonomy`             taxonomie 9 classes d'erreurs
-- :mod:`taxonomy_comparison`  comparaison taxonomique miroir
-- :mod:`taxonomy_cooccurrence` Jaccard inter-classes
-- :mod:`taxonomy_intra_doc`   heatmap classes × position
-Structure et lignes :
-- :mod:`structure`            blocs/lignes/mots
-- :mod:`line_metrics`         distribution CER par ligne (Gini, percentiles)
-- :mod:`worst_lines`          lignes pires globales
-Fiabilité et calibration :
-- :mod:`calibration`          ECE, MCE, reliability bins
-- :mod:`reliability`          IAA Cohen κ + multirun stability
-- :mod:`hallucination`        détection hallucinations VLM
-- :mod:`robustness`           courbes CER vs dégradation
-- :mod:`robustness_projection` projection sur corpus réel
-Image et difficulté :
-- :mod:`image_quality`        contraste, bruit, flou…
-- :mod:`image_predictive`     complexité paléographique
-- :mod:`difficulty`           score difficulté intrinsèque
-Contenu et lisibilité :
-- :mod:`searchability`        recherchabilité fuzzy (Levenshtein)
-- :mod:`numerical_sequences`  préservation dates/cotes/numéraux
-- :mod:`rare_tokens`          rappel sur tokens rares
-- :mod:`readability`          Δ Flesch (sur-normalisation)
-Structure ALTO et entités :
-- :mod:`layout`               F1 layout par type de région
-- :mod:`reading_order`        F1 ordre de lecture (ICDAR 2015)
-- :mod:`ner`, :mod:`ner_backends`
-- :mod:`error_absorption`     correction vs introduction par jonction
-Inter-moteurs et historique :
-- :mod:`inter_engine`         divergence taxonomique + oracle gap
-- :mod:`specialization`       spécialisation inter-moteurs
-- :mod:`baseline_comparison`  comparaison à l'historique
-- :mod:`longitudinal`         régression linéaire + change-point
-- :mod:`incremental_comparison` ANOVA-like par slot
-- :mod:`history`              historique SQLite
-Économie et opération :
-- :mod:`pricing`              table tarifaire
-- :mod:`throughput`           pages/h effectif
-- :mod:`cost_projection`      projection à volume cible
-- :mod:`marginal_cost`        coût par erreur évitée
-Philologie historique :
-- :mod:`mufi`                 couverture MUFI (médiéval)
-- :mod:`abbreviations`        signes d'abréviation Capelli
-- :mod:`unicode_blocks`       précision par bloc Unicode
-- :mod:`early_modern_typography` ligatures imprimées XVIᵉ-XVIIIᵉ
-- :mod:`modern_archives`      marqueurs XIXᵉ-XXᵉ
-- :mod:`roman_numerals`       numéraux romains
-- :mod:`lexical_modernization` sur-normalisation lexicale
 Pipelines composées (axe B) :
 - :mod:`pipeline_benchmark`, :mod:`pipeline_comparison`,
-  :mod:`pipeline_spec_loader`
-Aide à la décision :
-- :mod:`levers`               leviers d'amélioration factuels
-- :mod:`equivalence_profile`  curseur fin équivalences diplomatiques
-- :mod:`module_policy`        manifest + audit modules contribués
-Câblages adaptifs (suffixe ``_hooks``) :
-- :mod:`readability_hooks`, :mod:`searchability_hooks`,
-  :mod:`numerical_sequences_hooks`, :mod:`philological_hooks` —
-  adaptive masking document-par-document, consommés par
-  :mod:`builtin_hooks`. Ces modules sont des couches d'adaptation
-  entre le calcul pur (sans I/O) et le runner principal (avec
-  agrégation par moteur).
 Moteur narratif :
@@ -114,35 +61,28 @@ Moteur narratif :
   ``FactType``, ``DetectorRegistry``) vit en couche 1 dans
   :mod:`picarones.domain.facts`.
-Voir :doc:`docs/explanation/architecture.md` pour la cartographie complète et
-la règle de dépendance des 3 cercles.
 """
 # ──────────────────────────────────────────────────────────────────────────
-# Sprint A3 (renforce le respect de la règle Cercle 2 → Cercle 1
-# uniquement) — la cérémonie d'enregistrement des métriques typées dans
-# le registre Sprint 34 a été déplacée ici depuis ``core/pipeline.py``
-# qui violait la règle.
-#
-# Tout consommateur qui veut utiliser ``compute_at_junction``
-# (``picarones.evaluation.metric_registry``) doit avoir importé
-# ``picarones.measurements`` au moins une fois pour que les décorateurs
-# ``@register_metric`` aient été exécutés. C'est le cas par défaut dans
-# le pipeline standard ; les notebooks isolés peuvent ajouter
-# ``import picarones.measurements`` (suivi d'un commentaire d'exception
-# ruff sur la ligne d'import si leur linter signale un import inutilisé).
 #
 # Sans ces imports, ``compute_at_junction`` trouverait un registre vide
 # et ne calculerait rien aux jonctions.
 # ──────────────────────────────────────────────────────────────────────────
 # Sprint 34 : cer / wer / mer / wil + stub TEXT→ALTO
 from picarones.measurements import builtin_metrics  # noqa: F401
-# Sprints 55-60 : métriques philologiques.
 from picarones.measurements import abbreviations  # noqa: F401
 from picarones.measurements import early_modern_typography  # noqa: F401
 from picarones.measurements import modern_archives  # noqa: F401
 from picarones.measurements import mufi  # noqa: F401
-from picarones.measurements import roman_numerals  # noqa: F401
 from picarones.measurements import unicode_blocks  # noqa: F401
 # Sprint 53 : reading order F1.  Sprints 38, 52 : NER, readability.
 from picarones.measurements import ner  # noqa: F401
@@ -152,27 +92,19 @@ from picarones.measurements import reading_order  # noqa: F401
 # les reconstructeurs ALTO contre une GT ALTO du document.
 from picarones.measurements import alto_metrics  # noqa: F401
-# ──────────────────────────────────────────────────────────────────────────
-# Sprint « zéro dette actionnable » (mai 2026) — modules sans appel
-# automatique par le runner OCR principal mais qui font partie de l'API
-# publique de ``picarones.measurements``. L'import ici les rend
-# accessibles en ``from picarones.measurements import X`` et garantit
-# qu'aucun ne devient « test-only » silencieusement (cf.
-# ``tests/architecture/test_module_coverage.py``).
-#
-# Distinction de scope :
-# - Modules de calcul utilisés via les renderers HTML composables
-#   (l'utilisateur les compose lui-même selon son use case) :
-from picarones.measurements import baseline_comparison  # noqa: F401  # historique SQLite
-from picarones.measurements import cost_projection  # noqa: F401  # volume cible utilisateur
 from picarones.measurements import equivalence_profile  # noqa: F401  # curseur HTML
-from picarones.measurements import error_absorption  # noqa: F401  # jonction pipeline composée
-from picarones.measurements import layout  # noqa: F401  # GT ALTO requise (axe B)
-from picarones.measurements import longitudinal  # noqa: F401  # historique SQLite
-from picarones.measurements import marginal_cost  # noqa: F401  # paires de moteurs
-from picarones.measurements import module_policy  # noqa: F401  # outil d'audit
-from picarones.measurements import ner_backends  # noqa: F401  # factory backends NER
-from picarones.measurements import rare_tokens  # noqa: F401  # corpus-wide
 from picarones.measurements import reliability  # noqa: F401  # multi-runs
-from picarones.measurements import taxonomy_cooccurrence  # noqa: F401  # depuis taxonomy
-from picarones.measurements import taxonomy_intra_doc  # noqa: F401  # depuis taxonomy

+"""Métriques officielles Picarones — paquet legacy en cours de retrait.
+Ce paquet, historiquement nommé « Cercle 2 — logique métier », est
+progressivement vidé au profit du paquet canonique
+:mod:`picarones.evaluation.metrics`.  Les modules qui restent ici ne
+sont pas encore migrés (Catégorie B/C/D du plan de migration) :
+Coeur (toujours legacy) :
 - :mod:`metrics`              compute_metrics (CER/WER/MER/WIL via jiwer)
 - :mod:`statistics`           Wilcoxon, Friedman, Nemenyi, Pareto, CDD
 - :mod:`builtin_hooks`        12 hooks doc + 12 agrégateurs natifs
 - :mod:`builtin_metrics`      enregistrement métriques dans le registry
 - :mod:`alto_metrics`         métriques jonction TEXT/ALTO
+Métriques philologiques (Catégorie B — register_metric singleton) :
+- :mod:`mufi`, :mod:`abbreviations`, :mod:`unicode_blocks`,
+  :mod:`early_modern_typography`, :mod:`modern_archives`,
+  :mod:`reading_order`, :mod:`ner`, :mod:`readability`,
+  :mod:`searchability`.
+Câblages adaptifs (suffixe ``_hooks``) :
+- :mod:`readability_hooks`, :mod:`searchability_hooks`,
+  :mod:`numerical_sequences_hooks`, :mod:`philological_hooks`.
 Pipelines composées (axe B) :
 - :mod:`pipeline_benchmark`, :mod:`pipeline_comparison`,
+  :mod:`pipeline_spec_loader`.
+Auxiliaires :
+- :mod:`equivalence_profile`, :mod:`reliability`, :mod:`history`,
+  :mod:`robustness`.
+Modules retirés (Lot D, mai 2026)
+---------------------------------
+Tous les shims qui ne faisaient que ré-exporter
+``picarones.evaluation.metrics.X`` ont été supprimés en bloc :
+``baseline_comparison``, ``calibration``, ``char_scores``,
+``confusion``, ``cost_projection``, ``difficulty``,
+``error_absorption``, ``hallucination``, ``image_predictive``,
+``image_quality``, ``incremental_comparison``, ``inter_engine``,
+``layout``, ``levers``, ``lexical_modernization``,
+``line_metrics``, ``longitudinal``, ``marginal_cost``,
+``module_policy``, ``ner_backends``, ``normalization``,
+``numerical_sequences``, ``pricing``, ``rare_tokens``,
+``robustness_projection``, ``roman_numerals``, ``specialization``,
+``structure``, ``taxonomy``, ``taxonomy_comparison``,
+``taxonomy_cooccurrence``, ``taxonomy_intra_doc``, ``throughput``,
+``worst_lines``.  Importer désormais depuis
+:mod:`picarones.evaluation.metrics`.
 Moteur narratif :
   ``FactType``, ``DetectorRegistry``) vit en couche 1 dans
   :mod:`picarones.domain.facts`.
+Voir :doc:`docs/explanation/architecture.md` pour la cartographie complète.
 """
 # ──────────────────────────────────────────────────────────────────────────
+# Cérémonie d'enregistrement des métriques typées dans le registre
+# Sprint 34.  Tout consommateur qui veut utiliser ``compute_at_junction``
+# (``picarones.evaluation.metric_registry``) doit avoir importé soit
+# ``picarones.measurements`` soit ``picarones.evaluation.metrics`` au
+# moins une fois pour que les décorateurs ``@register_metric`` aient
+# été exécutés.
 #
 # Sans ces imports, ``compute_at_junction`` trouverait un registre vide
 # et ne calculerait rien aux jonctions.
 # ──────────────────────────────────────────────────────────────────────────
 # Sprint 34 : cer / wer / mer / wil + stub TEXT→ALTO
 from picarones.measurements import builtin_metrics  # noqa: F401
+# Sprints 55-60 : métriques philologiques (Catégorie B — restent ici).
 from picarones.measurements import abbreviations  # noqa: F401
 from picarones.measurements import early_modern_typography  # noqa: F401
 from picarones.measurements import modern_archives  # noqa: F401
 from picarones.measurements import mufi  # noqa: F401
 from picarones.measurements import unicode_blocks  # noqa: F401
 # Sprint 53 : reading order F1.  Sprints 38, 52 : NER, readability.
 from picarones.measurements import ner  # noqa: F401
 # les reconstructeurs ALTO contre une GT ALTO du document.
 from picarones.measurements import alto_metrics  # noqa: F401
+# Lot D — les décorateurs ``@register_metric`` du paquet canonique
+# ``picarones.evaluation.metrics`` sont exécutés dès cet import,
+# garantissant que le registre Sprint 34 contient toutes les métriques
+# canoniques sans avoir besoin des shims supprimés.
+import picarones.evaluation.metrics  # noqa: F401
+# Modules conservés en couche measurements (pas de shim canonique
+# correspondant ; restent ici jusqu'à leur propre relocalisation).
 from picarones.measurements import equivalence_profile  # noqa: F401  # curseur HTML
 from picarones.measurements import reliability  # noqa: F401  # multi-runs
+# Modules canoniques re-exposés pour rétrocompat de
+# ``from picarones.measurements import roman_numerals`` (utilisé par
+# d'anciens callers internes ; au prochain Lot, ils migreront vers
+# ``picarones.evaluation.metrics.roman_numerals``).
+from picarones.evaluation.metrics import roman_numerals  # noqa: F401

picarones/measurements/baseline_comparison.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.baseline_comparison``.
-L'ancien chemin ``picarones.measurements.baseline_comparison`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.baseline_comparison import *  # noqa: F401,F403

picarones/measurements/builtin_hooks.py CHANGED Viewed

@@ -97,7 +97,7 @@ def calibration_from_engine_result(
     normalisées à ``[0, 1]``. Les confidences négatives (Tesseract met
     -1 pour les non-mots) sont ignorées.
     """
-    from picarones.measurements.calibration import compute_calibration_metrics
     if not token_confidences:
         return None
@@ -146,7 +146,7 @@ def calibration_from_engine_result(
     requires_success=True,
 )
 def _confusion_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.confusion import build_confusion_matrix
     return build_confusion_matrix(ground_truth, hypothesis).as_dict()
@@ -157,7 +157,7 @@ def _confusion_hook(*, ground_truth, hypothesis, **_):
     requires_success=True,
 )
 def _char_scores_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.char_scores import (
         compute_diacritic_score,
         compute_ligature_score,
     )
@@ -173,7 +173,7 @@ def _char_scores_hook(*, ground_truth, hypothesis, **_):
     requires_success=True,
 )
 def _taxonomy_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.taxonomy import classify_errors
     return classify_errors(ground_truth, hypothesis).as_dict()
@@ -184,7 +184,7 @@ def _taxonomy_hook(*, ground_truth, hypothesis, **_):
     requires_success=True,
 )
 def _structure_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.structure import analyze_structure
     return analyze_structure(ground_truth, hypothesis).as_dict()
@@ -195,7 +195,7 @@ def _structure_hook(*, ground_truth, hypothesis, **_):
     requires_success=True,
 )
 def _line_metrics_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.line_metrics import compute_line_metrics
     return compute_line_metrics(ground_truth, hypothesis).as_dict()
@@ -206,7 +206,7 @@ def _line_metrics_hook(*, ground_truth, hypothesis, **_):
     requires_success=True,
 )
 def _hallucination_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.hallucination import compute_hallucination_metrics
     return compute_hallucination_metrics(ground_truth, hypothesis).as_dict()
@@ -230,7 +230,7 @@ def _calibration_hook(*, ground_truth, ocr_result, **_):
     # résultat OCR (pour comparer un échec OCR à la qualité image).
 )
 def _image_quality_hook(*, image_path, **_):
-    from picarones.measurements.image_quality import analyze_image_quality
     iq = analyze_image_quality(image_path)
     if iq.error is not None:
         return None
@@ -294,7 +294,7 @@ def _readability_hook(*, ground_truth, hypothesis, corpus_lang, **_):
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_confusion(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.confusion import (
         ConfusionMatrix, aggregate_confusion_matrices,
     )
     try:
@@ -321,7 +321,7 @@ def _aggregate_confusion(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_char_scores(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.char_scores import (
         DiacriticScore,
         LigatureScore,
         aggregate_diacritic_scores,
@@ -351,7 +351,7 @@ def _aggregate_char_scores(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_taxonomy(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.taxonomy import TaxonomyResult, aggregate_taxonomy
     results = [
         TaxonomyResult.from_dict(dr.taxonomy)
         for dr in doc_results
@@ -368,7 +368,7 @@ def _aggregate_taxonomy(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_structure(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.structure import StructureResult, aggregate_structure
     results = [
         StructureResult.from_dict(dr.structure)
         for dr in doc_results
@@ -385,7 +385,7 @@ def _aggregate_structure(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_image_quality(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.image_quality import (
         ImageQualityResult, aggregate_image_quality,
     )
     results = [
@@ -404,7 +404,7 @@ def _aggregate_image_quality(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_line_metrics(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.line_metrics import (
         LineMetrics, aggregate_line_metrics,
     )
     results = [
@@ -423,7 +423,7 @@ def _aggregate_line_metrics(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_hallucination(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.hallucination import (
         HallucinationMetrics, aggregate_hallucination_metrics,
     )
     results = [

     normalisées à ``[0, 1]``. Les confidences négatives (Tesseract met
     -1 pour les non-mots) sont ignorées.
     """
+    from picarones.evaluation.metrics.calibration import compute_calibration_metrics
     if not token_confidences:
         return None
     requires_success=True,
 )
 def _confusion_hook(*, ground_truth, hypothesis, **_):
+    from picarones.evaluation.metrics.confusion import build_confusion_matrix
     return build_confusion_matrix(ground_truth, hypothesis).as_dict()
     requires_success=True,
 )
 def _char_scores_hook(*, ground_truth, hypothesis, **_):
+    from picarones.evaluation.metrics.char_scores import (
         compute_diacritic_score,
         compute_ligature_score,
     )
     requires_success=True,
 )
 def _taxonomy_hook(*, ground_truth, hypothesis, **_):
+    from picarones.evaluation.metrics.taxonomy import classify_errors
     return classify_errors(ground_truth, hypothesis).as_dict()
     requires_success=True,
 )
 def _structure_hook(*, ground_truth, hypothesis, **_):
+    from picarones.evaluation.metrics.structure import analyze_structure
     return analyze_structure(ground_truth, hypothesis).as_dict()
     requires_success=True,
 )
 def _line_metrics_hook(*, ground_truth, hypothesis, **_):
+    from picarones.evaluation.metrics.line_metrics import compute_line_metrics
     return compute_line_metrics(ground_truth, hypothesis).as_dict()
     requires_success=True,
 )
 def _hallucination_hook(*, ground_truth, hypothesis, **_):
+    from picarones.evaluation.metrics.hallucination import compute_hallucination_metrics
     return compute_hallucination_metrics(ground_truth, hypothesis).as_dict()
     # résultat OCR (pour comparer un échec OCR à la qualité image).
 )
 def _image_quality_hook(*, image_path, **_):
+    from picarones.evaluation.metrics.image_quality import analyze_image_quality
     iq = analyze_image_quality(image_path)
     if iq.error is not None:
         return None
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_confusion(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.confusion import (
         ConfusionMatrix, aggregate_confusion_matrices,
     )
     try:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_char_scores(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.char_scores import (
         DiacriticScore,
         LigatureScore,
         aggregate_diacritic_scores,
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_taxonomy(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.taxonomy import TaxonomyResult, aggregate_taxonomy
     results = [
         TaxonomyResult.from_dict(dr.taxonomy)
         for dr in doc_results
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_structure(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.structure import StructureResult, aggregate_structure
     results = [
         StructureResult.from_dict(dr.structure)
         for dr in doc_results
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_image_quality(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.image_quality import (
         ImageQualityResult, aggregate_image_quality,
     )
     results = [
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_line_metrics(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.line_metrics import (
         LineMetrics, aggregate_line_metrics,
     )
     results = [
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_hallucination(doc_results: list) -> Optional[dict]:
+    from picarones.evaluation.metrics.hallucination import (
         HallucinationMetrics, aggregate_hallucination_metrics,
     )
     results = [

picarones/measurements/calibration.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.calibration``.
-L'ancien chemin ``picarones.measurements.calibration`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.calibration import *  # noqa: F401,F403

picarones/measurements/char_scores.py DELETED Viewed

@@ -1,34 +0,0 @@
-"""``picarones.measurements.char_scores`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.char_scores`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.char_scores import (  # noqa: F401
-    LIGATURE_TABLE,
-    DIACRITIC_MAP,
-    LigatureScore,
-    DiacriticScore,
-    compute_ligature_score,
-    compute_diacritic_score,
-    aggregate_ligature_scores,
-    aggregate_diacritic_scores,
-    _ALL_LIGATURES,
-    _SEQ_TO_LIGATURE,
-    _build_diacritic_map,
-    _ALL_DIACRITICS,
-    _LIGATURE_SET,
-    _check_char_at_context,
-)
-warnings.warn(
-    "picarones.measurements.char_scores is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.char_scores instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['LIGATURE_TABLE', 'DIACRITIC_MAP', 'LigatureScore', 'DiacriticScore', 'compute_ligature_score', 'compute_diacritic_score', 'aggregate_ligature_scores', 'aggregate_diacritic_scores']

picarones/measurements/confusion.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.confusion``.
-L'ancien chemin ``picarones.measurements.confusion`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.confusion import *  # noqa: F401,F403

picarones/measurements/cost_projection.py DELETED Viewed

@@ -1,26 +0,0 @@
-"""``picarones.measurements.cost_projection`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.cost_projection`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.cost_projection import (  # noqa: F401
-    ProjectedCost,
-    project_cost_total,
-    project_co2_total,
-    project_engine,
-    project_all_engines,
-    cost_gap_table,
-)
-warnings.warn(
-    "picarones.measurements.cost_projection is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.cost_projection instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['ProjectedCost', 'project_cost_total', 'project_co2_total', 'project_engine', 'project_all_engines', 'cost_gap_table']

picarones/measurements/difficulty.py DELETED Viewed

@@ -1,30 +0,0 @@
-"""``picarones.measurements.difficulty`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.difficulty`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.difficulty import (  # noqa: F401
-    DifficultyScore,
-    compute_difficulty_score,
-    compute_all_difficulties,
-    difficulty_label,
-    _W_VARIANCE,
-    _W_QUALITY,
-    _W_DENSITY,
-    _SPECIAL_CHARS_RE,
-    _special_char_density,
-    _variance,
-)
-warnings.warn(
-    "picarones.measurements.difficulty is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.difficulty instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['DifficultyScore', 'compute_difficulty_score', 'compute_all_difficulties', 'difficulty_label']

picarones/measurements/equivalence_profile.py CHANGED Viewed

@@ -42,7 +42,7 @@ import logging
 from dataclasses import dataclass
 from typing import Iterable, Optional
-from picarones.measurements.normalization import (
     DIPLOMATIC_EN_EARLY_MODERN,
     DIPLOMATIC_FR_EARLY_MODERN,
     DIPLOMATIC_LATIN_MEDIEVAL,

 from dataclasses import dataclass
 from typing import Iterable, Optional
+from picarones.evaluation.metrics.normalization import (
     DIPLOMATIC_EN_EARLY_MODERN,
     DIPLOMATIC_FR_EARLY_MODERN,
     DIPLOMATIC_LATIN_MEDIEVAL,

picarones/measurements/error_absorption.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.error_absorption``.
-L'ancien chemin ``picarones.measurements.error_absorption`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.error_absorption import *  # noqa: F401,F403

picarones/measurements/hallucination.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.hallucination``.
-L'ancien chemin ``picarones.measurements.hallucination`` est conservé
-pour ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.hallucination import *  # noqa: F401,F403

picarones/measurements/image_predictive.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.image_predictive``.
-L'ancien chemin ``picarones.measurements.image_predictive`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.image_predictive import *  # noqa: F401,F403

picarones/measurements/image_quality.py DELETED Viewed

@@ -1,14 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.image_quality``.
-L'ancien chemin ``picarones.measurements.image_quality`` est conservé
-pour ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-Ré-expose explicitement ``_global_quality_score`` (symbole privé
-utilisé downstream).
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.image_quality import *  # noqa: F401,F403
-from picarones.evaluation.metrics.image_quality import _global_quality_score  # noqa: F401

picarones/measurements/incremental_comparison.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.incremental_comparison``.
-L'ancien chemin ``picarones.measurements.incremental_comparison`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.incremental_comparison import *  # noqa: F401,F403

picarones/measurements/inter_engine.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.inter_engine``.
-L'ancien chemin ``picarones.measurements.inter_engine`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.inter_engine import *  # noqa: F401,F403

picarones/measurements/layout.py DELETED Viewed

@@ -1,14 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.layout``.
-L'ancien chemin ``picarones.measurements.layout`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-Ré-expose explicitement le symbole privé ``_iou_bbox`` qu'au moins
-un test importe directement.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.layout import *  # noqa: F401,F403
-from picarones.evaluation.metrics.layout import _iou_bbox  # noqa: F401

picarones/measurements/levers.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.levers``.
-L'ancien chemin ``picarones.measurements.levers`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.levers import *  # noqa: F401,F403

picarones/measurements/lexical_modernization.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.lexical_modernization``.
-L'ancien chemin ``picarones.measurements.lexical_modernization`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.lexical_modernization import *  # noqa: F401,F403

picarones/measurements/line_metrics.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.line_metrics``.
-L'ancien chemin ``picarones.measurements.line_metrics`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.line_metrics import *  # noqa: F401,F403

picarones/measurements/longitudinal.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.longitudinal``.
-L'ancien chemin ``picarones.measurements.longitudinal`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.longitudinal import *  # noqa: F401,F403

picarones/measurements/marginal_cost.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.marginal_cost``.
-L'ancien chemin ``picarones.measurements.marginal_cost`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.marginal_cost import *  # noqa: F401,F403

picarones/measurements/metrics.py CHANGED Viewed

@@ -155,7 +155,7 @@ def compute_metrics(
         cer_diplomatic: Optional[float] = None
         diplomatic_profile_name: Optional[str] = None
         try:
-            from picarones.measurements.normalization import DEFAULT_DIPLOMATIC_PROFILE
             profile = normalization_profile or DEFAULT_DIPLOMATIC_PROFILE
             ref_diplo = profile.normalize(reference)
             hyp_diplo = profile.normalize(hypothesis)
@@ -197,4 +197,4 @@ __all__ = ["MetricsResult", "aggregate_metrics", "compute_metrics"]
 # Import paresseux pour éviter les imports circulaires
 from typing import TYPE_CHECKING
 if TYPE_CHECKING:
-    from picarones.measurements.normalization import NormalizationProfile

         cer_diplomatic: Optional[float] = None
         diplomatic_profile_name: Optional[str] = None
         try:
+            from picarones.evaluation.metrics.normalization import DEFAULT_DIPLOMATIC_PROFILE
             profile = normalization_profile or DEFAULT_DIPLOMATIC_PROFILE
             ref_diplo = profile.normalize(reference)
             hyp_diplo = profile.normalize(hypothesis)
 # Import paresseux pour éviter les imports circulaires
 from typing import TYPE_CHECKING
 if TYPE_CHECKING:
+    from picarones.evaluation.metrics.normalization import NormalizationProfile

picarones/measurements/module_policy.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.module_policy``.
-L'ancien chemin ``picarones.measurements.module_policy`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.module_policy import *  # noqa: F401,F403

picarones/measurements/ner_backends.py DELETED Viewed

@@ -1,25 +0,0 @@
-"""``picarones.measurements.ner_backends`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.ner_backends`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.ner_backends import (  # noqa: F401
-    EntityExtractor,
-    SpacyEntityExtractor,
-    SPACY_PROFILES,
-    get_extractor,
-    is_spacy_available,
-)
-warnings.warn(
-    "picarones.measurements.ner_backends is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.ner_backends instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['EntityExtractor', 'SpacyEntityExtractor', 'SPACY_PROFILES', 'get_extractor', 'is_spacy_available']

picarones/measurements/normalization.py DELETED Viewed

@@ -1,33 +0,0 @@
-"""``picarones.measurements.normalization`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.normalization`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.normalization import (  # noqa: F401
-    NormalizationProfile,
-    DIPLOMATIC_FR_MEDIEVAL,
-    DIPLOMATIC_FR_EARLY_MODERN,
-    DIPLOMATIC_LATIN_MEDIEVAL,
-    DIPLOMATIC_MINIMAL,
-    DIPLOMATIC_EN_EARLY_MODERN,
-    DIPLOMATIC_EN_MEDIEVAL,
-    DIPLOMATIC_EN_SECRETARY,
-    NORMALIZATION_PROFILES,
-    DEFAULT_DIPLOMATIC_PROFILE,
-    get_builtin_profile,
-    _parse_exclude_chars,
-    _apply_diplomatic_table,
-)
-warnings.warn(
-    "picarones.measurements.normalization is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.normalization instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['NormalizationProfile', 'DIPLOMATIC_FR_MEDIEVAL', 'DIPLOMATIC_FR_EARLY_MODERN', 'DIPLOMATIC_LATIN_MEDIEVAL', 'DIPLOMATIC_MINIMAL', 'DIPLOMATIC_EN_EARLY_MODERN', 'DIPLOMATIC_EN_MEDIEVAL', 'DIPLOMATIC_EN_SECRETARY', 'NORMALIZATION_PROFILES', 'DEFAULT_DIPLOMATIC_PROFILE', 'get_builtin_profile', '_parse_exclude_chars', '_apply_diplomatic_table']

picarones/measurements/numerical_sequences.py DELETED Viewed

@@ -1,18 +0,0 @@
-"""``picarones.measurements.numerical_sequences`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.numerical_sequences`.
-Phase 5.C.batch7 du retrait du legacy.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.numerical_sequences import *  # noqa: F401, F403
-warnings.warn(
-    "picarones.measurements.numerical_sequences is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.numerical_sequences instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)

picarones/measurements/pricing.py DELETED Viewed

@@ -1,15 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.pricing``.
-L'ancien chemin ``picarones.measurements.pricing`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-Ce module ré-expose **explicitement** le symbole privé
-``_DEFAULT_PRICING_PATH`` qu'au moins un consommateur importe
-directement (cf. tests).
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.pricing import *  # noqa: F401,F403
-from picarones.evaluation.metrics.pricing import _DEFAULT_PRICING_PATH  # noqa: F401

picarones/measurements/rare_tokens.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.rare_tokens``.
-L'ancien chemin ``picarones.measurements.rare_tokens`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.rare_tokens import *  # noqa: F401,F403

picarones/measurements/robustness_projection.py DELETED Viewed

@@ -1,18 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.robustness_projection``.
-L'ancien chemin ``picarones.measurements.robustness_projection`` est
-conservé pour ne casser aucun consommateur.  Au S22, ce re-export
-disparaîtra.
-Ré-expose explicitement ``_extract_quality_value`` et
-``_interpolate_cer`` (symboles privés utilisés downstream).
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.robustness_projection import *  # noqa: F401,F403
-from picarones.evaluation.metrics.robustness_projection import (  # noqa: F401
-    _extract_quality_value,
-    _interpolate_cer,
-)

picarones/measurements/roman_numerals.py DELETED Viewed

@@ -1,18 +0,0 @@
-"""``picarones.measurements.roman_numerals`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.roman_numerals`.
-Phase 5.C.batch7 du retrait du legacy.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.roman_numerals import *  # noqa: F401, F403
-warnings.warn(
-    "picarones.measurements.roman_numerals is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.roman_numerals instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)

picarones/measurements/runner/orchestration.py CHANGED Viewed

@@ -151,7 +151,7 @@ def run_benchmark(
     # éviter de re-résoudre N fois côté workers.
     norm_profile_obj = None
     if normalization_profile is not None:
-        from picarones.measurements.normalization import get_builtin_profile
         norm_profile_obj = get_builtin_profile(normalization_profile)
     def _is_cancelled() -> bool:
@@ -435,7 +435,7 @@ def run_benchmark(
     inter_engine_payload: Optional[dict] = None
     if len(engine_reports) >= 2:
         try:
-            from picarones.measurements.inter_engine import compute_inter_engine_analysis
             taxonomy_distros = {
                 report.engine_name: (

     # éviter de re-résoudre N fois côté workers.
     norm_profile_obj = None
     if normalization_profile is not None:
+        from picarones.evaluation.metrics.normalization import get_builtin_profile
         norm_profile_obj = get_builtin_profile(normalization_profile)
     def _is_cancelled() -> bool:
     inter_engine_payload: Optional[dict] = None
     if len(engine_reports) >= 2:
         try:
+            from picarones.evaluation.metrics.inter_engine import compute_inter_engine_analysis
             taxonomy_distros = {
                 report.engine_name: (

picarones/measurements/specialization.py DELETED Viewed

@@ -1,25 +0,0 @@
-"""``picarones.measurements.specialization`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.specialization`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.specialization import (  # noqa: F401
-    DEFAULT_THRESHOLDS,
-    compute_specialization_score,
-    classify_specialization,
-    compute_specialization_matrix,
-    top_specialized_pairs,
-)
-warnings.warn(
-    "picarones.measurements.specialization is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.specialization instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['DEFAULT_THRESHOLDS', 'compute_specialization_score', 'classify_specialization', 'compute_specialization_matrix', 'top_specialized_pairs']

picarones/measurements/structure.py DELETED Viewed

@@ -1,26 +0,0 @@
-"""``picarones.measurements.structure`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.structure`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.structure import (  # noqa: F401
-    StructureResult,
-    analyze_structure,
-    aggregate_structure,
-    _count_line_changes,
-    _reading_order_score,
-    _paragraph_conservation_score,
-)
-warnings.warn(
-    "picarones.measurements.structure is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.structure instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['StructureResult', 'analyze_structure', 'aggregate_structure']

picarones/measurements/taxonomy.py DELETED Viewed

@@ -1,33 +0,0 @@
-"""``picarones.measurements.taxonomy`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.taxonomy`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.taxonomy import (  # noqa: F401
-    VISUAL_CONFUSIONS,
-    TaxonomyResult,
-    ERROR_CLASSES,
-    classify_errors,
-    aggregate_taxonomy,
-    _VISUAL_PAIRS,
-    _LATIN_BASIC,
-    _classify_word_error,
-    _is_ligature_error,
-    _is_abbreviation_error,
-    _is_diacritic_error,
-    _is_visual_confusion,
-    _is_oov_word,
-)
-warnings.warn(
-    "picarones.measurements.taxonomy is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.taxonomy instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['VISUAL_CONFUSIONS', 'TaxonomyResult', 'ERROR_CLASSES', 'classify_errors', 'aggregate_taxonomy']

picarones/measurements/taxonomy_comparison.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.taxonomy_comparison``.
-L'ancien chemin ``picarones.measurements.taxonomy_comparison`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.taxonomy_comparison import *  # noqa: F401,F403

picarones/measurements/taxonomy_cooccurrence.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.taxonomy_cooccurrence``.
-L'ancien chemin ``picarones.measurements.taxonomy_cooccurrence`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.taxonomy_cooccurrence import *  # noqa: F401,F403

picarones/measurements/taxonomy_intra_doc.py DELETED Viewed

@@ -1,23 +0,0 @@
-"""``picarones.measurements.taxonomy_intra_doc`` — shim re-export (déprécié, suppression 2.0).
-Canonique : :mod:`picarones.evaluation.metrics.taxonomy_intra_doc`.
-"""
-from __future__ import annotations
-import warnings
-from picarones.evaluation.metrics.taxonomy_intra_doc import (  # noqa: F401
-    compute_taxonomy_position_heatmap,
-    _classify_word_pair,
-    _bin_for_position,
-)
-warnings.warn(
-    "picarones.measurements.taxonomy_intra_doc is deprecated and will be removed in 2.0.  "
-    "Import from picarones.evaluation.metrics.taxonomy_intra_doc instead.",
-    DeprecationWarning,
-    stacklevel=2,
-)
-__all__ = ['compute_taxonomy_position_heatmap']

picarones/measurements/throughput.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.throughput``.
-L'ancien chemin ``picarones.measurements.throughput`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.throughput import *  # noqa: F401,F403

picarones/measurements/worst_lines.py DELETED Viewed

@@ -1,10 +0,0 @@
-"""Re-export — Sprint A14-S10. Le contenu canonique vit dans
-``picarones.evaluation.metrics.worst_lines``.
-L'ancien chemin ``picarones.measurements.worst_lines`` est conservé pour
-ne casser aucun consommateur.  Au S22, ce re-export disparaîtra.
-"""
-from __future__ import annotations
-from picarones.evaluation.metrics.worst_lines import *  # noqa: F401,F403

picarones/reports_v2/html/renderers/error_absorption.py CHANGED Viewed

@@ -31,7 +31,7 @@ l'utilisateur depuis son benchmark de pipeline composée :
 .. code-block:: python
-    from picarones.measurements.error_absorption import (
         compute_error_absorption, aggregate_error_absorption,
     )
     from picarones.reports_v2.html.renderers.error_absorption import (

 .. code-block:: python
+    from picarones.evaluation.metrics.error_absorption import (
         compute_error_absorption, aggregate_error_absorption,
     )
     from picarones.reports_v2.html.renderers.error_absorption import (

picarones/reports_v2/html/renderers/image_predictive.py CHANGED Viewed

@@ -27,7 +27,7 @@ Module pur — l'utilisateur compose :
 .. code-block:: python
-    from picarones.measurements.image_predictive import aggregate_corpus_predictive
     from picarones.reports_v2.html.renderers.image_predictive import (
         build_image_predictive_html,
     )

 .. code-block:: python
+    from picarones.evaluation.metrics.image_predictive import aggregate_corpus_predictive
     from picarones.reports_v2.html.renderers.image_predictive import (
         build_image_predictive_html,
     )

picarones/reports_v2/html/renderers/incremental_comparison.py CHANGED Viewed

@@ -25,7 +25,7 @@ Module pur — l'utilisateur compose :
 .. code-block:: python
-    from picarones.measurements.incremental_comparison import (
         PipelineRun, compare_isolated_effect,
     )
     from picarones.reports_v2.html.renderers.incremental_comparison import (

 .. code-block:: python
+    from picarones.evaluation.metrics.incremental_comparison import (
         PipelineRun, compare_isolated_effect,
     )
     from picarones.reports_v2.html.renderers.incremental_comparison import (

picarones/reports_v2/html/renderers/longitudinal.py CHANGED Viewed

@@ -25,7 +25,7 @@ Module pur — l'utilisateur compose :
 .. code-block:: python
     from picarones.measurements.history import BenchmarkHistory
-    from picarones.measurements.longitudinal import compute_corpus_longitudinal
     from picarones.reports_v2.html.renderers.longitudinal import build_longitudinal_html
     hist = BenchmarkHistory(db_path)

 .. code-block:: python
     from picarones.measurements.history import BenchmarkHistory
+    from picarones.evaluation.metrics.longitudinal import compute_corpus_longitudinal
     from picarones.reports_v2.html.renderers.longitudinal import build_longitudinal_html
     hist = BenchmarkHistory(db_path)

picarones/reports_v2/html/renderers/module_audit.py CHANGED Viewed

@@ -30,7 +30,7 @@ Module pur — l'utilisateur compose la liste depuis sa
 .. code-block:: python
-    from picarones.measurements.module_policy import audit_module
     from picarones.reports_v2.html.renderers.module_audit import build_module_audit_html
     audits = []

 .. code-block:: python
+    from picarones.evaluation.metrics.module_policy import audit_module
     from picarones.reports_v2.html.renderers.module_audit import build_module_audit_html
     audits = []

picarones/reports_v2/html/renderers/robustness_projection.py CHANGED Viewed

@@ -21,7 +21,7 @@ l'utilisateur compose :
 .. code-block:: python
     from picarones.measurements.robustness import analyze_robustness
-    from picarones.measurements.robustness_projection import (
         project_robustness_on_corpus,
         aggregate_projection_per_engine,
     )

 .. code-block:: python
     from picarones.measurements.robustness import analyze_robustness
+    from picarones.evaluation.metrics.robustness_projection import (
         project_robustness_on_corpus,
         aggregate_projection_per_engine,
     )