File size: 24,784 Bytes
3ff40b2
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
5d3ba70
3ff40b2
 
 
 
 
 
 
 
 
5d3ba70
3ff40b2
 
5d3ba70
3ff40b2
 
eb3dbb9
 
3ff40b2
 
eb3dbb9
 
 
 
 
 
 
 
3ff40b2
 
 
 
 
 
9d1e3f2
3ff40b2
 
 
 
 
9d1e3f2
3ff40b2
 
75b91fd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3ff40b2
 
9d1e3f2
3ff40b2
 
 
 
9d1e3f2
3ff40b2
 
 
 
 
 
 
 
 
 
5d3ba70
3ff40b2
 
 
 
 
 
 
 
5d3ba70
3ff40b2
 
 
cc20338
3ff40b2
 
 
 
 
cc20338
3ff40b2
 
 
 
 
cc20338
3ff40b2
 
 
 
cc20338
3ff40b2
 
 
 
 
 
 
 
 
 
 
 
 
91dc42d
 
3ff40b2
91dc42d
 
 
 
 
 
 
3ff40b2
 
 
35db5d2
3ff40b2
35db5d2
 
 
 
 
3ff40b2
 
4638d67
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
91dc42d
 
 
 
 
 
 
 
 
4638d67
91dc42d
 
 
4638d67
 
3ff40b2
ac7a28c
3ff40b2
 
 
 
 
ac7a28c
3ff40b2
 
 
 
 
 
ac7a28c
3ff40b2
 
 
 
ac7a28c
3ff40b2
 
 
 
 
 
 
 
ac7a28c
3ff40b2
 
 
 
 
 
 
 
 
 
ac7a28c
3ff40b2
 
 
 
 
 
ac7a28c
3ff40b2
 
 
 
 
 
 
 
 
ac7a28c
3ff40b2
 
 
 
 
 
 
 
ac7a28c
3ff40b2
 
 
ccf9579
3ff40b2
 
 
 
 
 
 
 
 
ccf9579
3ff40b2
 
 
ccf9579
3ff40b2
 
 
 
 
ccf9579
3ff40b2
 
 
 
 
 
ccf9579
3ff40b2
 
 
de9192c
3ff40b2
 
 
 
 
de9192c
3ff40b2
 
 
 
 
de9192c
3ff40b2
 
 
 
 
 
 
 
 
 
 
 
979f3c3
 
 
 
503d263
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3ff40b2
 
 
 
d109222
3ff40b2
 
 
 
 
c0f7ba9
 
 
3ff40b2
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d0a3fab
 
 
 
 
 
 
 
3ff40b2
0b76160
 
 
 
 
3ff40b2
5d3ba70
9d1e3f2
 
5d3ba70
cc20338
0b76160
ac7a28c
 
ccf9579
 
de9192c
3ff40b2
 
 
 
 
 
 
 
d0a3fab
 
 
 
 
 
3ff40b2
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
"""Test de stabilitรฉ de l'API publique de Picarones (Cercle 1).

Phase D du chantier de refonte en 3 cercles. Ce test est le **filet de
sรฉcuritรฉ contractuel** documentรฉ dans :doc:`docs/api-stable.md` : il
รฉchoue dรจs qu'un nom listรฉ dans le contrat de stabilitรฉ du Cercle 1
disparaรฎt, change de type (class โ†” function), ou perd un argument
attendu.

Discipline
----------
Toute modification d'un test ici doit รชtre accompagnรฉe d'une mise ร 
jour de ``docs/api-stable.md`` et **justifiรฉe par une RFC** si elle
casse la rรฉtrocompat. Ce test est la traduction technique d'un
engagement public.

Si une PR doit ajouter un nom ร  l'API publique, suivre dans l'ordre :

1. Documenter le nom dans ``docs/api-stable.md``.
2. Ajouter le test correspondant ici.
3. Implรฉmenter / exposer le nom.

Si une PR doit casser un nom de l'API publique :

1. RFC + bump majeur (``2.0.0``).
2. Mise ร  jour de ``docs/api-stable.md`` (suppression).
3. Mise ร  jour des tests ici.

Les noms historiques rรฉtrocompat (Cercle 2 / Cercle 3 via shims) ne
sont **pas** couverts par ce test โ€” ils ont leurs propres tests dans
``tests/test_phaseA_migration.py``, ``test_phaseB_migration.py``, etc.
"""

from __future__ import annotations

import importlib
import inspect

import pytest


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# Helpers
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


def _get_attr(module_path: str, name: str):
    mod = importlib.import_module(module_path)
    assert hasattr(mod, name), (
        f"API publique cassรฉe : {module_path}.{name} a disparu"
    )
    return getattr(mod, name)


def _assert_class(module_path: str, name: str, *, abstract: bool = False):
    obj = _get_attr(module_path, name)
    assert inspect.isclass(obj), (
        f"{module_path}.{name} : attendu class, obtenu {type(obj).__name__}"
    )
    if abstract:
        assert inspect.isabstract(obj) or hasattr(obj, "__abstractmethods__"), (
            f"{module_path}.{name} : attendu classe abstraite"
        )
    return obj


def _assert_function(module_path: str, name: str):
    obj = _get_attr(module_path, name)
    assert callable(obj), (
        f"{module_path}.{name} : attendu callable, obtenu {type(obj).__name__}"
    )
    return obj


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 1. picarones.evaluation.corpus โ€” modรจle Document/Corpus + GT multi-niveaux (canonique)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestCorpusApi:
    @pytest.mark.parametrize("name", [
        "Document", "Corpus",
        "TextGT", "AltoGT", "PageGT", "EntitiesGT", "ReadingOrderGT",
    ])
    def test_class_exists(self, name):
        _assert_class("picarones.evaluation.corpus", name)

    def test_load_corpus_from_directory_exists(self):
        _assert_function("picarones.evaluation.corpus", "load_corpus_from_directory")

    def test_gt_suffixes_constant(self):
        from picarones.domain.artifacts import ArtifactType
        from picarones.evaluation.corpus import GT_SUFFIXES

        assert isinstance(GT_SUFFIXES, dict)
        # Chacun des 5 niveaux GT (ArtifactType) doit avoir un suffixe
        for level in (
            ArtifactType.RAW_TEXT,
            ArtifactType.ALTO_XML,
            ArtifactType.PAGE_XML,
            ArtifactType.ENTITIES,
            ArtifactType.READING_ORDER,
        ):
            assert level in GT_SUFFIXES, (
                f"GT_SUFFIXES manque le niveau {level}"
            )


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 2. picarones.domain โ€” BaseModule + ArtifactType (canoniques)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestModulesApi:
    def test_artifact_type_values(self):
        from picarones.domain.artifacts import ArtifactType

        names = {member.value for member in ArtifactType}
        # Phase 4-bis : ``ArtifactType`` canonique (``domain.artifacts``)
        # โ€” 10 valeurs.  L'ancien set legacy (``image, text, alto, page,
        # entities, reading_order``) reste accessible via les aliases
        # ``TEXT``/``ALTO``/``PAGE`` qui pointent vers les valeurs
        # canoniques ``raw_text``/``alto_xml``/``page_xml``.  Les
        # aliases n'apparaissent pas dans cette itรฉration (Python
        # masque les membres aliasรฉs dans ``__members__`` itรฉrable).
        assert names == {
            "image",
            "raw_text",
            "corrected_text",
            "alto_xml",
            "page_xml",
            "canonical_document",
            "entities",
            "reading_order",
            "alignment",
            "confidences",
        }

    def test_basemodule_is_abstract(self):
        cls = _assert_class("picarones.domain.module_protocol", "BaseModule")
        # Doit avoir `process` abstrait
        assert "process" in cls.__abstractmethods__ or hasattr(cls, "process")

    def test_basemodule_class_attributes(self):
        from picarones.domain.module_protocol import BaseModule

        # Contrat : ces attributs de classe sont lisibles depuis la base
        assert hasattr(BaseModule, "input_types")
        assert hasattr(BaseModule, "output_types")
        assert hasattr(BaseModule, "validate_inputs")
        assert hasattr(BaseModule, "validate_outputs")
        assert hasattr(BaseModule, "metadata")


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 3. picarones.evaluation.benchmark_result โ€” modรจles de rรฉsultats (canonique)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestResultsApi:
    @pytest.mark.parametrize("name", [
        "DocumentResult", "EngineReport", "BenchmarkResult",
    ])
    def test_class_exists(self, name):
        _assert_class("picarones.evaluation.benchmark_result", name)


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 4. picarones.evaluation.metrics.text_metrics โ€” mรฉtriques de base
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestMetricsApi:
    def test_metrics_result_class(self):
        _assert_class("picarones.evaluation.metrics.text_metrics", "MetricsResult")

    @pytest.mark.parametrize("name", [
        "compute_metrics", "aggregate_metrics",
    ])
    def test_function_exists(self, name):
        _assert_function("picarones.evaluation.metrics.text_metrics", name)

    def test_compute_metrics_signature(self):
        """``compute_metrics(reference, hypothesis, char_exclude=None)`` est
        contractuel โ€” les 2 premiers args sont positionnels, le 3แต‰ keyword."""
        from picarones.evaluation.metrics.text_metrics import compute_metrics
        sig = inspect.signature(compute_metrics)
        params = list(sig.parameters.values())
        # Au moins 2 paramรจtres positionnels (reference, hypothesis)
        positional = [p for p in params
                      if p.kind in (p.POSITIONAL_ONLY, p.POSITIONAL_OR_KEYWORD)
                      and p.default is p.empty]
        assert len(positional) >= 2, (
            f"compute_metrics doit accepter >= 2 args positionnels โ€” "
            f"signature actuelle : {sig}"
        )


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 5. (anciennement) ``picarones.app.services.benchmark_runner`` โ€”
#    supprimรฉ en Phase B3-final (mai 2026, migration Option B).
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# Le module ``benchmark_runner.py`` portait l'entry point legacy
# ``run_benchmark_via_service`` qui a รฉtรฉ remplacรฉ par
# ``picarones.RunOrchestrator`` (consommant un ``RunSpec`` Pydantic
# ou des objets domain prรฉ-construits via ``execute_preset()``).
# Le contract test du legacy a รฉtรฉ supprimรฉ avec le module.  Voir
# ``TestRunOrchestratorApi`` ci-dessous pour le contrat de
# l'entry point canonique actuel.


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 6. (anciennement) ``picarones.pipeline.legacy_*`` โ€” supprimรฉ en Phase 7.D
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# Les modules ``pipeline.legacy_runner``, ``legacy_pipeline_benchmark``,
# ``legacy_pipeline_comparison`` et ``measurements.pipeline_spec_loader``
# ont รฉtรฉ supprimรฉs en Phase 7.D (mai 2026). L'API canonique vit dans
# ``picarones.pipeline.executor`` (``PipelineExecutor``) et
# ``picarones.domain.pipeline_spec`` (``PipelineSpec``, ``PipelineStep``).


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 6.bis. picarones.app.services โ€” RunOrchestrator (Phase B3 migration Option B)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestRunOrchestratorApi:
    """Phase B3 โ€” l'entry-point canonique pour lancer un benchmark est
    dรฉsormais ``picarones.RunOrchestrator`` (consomme un ``RunSpec``).
    ``run_benchmark_via_service`` reste exportรฉ mais รฉmet une
    ``DeprecationWarning`` ร  l'appel.  Retrait prรฉvu Phase B8.
    """

    def test_run_orchestrator_class_exposed_at_root(self):
        """``RunOrchestrator`` est accessible depuis le namespace racine."""
        import picarones
        assert hasattr(picarones, "RunOrchestrator"), (
            "RunOrchestrator devrait รชtre exportรฉ depuis picarones (Phase B3)"
        )
        from picarones import RunOrchestrator
        assert inspect.isclass(RunOrchestrator)

    def test_run_spec_class_exposed_at_root(self):
        """``RunSpec`` Pydantic est accessible depuis le namespace racine."""
        import picarones
        assert hasattr(picarones, "RunSpec")
        from picarones import RunSpec
        assert inspect.isclass(RunSpec)

    @pytest.mark.parametrize("name", [
        "OrchestrationResult",
        "RunOrchestrator",
        "RunSpec",
        "RunSpecLoadError",
        "load_run_spec_from_yaml",
    ])
    def test_all_new_exports_present(self, name):
        """Les 5 symboles ajoutรฉs en B3 sont tous dans __all__."""
        import picarones
        assert name in picarones.__all__, (
            f"Phase B3 โ€” '{name}' devrait รชtre dans picarones.__all__"
        )

    def test_prepare_preset_args_exposed_at_root(self):
        """Phase B3-final โ€” ``prepare_preset_args`` est l'API
        publique pour les callers Python qui instancient leurs adapters
        en mรฉmoire (par opposition au chargement YAML via ``RunSpec``).
        """
        from picarones.app.services import (
            PresetArgs,
            prepare_preset_args,
            run_result_to_benchmark_result,
        )
        assert callable(prepare_preset_args)
        assert callable(run_result_to_benchmark_result)
        assert inspect.isclass(PresetArgs)


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 7. picarones.evaluation.metric_registry โ€” registre typรฉ (canonique)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestMetricRegistryApi:
    def test_metric_spec_class(self):
        _assert_class("picarones.evaluation.metric_registry", "MetricSpec")

    @pytest.mark.parametrize("name", [
        "register_metric", "get_metric", "all_metrics",
        "select_metrics", "compute_at_junction",
    ])
    def test_function_exists(self, name):
        _assert_function("picarones.evaluation.metric_registry", name)

    def test_register_metric_keyword_only(self):
        """``register_metric`` est exclusivement keyword-only sur ``name``,
        ``input_types`` etc. โ€” dรฉcorateur factory."""
        from picarones.evaluation.metric_registry import register_metric
        sig = inspect.signature(register_metric)
        for name in ["name", "input_types", "description"]:
            assert name in sig.parameters, (
                f"register_metric : keyword '{name}' manquant"
            )


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 8. picarones.evaluation.metric_hooks โ€” profils + registre de hooks (canonique)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestMetricHooksApi:
    @pytest.mark.parametrize("profile_name", [
        "PROFILE_MINIMAL", "PROFILE_STANDARD", "PROFILE_PHILOLOGICAL",
        "PROFILE_DIAGNOSTICS", "PROFILE_ECONOMICS", "PROFILE_PIPELINE",
        "PROFILE_FULL",
    ])
    def test_profile_constant_exists(self, profile_name):
        from picarones.evaluation import metric_hooks
        assert hasattr(metric_hooks, profile_name), (
            f"Profil {profile_name} disparu"
        )
        assert isinstance(getattr(metric_hooks, profile_name), str)

    def test_known_profiles_set(self):
        from picarones.evaluation.metric_hooks import KNOWN_PROFILES

        assert isinstance(KNOWN_PROFILES, frozenset)
        # Les 7 profils contractuels
        assert len(KNOWN_PROFILES) == 7

    @pytest.mark.parametrize("name", [
        "DocumentMetricHook", "CorpusMetricAggregator",
    ])
    def test_class_exists(self, name):
        _assert_class("picarones.evaluation.metric_hooks", name)

    @pytest.mark.parametrize("name", [
        "validate_profile",
        "register_document_metric", "register_corpus_aggregator",
        "select_document_hooks", "select_corpus_aggregators",
        "run_document_hooks", "run_corpus_aggregators",
    ])
    def test_function_exists(self, name):
        _assert_function("picarones.evaluation.metric_hooks", name)


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 9. picarones.evaluation.metrics.builtin_metrics โ€” CER/WER/MER/WIL natifs
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestBuiltinMetricsApi:
    @pytest.mark.parametrize("name", [
        "cer", "wer", "mer", "wil",
        "text_preservation_after_reconstruction",
    ])
    def test_function_exists(self, name):
        _assert_function("picarones.evaluation.metrics.builtin_metrics", name)


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 10. picarones.evaluation.metrics.alto_metrics โ€” mรฉtriques (ALTO, ALTO)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestAltoMetricsApi:
    def test_extract_text_from_alto(self):
        _assert_function("picarones.evaluation.metrics.alto_metrics", "extract_text_from_alto")

    @pytest.mark.parametrize("name", [
        "alto_text_cer", "alto_text_wer",
        "alto_text_mer", "alto_text_wil",
    ])
    def test_alto_metric_function(self, name):
        _assert_function("picarones.evaluation.metrics.alto_metrics", name)


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 11. picarones.interfaces.web.jobs โ€” JobStore (utilisรฉ par web/)
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestJobsApi:
    def test_job_store(self):
        _assert_class("picarones.interfaces.web.jobs", "JobStore")

    @pytest.mark.parametrize("name", [
        "get_default_store", "reset_default_store",
    ])
    def test_function_exists(self, name):
        _assert_function("picarones.interfaces.web.jobs", name)


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 12. Anti-rรฉgression : aucune fuite de Cercle 2/3 dans le Cercle 1
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestCercle1IsLean:
    """``picarones/core/`` ne doit contenir que les modules Cercle 1 rรฉels
    (les autres sont des shims). Ce test garde-fou empรชche un module
    mรฉtrique d'รชtre rรฉintroduit dans le cล“ur sans RFC."""

    # Modules Cercle 1 โ€” abstractions pures (corpus, contrats, registres).
    # Tout module avec de la logique mรฉtier (calcul, orchestration)
    # appartient au Cercle 2 (``measurements/``) ou au Cercle 3
    # (``extras/``, ``report/``).
    EXPECTED_CERCLE1: set[str] = set()
    # Phase 1 du retrait du legacy a dรฉplacรฉ `facts.py`,
    # `diff_utils.py` et `xml_utils.py` vers leurs canoniques
    # (`domain/facts.py`, `evaluation/_diff_utils.py`,
    # `formats/_xml_utils.py`).  Les fichiers `core/X.py`
    # restent comme shims re-export avec DeprecationWarning
    # (< 30 lignes), donc ne comptent plus comme "real_modules"
    # au sens de ce test.
    # Phase 4-bis a fait pareil pour `modules.py` (canonique :
    # `domain/module_protocol.py` + `domain/artifacts.py`).
    # Phase 4-ter a fait pareil pour `metric_registry.py`,
    # `metric_hooks.py` (canonique : `evaluation/metric_*.py`),
    # `metrics.py` (canonique : `evaluation/metric_result.py`)
    # et `results.py` (canonique :
    # `evaluation/benchmark_result.py`).
    # Phase 4-quater a fait pareil pour `corpus.py`
    # (canonique : `evaluation/corpus.py`).
    # Phase 5.C.batch7 a fait pareil pour `pipeline.py`
    # (canonique : `evaluation/pipeline.py`).  Dรฉsormais
    # ``core/`` ne contient plus que des shims < 30 lignes.

    def test_cercle1_files_lean(self):
        from pathlib import Path

        repo = Path(__file__).parent.parent.parent
        core_dir = repo / "picarones" / "core"

        real_modules = set()
        for path in core_dir.glob("*.py"):
            content = path.read_text(encoding="utf-8")
            n_lines = len(
                [line for line in content.splitlines() if line.strip()],
            )
            # Un shim a < 30 lignes ; un module Cercle 1 a > 30 lignes
            if n_lines > 30:
                real_modules.add(path.name)

        unexpected = real_modules - self.EXPECTED_CERCLE1
        assert not unexpected, (
            f"Modules non-Cercle 1 rรฉintroduits dans core/ : {unexpected}. "
            "Soit les dรฉplacer dans measurements/ (Cercle 2) ou extras/ "
            "(Cercle 3), soit ajouter ร  EXPECTED_CERCLE1 + api-stable.md "
            "via RFC."
        )

        missing = self.EXPECTED_CERCLE1 - real_modules
        assert not missing, (
            f"Modules Cercle 1 manquants : {missing}. Restaurer ou retirer "
            "de EXPECTED_CERCLE1."
        )


# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€
# 13. Doc api-stable.md prรฉsente et complรจte
# โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€โ”€


class TestApiStableDoc:
    def test_doc_exists(self):
        from pathlib import Path

        # S60 โ€” la doc a migrรฉ sous ``docs/reference/`` (Diataxis).
        path = (
            Path(__file__).parent.parent.parent
            / "docs"
            / "reference"
            / "api-stable.md"
        )
        assert path.exists(), "docs/reference/api-stable.md manquant"
        content = path.read_text(encoding="utf-8")
        # Prรฉsence des sections (1 par module canonique).
        # Phase B3-final (mai 2026) โ€” ``picarones.app.services.benchmark_runner``
        # supprimรฉ aprรจs la migration Option B ; remplacรฉ dans la
        # liste par ``picarones.app.services`` (entry point moderne
        # via RunOrchestrator + prepare_preset_args).
        for module in [
            "picarones.evaluation.corpus",
            "picarones.domain.artifacts",
            "picarones.domain.module_protocol",
            "picarones.evaluation.benchmark_result",
            "picarones.evaluation.metrics.text_metrics",
            "picarones.app.services",
            "picarones.evaluation.metric_registry",
            "picarones.evaluation.metric_hooks",
            "picarones.evaluation.metrics.builtin_metrics",
            "picarones.evaluation.metrics.alto_metrics",
            "picarones.interfaces.web.jobs",
        ]:
            assert module in content, (
                f"docs/api-stable.md ne mentionne pas {module}"
            )

    def test_doc_mentions_stability_policy(self):
        from pathlib import Path

        path = (
            Path(__file__).parent.parent.parent
            / "docs"
            / "reference"
            / "api-stable.md"
        )
        content = path.read_text(encoding="utf-8")
        # Les sections clรฉs du contrat
        assert "Politique de stabilitรฉ" in content
        assert "Ce que nous garantissons" in content
        assert "Bump majeur" in content