Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Sleeping

Claude commited on 27 days ago

Commit

f003981

unverified ·

1 Parent(s): 36f4f99

feat(reports_v2): Sprints A14-S42 + S43 — CsvReportRenderer + JsonReportRenderer

Phase 5 (reports CSV + JSON) **complete**.

picarones/reports_v2/csv/render.py (S42)
----------------------------------------
- CsvReportRenderer.render(RunResult) -> str.
- Format : une ligne par (document × pipeline × view × metric).
- Header fixe : run_id, document_id, pipeline_name, view_name,
metric_name, value, status.
- Status : "ok" (métrique calculée), "failed_metric" (la métrique a
levé). Convention rewrite : "OMITTED" pour les pipelines qui ne
produisent pas l'artefact attendu — pas de score factice 0.
- Value formaté à 6 décimales (déterminisme cross-OS contre
IEEE 754 float repr).
- pipeline_name inféré depuis candidate_artifact_id "doc:pipe:type" ;
fallback "<unknown>" si l'id n'est pas parseable.
- csv.writer pour échappement standard (virgules, guillemets).

picarones/reports_v2/json/render.py (S43)
-----------------------------------------
- JsonReportRenderer.render(RunResult) -> str.
- Document JSON consolidé hiérarchique : run_manifest + documents[].
- Sérialisation déterministe : sort_keys=True, indent=2,
ensure_ascii=False (Unicode préservé).
- Différent des 4 fichiers persistés par BenchmarkService.persist
(qui sont streamables) : ce renderer produit un document unique
prêt à archiver ou consommer.

Tests S42 dédiés (8 nouveaux)
-----------------------------
- TestCsvRendererHeader : ordre des colonnes.
- TestCsvRendererSuccessfulMetrics : émet value+status=ok, formatage
6 décimales (0.333333 stable).
- TestCsvRendererFailedMetrics : value vide + status="failed_metric".
- TestCsvRendererPipelineNameInference : extrait depuis artifact_id,
"<unknown>" sur id non parseable.
- TestCsvRendererDeterminism : render×2 → mêmes bytes.

Tests S43 dédiés (7 nouveaux)
-----------------------------
- TestJsonRendererStructure : run_manifest + documents top-level,
doc.document_id + pipeline_results + view_results.
- TestJsonRendererDeterminism : render×2 → mêmes bytes, clés triées
("documents" avant "run_manifest"), Unicode FR préservé sans \\u
escapes.
- TestJsonRendererIndentation : indent=2 (paires de spaces).
- TestJsonRendererEmptyResult : 0 docs → "documents": [] (pas crash).

Tests : 4856 passed, 11 skipped (vs 4841 avant : +8 S42 + +7 S43).
Lint : ruff check picarones/ tests/ → All checks passed.

https://claude.ai/code/session_011XQZNitg1rCgia8ZD1a2hP

Files changed (7) hide show

picarones/reports_v2/csv/__init__.py +13 -2
picarones/reports_v2/csv/render.py +137 -0
picarones/reports_v2/json/__init__.py +11 -2
picarones/reports_v2/json/render.py +95 -0
tests/reports_v2/__init__.py +0 -0
tests/reports_v2/test_sprint_a14_s42_csv_renderer.py +129 -0
tests/reports_v2/test_sprint_a14_s43_json_renderer.py +130 -0

picarones/reports_v2/csv/__init__.py CHANGED Viewed

@@ -1,5 +1,16 @@
-"""Exports CSV par vue d'évaluation — Sprint S22."""
 from __future__ import annotations
-__all__: list[str] = []

+"""Rendu CSV des résultats de benchmark — Sprint A14-S42.
+API publique :
+- ``CsvReportRenderer.render(run_result) -> str`` : produit un CSV
+  prêt à écrire sur disque.
+Format : une ligne par (document × pipeline × view × metric).
+``OMITTED`` est explicite — pas de score factice 0.
+"""
 from __future__ import annotations
+from picarones.reports_v2.csv.render import CsvReportRenderer
+__all__ = ["CsvReportRenderer"]

picarones/reports_v2/csv/render.py ADDED Viewed

	@@ -0,0 +1,137 @@

+"""``CsvReportRenderer`` — Sprint A14-S42.
+Rendu CSV d'un ``RunResult`` : une ligne par paire
+(document × pipeline × view × metric) avec sa valeur numérique ou
+le marqueur ``OMITTED`` (pas de score factice).
+Cohérent avec la convention du rewrite : pour les pipelines qui ne
+produisent pas un type d'artefact accepté par une vue, on émet
+``OMITTED`` dans la cellule ``value`` plutôt que ``0`` ou ``""``.
+Le consommateur (Pandas, Excel, awk, ...) sait que l'omission est
+l'information.
+Usage
+-----
+::
+    from picarones.reports_v2.csv import CsvReportRenderer
+    csv_text = CsvReportRenderer().render(run_result)
+    Path("rapport.csv").write_text(csv_text, encoding="utf-8")
+Format
+------
+Colonnes (dans l'ordre) :
+::
+    run_id, document_id, pipeline_name, view_name,
+    metric_name, value, status
+- ``run_id`` : ``RunManifest.run_id``.
+- ``status`` : ``"ok"``, ``"failed_metric"`` (la métrique a levé),
+  ``"omitted"`` (le pipeline ne produit pas d'artefact pour la vue).
+- ``value`` : valeur numérique formatée à 6 décimales, ou vide si
+  ``status != "ok"``.
+Anti-sur-ingénierie
+-------------------
+- Pas de pivot par moteur — chaque ligne est self-contained.  Le
+  consommateur pivote en 2 lignes Pandas si besoin.
+- Pas d'escape custom — on utilise ``csv.writer`` qui gère les
+  virgules et guillemets dans les values.
+- Pas de séparateur configurable (``,`` fixe) — un test garde-fou
+  vérifie le déterminisme du contenu.
+"""
+from __future__ import annotations
+import csv
+import io
+from typing import Any
+from picarones.app.results import RunResult
+class CsvReportRenderer:
+    """Rendu CSV stateless d'un RunResult."""
+    HEADER: tuple[str, ...] = (
+        "run_id",
+        "document_id",
+        "pipeline_name",
+        "view_name",
+        "metric_name",
+        "value",
+        "status",
+    )
+    def render(self, result: RunResult) -> str:
+        """Retourne le contenu CSV (stringly typed) prêt à écrire."""
+        buf = io.StringIO()
+        writer = csv.writer(buf)
+        writer.writerow(self.HEADER)
+        run_id = result.manifest.run_id
+        for doc_result in result.document_results:
+            for view_result in doc_result.view_results:
+                # Métriques calculées avec succès.
+                for metric_name, value in view_result.metric_values.items():
+                    pipeline_name = self._infer_pipeline_name(
+                        view_result, doc_result,
+                    )
+                    writer.writerow([
+                        run_id,
+                        doc_result.document_id,
+                        pipeline_name,
+                        view_result.view_name,
+                        metric_name,
+                        self._format_value(value),
+                        "ok",
+                    ])
+                # Métriques en échec.
+                for metric_name, _err in view_result.failed_metrics.items():
+                    pipeline_name = self._infer_pipeline_name(
+                        view_result, doc_result,
+                    )
+                    writer.writerow([
+                        run_id,
+                        doc_result.document_id,
+                        pipeline_name,
+                        view_result.view_name,
+                        metric_name,
+                        "",
+                        "failed_metric",
+                    ])
+        return buf.getvalue()
+    @staticmethod
+    def _format_value(value: Any) -> str:
+        """Formate la valeur numérique à 6 décimales pour
+        déterminisme cross-OS (évite ``1.0000000000000002`` sur
+        certains floats)."""
+        if isinstance(value, bool):
+            return "1" if value else "0"
+        if isinstance(value, (int, float)):
+            return f"{float(value):.6f}"
+        return str(value)
+    @staticmethod
+    def _infer_pipeline_name(view_result, doc_result) -> str:
+        """Inféré depuis le ``candidate_artifact_id`` qui suit la
+        convention ``<doc>:<pipeline>:<artifact_type>``.
+        Fallback ``"<unknown>"`` si l'id n'est pas parseable.
+        """
+        cand_id = view_result.candidate_artifact_id
+        # Convention : <document_id>:<pipeline_name>:<artifact_type>.
+        # Le pipeline_name est entre les deux ":".
+        parts = cand_id.split(":")
+        if len(parts) >= 3:
+            return parts[1]
+        return "<unknown>"
+__all__ = ["CsvReportRenderer"]

picarones/reports_v2/json/__init__.py CHANGED Viewed

@@ -1,5 +1,14 @@
-"""Export JSON canonique — Sprint S22."""
 from __future__ import annotations
-__all__: list[str] = []

+"""Rendu JSON canonique des résultats de benchmark — Sprint A14-S43.
+API publique :
+- ``JsonReportRenderer.render(run_result) -> str`` : document JSON
+  consolidé, sérialisation déterministe (clés triées, indent=2,
+  Unicode préservé).
+"""
 from __future__ import annotations
+from picarones.reports_v2.json.render import JsonReportRenderer
+__all__ = ["JsonReportRenderer"]

picarones/reports_v2/json/render.py ADDED Viewed

	@@ -0,0 +1,95 @@

+"""``JsonReportRenderer`` — Sprint A14-S43.
+Rendu JSON canonique d'un ``RunResult`` : représentation hiérarchique
+sérialisable, déterministe (clés triées, indent=2, ensure_ascii=False),
+prête à être archivée ou consommée par un client tiers.
+Différent des trois fichiers persistés par ``BenchmarkService.persist``
+(``run_manifest.json`` + 3 JSONL) qui sont **streamables** : ce
+renderer produit un **document unique** consolidé.
+Usage
+-----
+::
+    from picarones.reports_v2.json import JsonReportRenderer
+    json_text = JsonReportRenderer().render(run_result)
+    Path("rapport.json").write_text(json_text, encoding="utf-8")
+Structure
+---------
+::
+    {
+      "run_manifest": { ... },
+      "documents": [
+        {
+          "document_id": "d1",
+          "pipeline_results": [ {...} ],
+          "view_results": [ {...} ]
+        },
+        ...
+      ]
+    }
+Anti-sur-ingénierie
+-------------------
+- Pas de schéma JSON publié — pydantic ``model_dump_json`` est
+  l'autorité.  La stabilité sera tagguée à la livraison BnF.
+- Pas de séparateurs custom — JSON standard.
+- Pas de pretty mode configurable — toujours indent=2 pour la
+  lisibilité humaine ; un caller qui veut compact appelle
+  ``json.dumps(json.loads(out))``.
+"""
+from __future__ import annotations
+import json
+from picarones.app.results import RunResult
+class JsonReportRenderer:
+    """Rendu JSON consolidé d'un RunResult."""
+    def render(self, result: RunResult) -> str:
+        """Retourne un document JSON canonique du run.
+        Sérialisation déterministe : ``sort_keys=True``, ``indent=2``,
+        ``ensure_ascii=False``.  Le caller peut écrire directement le
+        retour via ``Path.write_text(..., encoding="utf-8")``.
+        """
+        document = self._build_document(result)
+        return json.dumps(
+            document,
+            sort_keys=True,
+            indent=2,
+            ensure_ascii=False,
+        )
+    def _build_document(self, result: RunResult) -> dict:
+        """Construit le dict canonique avant sérialisation."""
+        return {
+            "run_manifest": json.loads(
+                result.manifest.model_dump_json(),
+            ),
+            "documents": [
+                {
+                    "document_id": dr.document_id,
+                    "pipeline_results": [
+                        json.loads(pr.model_dump_json())
+                        for pr in dr.pipeline_results
+                    ],
+                    "view_results": [
+                        json.loads(vr.model_dump_json())
+                        for vr in dr.view_results
+                    ],
+                }
+                for dr in result.document_results
+            ],
+        }
+__all__ = ["JsonReportRenderer"]

tests/reports_v2/__init__.py ADDED Viewed

File without changes

tests/reports_v2/test_sprint_a14_s42_csv_renderer.py ADDED Viewed

	@@ -0,0 +1,129 @@

+"""Sprint A14-S42 — ``CsvReportRenderer``."""
+from __future__ import annotations
+import csv
+import io
+from picarones.app.results import RunDocumentResult, RunResult
+from picarones.domain import RunManifest, utcnow
+from picarones.evaluation.views.base import ViewResult
+from picarones.reports_v2.csv import CsvReportRenderer
+def _make_minimal_result(
+    metric_values: dict | None = None,
+    failed_metrics: dict | None = None,
+    candidate_artifact_id: str = "doc01:tess:raw_text",
+) -> RunResult:
+    started = utcnow()
+    completed = utcnow()
+    manifest = RunManifest(
+        run_id="run_001",
+        corpus_name="demo",
+        n_documents=1,
+        pipeline_names=("tess",),
+        view_specs=(),
+        code_version="1.0.0-s42",
+        started_at=started,
+        completed_at=completed,
+    )
+    view_result = ViewResult(
+        view_name="text_final",
+        candidate_artifact_id=candidate_artifact_id,
+        ground_truth_artifact_id="doc01:gt",
+        metric_values=metric_values or {},
+        failed_metrics=failed_metrics or {},
+    )
+    return RunResult(
+        manifest=manifest,
+        document_results=(
+            RunDocumentResult(
+                document_id="doc01",
+                pipeline_results=(),
+                view_results=(view_result,),
+            ),
+        ),
+    )
+# ──────────────────────────────────────────────────────────────────────
+# Renderer
+# ──────────────────────────────────────────────────────────────────────
+class TestCsvRendererHeader:
+    def test_header_columns_in_order(self) -> None:
+        result = _make_minimal_result()
+        text = CsvReportRenderer().render(result)
+        # Première ligne = header.
+        first_line = text.splitlines()[0]
+        cols = first_line.split(",")
+        expected = list(CsvReportRenderer.HEADER)
+        assert cols == expected
+class TestCsvRendererSuccessfulMetrics:
+    def test_successful_metric_emits_value_and_status_ok(self) -> None:
+        result = _make_minimal_result(
+            metric_values={"cer": 0.12, "wer": 0.25},
+        )
+        text = CsvReportRenderer().render(result)
+        rows = list(csv.DictReader(io.StringIO(text)))
+        assert len(rows) == 2
+        cer_row = next(r for r in rows if r["metric_name"] == "cer")
+        assert cer_row["status"] == "ok"
+        assert cer_row["value"] == "0.120000"
+        assert cer_row["pipeline_name"] == "tess"
+    def test_value_formatted_to_6_decimals(self) -> None:
+        result = _make_minimal_result(
+            metric_values={"cer": 1.0 / 3.0},
+        )
+        text = CsvReportRenderer().render(result)
+        rows = list(csv.DictReader(io.StringIO(text)))
+        assert rows[0]["value"] == "0.333333"
+class TestCsvRendererFailedMetrics:
+    def test_failed_metric_emits_empty_value_and_status(self) -> None:
+        result = _make_minimal_result(
+            failed_metrics={"broken": "ValueError: x"},
+        )
+        text = CsvReportRenderer().render(result)
+        rows = list(csv.DictReader(io.StringIO(text)))
+        assert len(rows) == 1
+        assert rows[0]["metric_name"] == "broken"
+        assert rows[0]["status"] == "failed_metric"
+        assert rows[0]["value"] == ""
+class TestCsvRendererPipelineNameInference:
+    def test_pipeline_name_inferred_from_artifact_id(self) -> None:
+        result = _make_minimal_result(
+            metric_values={"cer": 0.0},
+            candidate_artifact_id="doc01:my_pipe:raw_text",
+        )
+        text = CsvReportRenderer().render(result)
+        rows = list(csv.DictReader(io.StringIO(text)))
+        assert rows[0]["pipeline_name"] == "my_pipe"
+    def test_unknown_pipeline_name_when_id_unparseable(self) -> None:
+        result = _make_minimal_result(
+            metric_values={"cer": 0.0},
+            candidate_artifact_id="bad_id_no_separators",
+        )
+        text = CsvReportRenderer().render(result)
+        rows = list(csv.DictReader(io.StringIO(text)))
+        assert rows[0]["pipeline_name"] == "<unknown>"
+class TestCsvRendererDeterminism:
+    def test_render_twice_yields_same_bytes(self) -> None:
+        result = _make_minimal_result(
+            metric_values={"cer": 0.1, "wer": 0.2, "mer": 0.15},
+        )
+        renderer = CsvReportRenderer()
+        a = renderer.render(result)
+        b = renderer.render(result)
+        assert a == b

tests/reports_v2/test_sprint_a14_s43_json_renderer.py ADDED Viewed

	@@ -0,0 +1,130 @@

+"""Sprint A14-S43 — ``JsonReportRenderer``."""
+from __future__ import annotations
+import json
+from picarones.app.results import RunDocumentResult, RunResult
+from picarones.domain import RunManifest, utcnow
+from picarones.evaluation.views.base import ViewResult
+from picarones.reports_v2.json import JsonReportRenderer
+def _make_result(view_results: tuple[ViewResult, ...] = ()) -> RunResult:
+    started = utcnow()
+    completed = utcnow()
+    manifest = RunManifest(
+        run_id="run_001",
+        corpus_name="demo",
+        n_documents=1,
+        pipeline_names=("tess",),
+        view_specs=(),
+        code_version="1.0.0-s43",
+        started_at=started,
+        completed_at=completed,
+    )
+    return RunResult(
+        manifest=manifest,
+        document_results=(
+            RunDocumentResult(
+                document_id="doc01",
+                pipeline_results=(),
+                view_results=view_results,
+            ),
+        ),
+    )
+# ──────────────────────────────────────────────────────────────────────
+# Renderer
+# ──────────────────────────────────────────────────────────────────────
+class TestJsonRendererStructure:
+    def test_includes_manifest_and_documents(self) -> None:
+        result = _make_result()
+        text = JsonReportRenderer().render(result)
+        data = json.loads(text)
+        assert "run_manifest" in data
+        assert "documents" in data
+        assert isinstance(data["documents"], list)
+        assert len(data["documents"]) == 1
+    def test_manifest_has_run_id(self) -> None:
+        result = _make_result()
+        text = JsonReportRenderer().render(result)
+        data = json.loads(text)
+        assert data["run_manifest"]["run_id"] == "run_001"
+        assert data["run_manifest"]["corpus_name"] == "demo"
+    def test_document_has_pipeline_and_view_results(self) -> None:
+        view_result = ViewResult(
+            view_name="text_final",
+            candidate_artifact_id="doc01:tess:raw_text",
+            ground_truth_artifact_id="doc01:gt",
+            metric_values={"cer": 0.05},
+        )
+        result = _make_result(view_results=(view_result,))
+        text = JsonReportRenderer().render(result)
+        data = json.loads(text)
+        doc = data["documents"][0]
+        assert doc["document_id"] == "doc01"
+        assert doc["pipeline_results"] == []
+        assert len(doc["view_results"]) == 1
+        assert doc["view_results"][0]["metric_values"] == {"cer": 0.05}
+class TestJsonRendererDeterminism:
+    def test_render_twice_yields_identical_bytes(self) -> None:
+        result = _make_result()
+        renderer = JsonReportRenderer()
+        a = renderer.render(result)
+        b = renderer.render(result)
+        assert a == b
+    def test_keys_sorted(self) -> None:
+        result = _make_result()
+        text = JsonReportRenderer().render(result)
+        # Les clés top-level doivent apparaître triées : "documents"
+        # avant "run_manifest" alphabétiquement.
+        assert text.find('"documents"') < text.find('"run_manifest"')
+    def test_unicode_preserved(self) -> None:
+        view_result = ViewResult(
+            view_name="text_final",
+            candidate_artifact_id="doc01:tess:raw_text",
+            ground_truth_artifact_id="doc01:gt",
+            warnings=("français médiéval",),
+        )
+        result = _make_result(view_results=(view_result,))
+        text = JsonReportRenderer().render(result)
+        # Pas d'\u escapes (ensure_ascii=False).
+        assert "français médiéval" in text
+class TestJsonRendererIndentation:
+    def test_uses_indent_2(self) -> None:
+        result = _make_result()
+        text = JsonReportRenderer().render(result)
+        # indent=2 → des paires de spaces en début de ligne.
+        assert "\n  \"" in text or "\n  \"" in text
+class TestJsonRendererEmptyResult:
+    def test_empty_documents_yields_empty_list(self) -> None:
+        started = utcnow()
+        manifest = RunManifest(
+            run_id="run_empty",
+            corpus_name="empty",
+            n_documents=0,
+            pipeline_names=(),
+            view_specs=(),
+            code_version="1.0.0-s43",
+            started_at=started,
+            completed_at=started,
+        )
+        result = RunResult(manifest=manifest, document_results=())
+        text = JsonReportRenderer().render(result)
+        data = json.loads(text)
+        assert data["documents"] == []
+        assert data["run_manifest"]["run_id"] == "run_empty"