Spaces:

roger1024
/

DocPipe

Sleeping

App Files Files Community

DocPipe / packages /pdfsys-parser-mupdf /src /pdfsys_parser_mupdf /__init__.py

yin

feat(mvp): wire router → mupdf parser → OCR quality scorer closed loop

d423504 about 1 month ago

history blame contribute delete

427 Bytes

	"""pdfsys-parser-mupdf — text-ok extraction backend.

	Consumes PDFs classified as text-ok by pdfsys-router. Uses PyMuPDF for
	block extraction (``page.get_text("blocks", sort=True)``) and emits
	Markdown. Does NOT depend on pdfsys-layout-analyser.
	"""

	from __future__ import annotations

	from .extract import extract_doc, extract_doc_bytes

	__version__ = "0.0.1"

	__all__ = ["__version__", "extract_doc", "extract_doc_bytes"]