metadata
title: MinerU
emoji: 📄
colorFrom: blue
colorTo: purple
sdk: docker
pinned: false
license: mit
📄 MinerU - PDF to Markdown/JSON Converter
MinerU 是一个将 PDF 等复杂文档转换为 LLM-ready Markdown/JSON 格式的工具。
功能特性
- 🔄 PDF → Markdown/JSON 转换
- 📊 表格自动识别并转换为 HTML
- 🔢 公式自动识别并转换为 LaTeX
- 🌐 支持 109 种语言 OCR
- 📐 支持复杂布局(单栏/多栏)
使用方式
Web UI
直接在页面上传 PDF 文件进行解析。
API 调用
from gradio_client import Client
client = Client("https://ASEM12345-mineru.hf.space")
result = client.predict(
file="path/to/document.pdf",
api_name="/predict"
)
print(result)