mineru / README.md
ASEM12345's picture
Upload folder using huggingface_hub
00f9855 verified
metadata
title: MinerU
emoji: 📄
colorFrom: blue
colorTo: purple
sdk: docker
pinned: false
license: mit

📄 MinerU - PDF to Markdown/JSON Converter

MinerU 是一个将 PDF 等复杂文档转换为 LLM-ready Markdown/JSON 格式的工具。

功能特性

  • 🔄 PDF → Markdown/JSON 转换
  • 📊 表格自动识别并转换为 HTML
  • 🔢 公式自动识别并转换为 LaTeX
  • 🌐 支持 109 种语言 OCR
  • 📐 支持复杂布局(单栏/多栏)

使用方式

Web UI

直接在页面上传 PDF 文件进行解析。

API 调用

from gradio_client import Client

client = Client("https://ASEM12345-mineru.hf.space")
result = client.predict(
    file="path/to/document.pdf",
    api_name="/predict"
)
print(result)

原项目

opendatalab/MinerU