VLM + OCR
-
Image-Text-to-Text • 0.9B • Updated • 690 • 81 -
erax-ai/EraX-VL-7B-V1.0
Image-Text-to-Text • 8B • Updated • 47 • 44 -
granite-docling-258M demo
📝277Convert and query documents from images with AI
-
datalab-to/chandra
Image-Text-to-Text • 9B • Updated • 152k • 527 -
deepseek-ai/DeepSeek-OCR
Image-Text-to-Text • 3B • Updated • 2.28M • 3.29k -
Multimodal OCR3
🌖69Chandra-OCR / Nanonets-OCR2 / olmOCR-2 / Dots.OCR
-
lightonai/LightOnOCR-2-1B
Image-Text-to-Text • 1B • Updated • 195k • 706 -
HuggingFaceFW/finepdfs
Viewer • Updated • 476M • 79.2k • 882
baidu/Qianfan-OCR
Image-Text-to-Text • 5B • Updated • 262k • 1.19kNote 4B direct image-to-Markdown conversion and supports a broad range of prompt-driven tasks — from structured document parsing and table extraction to chart understanding, document question answering, and key information extraction
tinixai/ocr_annual_financials
Viewer • Updated • 18.2k • 2.49k • 23Note báo cáo tài chính 10 năm vào dataset tinixai/ocr_annual_financials trên Hugging Face. Hiện tại dataset bao gồm: • 18.231 báo cáo tài chính • 1.491 mã chứng khoán • Dữ liệu từ 2015–2025 • ~26 triệu rows Parquet • ~194GB PDF + OCR text • OCR accuracy ~95% với số liệu và bảng biểu Đây có thể xem là một trong những bộ dữ liệu nguồn mở lớn nhất Việt Nam về: ✔ Financial AI ✔ OCR tiếng Việt ✔ Document AI ✔ Financial RAG ✔ Vietnamese LLM Dataset chứa: • Báo cáo tài chính hợp nhất • Báo cáo công ty mẹ •