DeepSeek-OCR-Chinese-LoRA

这是一个基于 DeepSeek OCR 模型进行 LoRA 微调的版本,专门增强了对 中文内容 的识别能力。

Model Details

Model Description

本模型是 DeepSeek-OCR 的 LoRA 微调版本。原始的 DeepSeek-OCR 模型在多语言 OCR 任务上表现出色,为了进一步提升其在中文场景下的识别精度,我们使用了专门的中文文本识别数据集进行了微调。

  • Model type: Image-to-Text (OCR)
  • Language(s) (NLP): Chinese (中文)
  • License: Apache-2.0
  • Finetuned from model: deepseek-ai/DeepSeek-OCR

Model Sources

Uses

Direct Use

该模型主要用于中文场景下的图片文字识别(OCR),特别适合:

  • 中文文档数字化
  • 自然场景下的中文文字提取
  • 包含中文的复杂排版识别

Training Details

Training Data

本次训练使用的数据集为 **priyank-m/chinese_text_recognition**。

这是一个专门针对中文内容识别训练的数据集。

  • 数据来源:原始数据来源于复旦大学视觉智能实验室 (FudanVI) 的项目:https://github.com/FudanVI/benchmarking-chinese-text-recognition
  • 数据特点:该数据集涵盖了多种场景(Scene Text)、文档(Document Text)以及手写体(Handwritten Text)等多种类型的中文图像数据,旨在提升模型对不同形态中文字符的鲁棒性和识别准确率。

Training Procedure

Training Hyperparameters

  • Training regime: LoRA (Low-Rank Adaptation) Fine-tuning

Citation

If you use the training data from FudanVI, please cite their work:

@article{chen2021benchmarking,
  title={Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study},
  author={Chen, Jingye and Yu, Haiyang and Ma, Jianqi and Guan, Mengnan and Xu, Xuxi and Wang, Xiaocong and Qu, Shaoguang and Li, Bin and Xue, Xiangyang},
  journal={arXiv preprint arXiv:2112.15099},
  year={2021}
}
Downloads last month
45
Safetensors
Model size
3B params
Tensor type
I64
·
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for suyu-io/DeepSeek-OCR-Chinese-3B-Merged

Adapter
(27)
this model

Dataset used to train suyu-io/DeepSeek-OCR-Chinese-3B-Merged

Paper for suyu-io/DeepSeek-OCR-Chinese-3B-Merged