DeepSeek-OCR-Chinese-LoRA

这是一个基于 DeepSeek OCR 模型进行 LoRA 微调的版本，专门增强了对 中文内容 的识别能力。

Model Details

Model Description

本模型是 DeepSeek-OCR 的 LoRA 微调版本。原始的 DeepSeek-OCR 模型在多语言 OCR 任务上表现出色，为了进一步提升其在中文场景下的识别精度，我们使用了专门的中文文本识别数据集进行了微调。

Model type: Image-to-Text (OCR)
Language(s) (NLP): Chinese (中文)
License: Apache-2.0
Finetuned from model: deepseek-ai/DeepSeek-OCR

Model Sources

Dataset Repository: priyank-m/chinese_text_recognition
Original Data Source: Benchmarking Chinese Text Recognition (Github)

Uses

Direct Use

该模型主要用于中文场景下的图片文字识别（OCR），特别适合：

中文文档数字化
自然场景下的中文文字提取
包含中文的复杂排版识别

Training Details

Training Data

本次训练使用的数据集为 **priyank-m/chinese_text_recognition**。

这是一个专门针对中文内容识别训练的数据集。

数据来源：原始数据来源于复旦大学视觉智能实验室 (FudanVI) 的项目：https://github.com/FudanVI/benchmarking-chinese-text-recognition。
数据特点：该数据集涵盖了多种场景（Scene Text）、文档（Document Text）以及手写体（Handwritten Text）等多种类型的中文图像数据，旨在提升模型对不同形态中文字符的鲁棒性和识别准确率。

Training Procedure

Training Hyperparameters

Training regime: LoRA (Low-Rank Adaptation) Fine-tuning

Citation

If you use the training data from FudanVI, please cite their work:

@article{chen2021benchmarking,
  title={Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study},
  author={Chen, Jingye and Yu, Haiyang and Ma, Jianqi and Guan, Mengnan and Xu, Xuxi and Wang, Xiaocong and Qu, Shaoguang and Li, Bin and Xue, Xiangyang},
  journal={arXiv preprint arXiv:2112.15099},
  year={2021}
}

Downloads last month: 45

Safetensors

Model size

3B params

Tensor type

I64

BF16

Model tree for suyu-io/DeepSeek-OCR-Chinese-3B-Merged

Base model

deepseek-ai/DeepSeek-OCR

Adapter

(27)

this model

Dataset used to train suyu-io/DeepSeek-OCR-Chinese-3B-Merged

Paper for suyu-io/DeepSeek-OCR-Chinese-3B-Merged

KIND: an Italian Multi-Domain Dataset for Named Entity Recognition

Paper • 2112.15099 • Published Dec 30, 2021