Update README.md
Browse files
README.md
CHANGED
|
@@ -10,20 +10,30 @@ metrics:
|
|
| 10 |
base_model:
|
| 11 |
- Qwen/Qwen2.5-VL-7B-Instruct
|
| 12 |
---
|
| 13 |
-
SongPanda(论文投稿“数字人文”期刊中)
|
|
|
|
|
|
|
| 14 |
|
| 15 |
**模型概述**
|
|
|
|
| 16 |
SongPanda 是针对古籍数字化场景优化的视觉语言模型,基于 Qwen2.5-VL-7B 通过 LoRA 微调构建,专注于复杂版式古籍的结构化信息提取,解决传统 OCR 难以区分正文、夹注、版心等字段的痛点。
|
| 17 |
|
| 18 |
**核心功能**
|
| 19 |
智能字段区分:自动识别并排除古籍版心无关信息
|
|
|
|
| 20 |
夹注精准标注:以标签区分双行小字夹注与正文大字
|
|
|
|
| 21 |
复杂版面适配:支持宋至清代及域外刻本等多类型古籍图像
|
| 22 |
|
|
|
|
| 23 |
**性能亮点**
|
|
|
|
| 24 |
📊 SOTA 表现:在 SongPanda-Bench 测试集上综合准确度达 0.80,超越 Gemini-2.5-pro 等模型
|
|
|
|
| 25 |
💰 低成本优势:单页推理成本仅 0.003 元(3090 服务器),为闭源模型的 1/50
|
|
|
|
| 26 |
⚡ 高效推理:平均 8 秒 / 页,支持批量处理古籍图像
|
|
|
|
| 27 |
🛡️ 强鲁棒性:适配含噪音、摩尔纹等受损古籍图像
|
| 28 |
|
| 29 |
**快速使用**
|
|
@@ -49,7 +59,10 @@ SongPanda-Bench:356 张测试图像,源自 105 本宋元明清及域外刻
|
|
| 49 |
训练数据:2 万余张古籍图像
|
| 50 |
|
| 51 |
**作者团队**
|
|
|
|
| 52 |
郑陈锐 ¹,段伟 ²,范怿泽 ¹
|
| 53 |
¹ 中山大学中文系 ² 上海师范大学人文学院
|
|
|
|
| 54 |
**说明**
|
|
|
|
| 55 |
本模型相关的训练细节、技术原理及完整实验结果详见投稿中论文,敬请期待。
|
|
|
|
| 10 |
base_model:
|
| 11 |
- Qwen/Qwen2.5-VL-7B-Instruct
|
| 12 |
---
|
| 13 |
+
**SongPanda**(论文投稿“数字人文”期刊中)
|
| 14 |
+
|
| 15 |
+

|
| 16 |
|
| 17 |
**模型概述**
|
| 18 |
+
|
| 19 |
SongPanda 是针对古籍数字化场景优化的视觉语言模型,基于 Qwen2.5-VL-7B 通过 LoRA 微调构建,专注于复杂版式古籍的结构化信息提取,解决传统 OCR 难以区分正文、夹注、版心等字段的痛点。
|
| 20 |
|
| 21 |
**核心功能**
|
| 22 |
智能字段区分:自动识别并排除古籍版心无关信息
|
| 23 |
+
|
| 24 |
夹注精准标注:以标签区分双行小字夹注与正文大字
|
| 25 |
+
|
| 26 |
复杂版面适配:支持宋至清代及域外刻本等多类型古籍图像
|
| 27 |
|
| 28 |
+
|
| 29 |
**性能亮点**
|
| 30 |
+
|
| 31 |
📊 SOTA 表现:在 SongPanda-Bench 测试集上综合准确度达 0.80,超越 Gemini-2.5-pro 等模型
|
| 32 |
+
|
| 33 |
💰 低成本优势:单页推理成本仅 0.003 元(3090 服务器),为闭源模型的 1/50
|
| 34 |
+
|
| 35 |
⚡ 高效推理:平均 8 秒 / 页,支持批量处理古籍图像
|
| 36 |
+
|
| 37 |
🛡️ 强鲁棒性:适配含噪音、摩尔纹等受损古籍图像
|
| 38 |
|
| 39 |
**快速使用**
|
|
|
|
| 59 |
训练数据:2 万余张古籍图像
|
| 60 |
|
| 61 |
**作者团队**
|
| 62 |
+
|
| 63 |
郑陈锐 ¹,段伟 ²,范怿泽 ¹
|
| 64 |
¹ 中山大学中文系 ² 上海师范大学人文学院
|
| 65 |
+
|
| 66 |
**说明**
|
| 67 |
+
|
| 68 |
本模型相关的训练细节、技术原理及完整实验结果详见投稿中论文,敬请期待。
|