yuemengrui commited on
Commit
ec413a6
·
verified ·
1 Parent(s): 31f2c9a

Upload README.md

Browse files
Files changed (1) hide show
  1. README.md +65 -0
README.md ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # [DocParser](https://github.com/yuemengrui/DocParser.git)
2
+
3
+ 文档解析器,集成各种文档解析的服务,统一使用FastAPI服务,一秒部署使用,就是快
4
+
5
+ ##### Layout_Analysis: 版面分析服务
6
+
7
+ ##### Table_Parser: 表格解析服务
8
+
9
+ ##### Formula_Server: 公式检测识别服务
10
+
11
+ ## 快速部署
12
+
13
+ 1. 拉取源代码:
14
+ ```commandline
15
+ git clone https://github.com/yuemengrui/DocParser.git
16
+ ```
17
+ 2. docker启动服务:
18
+ ```commandline
19
+ sudo docker compose -f docker-compose.yml up -d
20
+ ```
21
+ 3. 查看容器状态,正常的话所有容器应该是healthy状态
22
+ ```commandline
23
+ sudo docker compose -f docker-compose.yml ps -a
24
+ ```
25
+ 4. 访问各服务接口文档:
26
+ ```text
27
+ 版面分析接口文档:/ai/docparser/layout/redoc
28
+ 表格解析接口文档:/ai/docparser/table/redoc
29
+ 公式识别接口文档:/ai/docparser/formula/redoc
30
+ ```
31
+ 5. docker compose 说明
32
+ ```yaml
33
+ volumes:
34
+ - ./Layout_Analysis:/workspace/Layout_Analysis # 挂载服务源码
35
+ - ./Layout_Analysis/configs/model_layout_yolo.json:/workspace/model_config.json # 挂载配置文件
36
+ - ./Models/Layout/doclayout_yolo.pt:/workspace/models/doclayout_yolo.pt # 挂载与配置文件对应的模型
37
+ ```
38
+ 可通过不同的配置文件启动多个模型worker服务。假设我有三个版面分析模型,每个模型适用的场景数据不一样,可分别写好配置文件,挂载不同的配置文件来启动不同的版面分析模型来应对不同的场景,其他模型同理。
39
+
40
+ ## 显存占用 (Batch_Size=1)
41
+
42
+ | 版面分析 | 表格解析 | 公式(检测+识别 |
43
+ |------|------|----------|
44
+ | 1G | 5G | 2.5G |
45
+
46
+ ## 模型下载
47
+
48
+ 访问[模型仓库](https://huggingface.co/yuemengrui/Docparser)下载后将Models目录置于项目目录下
49
+
50
+ ## 效果展示
51
+
52
+ ##### 版面分析
53
+
54
+ ![](/assets/layout_1.jpg)
55
+ ![](/assets/layout_2.jpg)
56
+
57
+ ##### 表格解析
58
+
59
+ ![](/assets/table_parser.png)
60
+
61
+ ##### 公式检测与识别
62
+
63
+ ![](/assets/formula_det_1.jpg)
64
+ ![](/assets/formula_rec.jpg)
65
+