Upload README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,65 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# [DocParser](https://github.com/yuemengrui/DocParser.git)
|
| 2 |
+
|
| 3 |
+
文档解析器,集成各种文档解析的服务,统一使用FastAPI服务,一秒部署使用,就是快
|
| 4 |
+
|
| 5 |
+
##### Layout_Analysis: 版面分析服务
|
| 6 |
+
|
| 7 |
+
##### Table_Parser: 表格解析服务
|
| 8 |
+
|
| 9 |
+
##### Formula_Server: 公式检测识别服务
|
| 10 |
+
|
| 11 |
+
## 快速部署
|
| 12 |
+
|
| 13 |
+
1. 拉取源代码:
|
| 14 |
+
```commandline
|
| 15 |
+
git clone https://github.com/yuemengrui/DocParser.git
|
| 16 |
+
```
|
| 17 |
+
2. docker启动服务:
|
| 18 |
+
```commandline
|
| 19 |
+
sudo docker compose -f docker-compose.yml up -d
|
| 20 |
+
```
|
| 21 |
+
3. 查看容器状态,正常的话所有容器应该是healthy状态
|
| 22 |
+
```commandline
|
| 23 |
+
sudo docker compose -f docker-compose.yml ps -a
|
| 24 |
+
```
|
| 25 |
+
4. 访问各服务接口文档:
|
| 26 |
+
```text
|
| 27 |
+
版面分析接口文档:/ai/docparser/layout/redoc
|
| 28 |
+
表格解析接口文档:/ai/docparser/table/redoc
|
| 29 |
+
公式识别接口文档:/ai/docparser/formula/redoc
|
| 30 |
+
```
|
| 31 |
+
5. docker compose 说明
|
| 32 |
+
```yaml
|
| 33 |
+
volumes:
|
| 34 |
+
- ./Layout_Analysis:/workspace/Layout_Analysis # 挂载服务源码
|
| 35 |
+
- ./Layout_Analysis/configs/model_layout_yolo.json:/workspace/model_config.json # 挂载配置文件
|
| 36 |
+
- ./Models/Layout/doclayout_yolo.pt:/workspace/models/doclayout_yolo.pt # 挂载与配置文件对应的模型
|
| 37 |
+
```
|
| 38 |
+
可通过不同的配置文件启动多个模型worker服务。假设我有三个版面分析模型,每个模型适用的场景数据不一样,可分别写好配置文件,挂载不同的配置文件来启动不同的版面分析模型来应对不同的场景,其他模型同理。
|
| 39 |
+
|
| 40 |
+
## 显存占用 (Batch_Size=1)
|
| 41 |
+
|
| 42 |
+
| 版面分析 | 表格解析 | 公式(检测+识别 |
|
| 43 |
+
|------|------|----------|
|
| 44 |
+
| 1G | 5G | 2.5G |
|
| 45 |
+
|
| 46 |
+
## 模型下载
|
| 47 |
+
|
| 48 |
+
访问[模型仓库](https://huggingface.co/yuemengrui/Docparser)下载后将Models目录置于项目目录下
|
| 49 |
+
|
| 50 |
+
## 效果展示
|
| 51 |
+
|
| 52 |
+
##### 版面分析
|
| 53 |
+
|
| 54 |
+

|
| 55 |
+

|
| 56 |
+
|
| 57 |
+
##### 表格解析
|
| 58 |
+
|
| 59 |
+

|
| 60 |
+
|
| 61 |
+
##### 公式检测与识别
|
| 62 |
+
|
| 63 |
+

|
| 64 |
+

|
| 65 |
+
|