snym04 commited on
Commit
74e7689
·
verified ·
1 Parent(s): 4b152a0

Update requirements.txt

Browse files
Files changed (1) hide show
  1. requirements.txt +13 -13
requirements.txt CHANGED
@@ -1,17 +1,15 @@
1
- # --- 1. 修正 MinerU 版本 (根据报错列表更新) ---
2
- # 选择报错信息中提供的最新稳定版本
3
  mineru==2.7.6
4
- # 配合 2.x 版本的 mineru,magic-pdf 建议使用 1.0 以上或最新版
 
 
5
  magic-pdf>=1.0.0
6
- # 手动锁定 paddlepaddle (CPU版) 以支持 OCR,确保版本与 2026 环境兼容
7
  paddlepaddle==3.0.0b2
8
 
9
- # --- 2. 命令行与 CLI 基础 (继续锁定防止回溯) ---
10
  shellingham==1.5.4
11
  typer==0.12.5
12
  click==8.1.7
13
-
14
- # --- 3. 核心数学与基础工具 ---
15
  mpmath==1.3.0
16
  sympy==1.13.3
17
  pyparsing==3.1.2
@@ -19,23 +17,25 @@ sse-starlette==2.1.3
19
  uvicorn>=0.14.0
20
  websockets>=10.4
21
 
22
- # --- 4. 网页处理与解析 ---
23
  soupsieve==2.6
24
- beautifulsoup4==4.12.3
25
 
26
- # --- 5. 之前封堵的黑洞 (绝不松手) ---
27
  flatbuffers==24.3.25
28
  authlib==1.3.2
29
  tifffile==2024.12.12
30
  scikit-image==0.25.0
31
 
32
- # --- 6. PyTorch 环境 (CPU 优先) ---
33
  --extra-index-url https://download.pytorch.org/whl/cpu
34
  torch
35
  torchvision
36
  av==12.3.0
37
 
38
- # --- 7. 其他功能依赖 ---
 
 
39
  onnxruntime>=1.18.0
40
  magika>=0.5.1
41
  pillow
@@ -46,7 +46,7 @@ colorlog>=6.9.0
46
  fast-langdetect>=0.2.3
47
  ffmpy>=0.5.0
48
 
49
- # --- 8. 谷歌相关 ---
50
  google-api-python-client==2.150.0
51
  google-auth-httplib2==0.2.0
52
  httplib2==0.22.0
 
1
+ # --- 1. 核心 MinerU 体系 (根据报错修正版本) ---
 
2
  mineru==2.7.6
3
+ # 满足 MinerU BS4 的硬性要求
4
+ beautifulsoup4==4.13.5
5
+ # 之前版本过低,现在改为兼容版本
6
  magic-pdf>=1.0.0
 
7
  paddlepaddle==3.0.0b2
8
 
9
+ # --- 2. 之前已理顺的基础工具 (继续保持) ---
10
  shellingham==1.5.4
11
  typer==0.12.5
12
  click==8.1.7
 
 
13
  mpmath==1.3.0
14
  sympy==1.13.3
15
  pyparsing==3.1.2
 
17
  uvicorn>=0.14.0
18
  websockets>=10.4
19
 
20
+ # --- 3. 网页与解析 (修正冲突) ---
21
  soupsieve==2.6
22
+ # 注意:这里已更新为 4.13.5
23
 
24
+ # --- 4. 之前封堵的黑洞 (防止回溯重现) ---
25
  flatbuffers==24.3.25
26
  authlib==1.3.2
27
  tifffile==2024.12.12
28
  scikit-image==0.25.0
29
 
30
+ # --- 5. PyTorch 环境 (CPU 优先) ---
31
  --extra-index-url https://download.pytorch.org/whl/cpu
32
  torch
33
  torchvision
34
  av==12.3.0
35
 
36
+ # --- 6. 其他功能依赖 ---
37
+ # 让 opencv 自动选择最适合 HF 环境的 headless 版本
38
+ opencv-python-headless
39
  onnxruntime>=1.18.0
40
  magika>=0.5.1
41
  pillow
 
46
  fast-langdetect>=0.2.3
47
  ffmpy>=0.5.0
48
 
49
+ # --- 7. 谷歌相关 ---
50
  google-api-python-client==2.150.0
51
  google-auth-httplib2==0.2.0
52
  httplib2==0.22.0