A newer version of the Gradio SDK is available: 6.13.0
metadata
title: 学术产出报告自动处理系统
emoji: 📊
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 6.1.0
app_file: app.py
pinned: false
license: mit
📊 学术产出报告自动处理系统
自动处理学术产出报告的 Web 应用,支持批量处理报告数据并生成完整的学术产出报告文档。
✨ 功能特性
- ✅ 自动更新报告编号:根据输入自动更新文档中的报告编号
- ✅ 填充 ESI 学科表现表:从 CSV 文件读取数据并自动填充表格
- ✅ 生成历年产出图表:自动生成条形折线组合图并插入文档
- ✅ 填充 CNCI 数据:自动匹配并填充论文的 CNCI 值
- ✅ 填充引用概况:从 savedrecs.xlsx 读取统计数据并填充表格
- ✅ 删除冗余内容:自动删除 ESI 高被引论文收录概况段落
📋 使用说明
1. 准备文件
将所有需要的文件打包成 zip 文件,包括:
必需文件:
SUSTECH*.docx- 报告模板文件(必需)
可选文件(根据需求提供):
Incites 研究领域.csv- ESI 学科数据Incites 研究领域t.csv- 历年产出数据SUSTECH*.xlsx- 记录文件(包含标题和收录号)Web of Science Documents.csv- WOS 数据(用于 CNCI 匹配)savedrecs.xlsx- SCIE 统计数据
2. 上传并处理
- 点击上传按钮,选择准备好的 zip 文件
- (可选)输入报告编号,格式为
C2026-0003 - 点击"开始处理"按钮
- 等待处理完成
- 下载生成的 docx 文件
3. 报告编号格式
报告编号应为以下格式:
C年份-编号,例如:C2026-0003- 如果不填写,系统会尝试从文件名自动提取
🔧 技术栈
- Gradio - Web 界面框架
- python-docx - Word 文档处理
- pandas - 数据处理
- matplotlib - 图表生成
- openpyxl - Excel 文件读取
📝 处理流程
- 复制 SUSTECH 开头的 docx 为输出文件
- 删除"ESI 高被引论文收录概况"段落及表格
- 更新报告编号
- 读取"Incites 研究领域.csv",转置后填入 ESI 学科表
- 读取历年产出 CSV 生成图表并插入
- 读取记录 XLSX 与 WOS CSV,填充论文检索统计表的 CNCI 列
- 读取 savedrecs.xlsx,填充 SCIE 收录引用概况表
⚠️ 注意事项
- 确保 zip 文件中包含所有必需的文件
- 文件命名应遵循规范(如 SUSTECH 开头)
- 处理时间取决于文件大小,请耐心等待
- 如果处理失败,请查看日志信息并检查文件格式
📄 许可证
MIT License