v_kokijiang
fix name bug
035cb7a

A newer version of the Gradio SDK is available: 6.13.0

Upgrade
metadata
title: 学术产出报告自动处理系统
emoji: 📊
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 6.1.0
app_file: app.py
pinned: false
license: mit

📊 学术产出报告自动处理系统

自动处理学术产出报告的 Web 应用,支持批量处理报告数据并生成完整的学术产出报告文档。

✨ 功能特性

  • 自动更新报告编号:根据输入自动更新文档中的报告编号
  • 填充 ESI 学科表现表:从 CSV 文件读取数据并自动填充表格
  • 生成历年产出图表:自动生成条形折线组合图并插入文档
  • 填充 CNCI 数据:自动匹配并填充论文的 CNCI 值
  • 填充引用概况:从 savedrecs.xlsx 读取统计数据并填充表格
  • 删除冗余内容:自动删除 ESI 高被引论文收录概况段落

📋 使用说明

1. 准备文件

将所有需要的文件打包成 zip 文件,包括:

  • 必需文件

    • SUSTECH*.docx - 报告模板文件(必需)
  • 可选文件(根据需求提供):

    • Incites 研究领域.csv - ESI 学科数据
    • Incites 研究领域t.csv - 历年产出数据
    • SUSTECH*.xlsx - 记录文件(包含标题和收录号)
    • Web of Science Documents.csv - WOS 数据(用于 CNCI 匹配)
    • savedrecs.xlsx - SCIE 统计数据

2. 上传并处理

  1. 点击上传按钮,选择准备好的 zip 文件
  2. (可选)输入报告编号,格式为 C2026-0003
  3. 点击"开始处理"按钮
  4. 等待处理完成
  5. 下载生成的 docx 文件

3. 报告编号格式

报告编号应为以下格式:

  • C年份-编号,例如:C2026-0003
  • 如果不填写,系统会尝试从文件名自动提取

🔧 技术栈

  • Gradio - Web 界面框架
  • python-docx - Word 文档处理
  • pandas - 数据处理
  • matplotlib - 图表生成
  • openpyxl - Excel 文件读取

📝 处理流程

  1. 复制 SUSTECH 开头的 docx 为输出文件
  2. 删除"ESI 高被引论文收录概况"段落及表格
  3. 更新报告编号
  4. 读取"Incites 研究领域.csv",转置后填入 ESI 学科表
  5. 读取历年产出 CSV 生成图表并插入
  6. 读取记录 XLSX 与 WOS CSV,填充论文检索统计表的 CNCI 列
  7. 读取 savedrecs.xlsx,填充 SCIE 收录引用概况表

⚠️ 注意事项

  • 确保 zip 文件中包含所有必需的文件
  • 文件命名应遵循规范(如 SUSTECH 开头)
  • 处理时间取决于文件大小,请耐心等待
  • 如果处理失败,请查看日志信息并检查文件格式

📄 许可证

MIT License