# 核心数据处理 datasets # 用于加载和管理 GAIA 数据集 pandas # 用于数据分析和导出 Excel openpyxl # pandas 导出 Excel 文件的必备依赖 # 网络请求与 API 调用 requests # 用于同步 HTTP 请求 httpx # 用于异步/流式 (SSE) HTTP 请求,适配 Dify huggingface_hub # 用于从 Hugging Face 下载数据集和管理 Token # 附件内容提取(GAIA 必备) pypdf2 # 用于读取 PDF 文本 openpyxl # (已在上面) 用于读取 .xlsx 表格 python-docx # 用于读取 .docx 文档(部分题目涉及) pillow # 用于处理和查看 .png/.jpg 图片