快速开始:上传到 Hugging Face
✅ 整理完成
文件夹已整理完成,可以上传到 Hugging Face。
文件夹大小: 1.3MB(适合上传)
📋 整理内容
已完成的清理
- ✅ 更新了
.gitignore文件 - ✅ 创建了清理脚本
cleanup_for_hf.py - ✅ 检查了大文件(无大文件)
- ✅ 创建了上传指南
新增文件
compute_cascade_metrics.py- 级联指标计算脚本COMPUTE_METRICS_README.md- 指标计算说明HF_UPLOAD_GUIDE.md- 上传指南ADDITIONS_README.md- 新增功能说明cleanup_for_hf.py- 清理脚本requirements_compute_metrics.txt- 额外依赖
🚀 三步上传
步骤1: 安装 Hugging Face CLI
pip install huggingface_hub
步骤2: 登录
huggingface-cli login
# 输入你的 token(在 https://huggingface.co/settings/tokens 获取)
步骤3: 创建仓库并上传
# 1. 在网页上创建仓库
# 访问 https://huggingface.co/new
# 选择 "Dataset",命名为例如:easytpp-cascade-metrics
# 2. 上传文件
cd /Users/chenshuyi/Downloads/EasyTemporalPointProcess-main
huggingface-cli upload <your-username>/easytpp-cascade-metrics . --repo-type dataset
📥 在云电脑上下载
# 方法1: 使用 CLI
huggingface-cli download <your-username>/easytpp-cascade-metrics --local-dir ./EasyTPP
# 方法2: 使用 Git
git clone https://huggingface.co/datasets/<your-username>/easytpp-cascade-metrics
cd easytpp-cascade-metrics
⚠️ 重要:数据文件需要单独获取
代码仓库不包含数据文件(已通过 .gitignore 排除,因为文件太大)。
数据文件需要单独传输:
# 在云电脑上创建目录
mkdir -p data/cascades
# 方法1: 使用 scp 从本地传输(推荐)
scp user@local-machine:/path/to/information_cascade*.json ./data/cascades/
# 方法2: 如果已上传到 Hugging Face Dataset Hub
huggingface-cli download <username>/cascade-data --local-dir ./data/cascades
详细说明请参考 DATA_FILES_NOTICE.md
📚 相关文档
- 详细上传指南:
HF_UPLOAD_GUIDE.md - 数据文件说明:
DATA_FILES_NOTICE.md⚠️ 重要 - 指标计算说明:
COMPUTE_METRICS_README.md - 新增功能:
ADDITIONS_README.md - 上传检查清单:
UPLOAD_CHECKLIST.md
⚠️ 注意事项
- 文件大小: 当前文件夹 1.3MB,无需 Git LFS
- 敏感信息: 已检查,无敏感信息
- 依赖: 确保
requirements.txt和requirements_compute_metrics.txt已包含
🎯 下一步
- 按照上述步骤上传到 Hugging Face
- 在云电脑上下载并测试
- 运行
compute_cascade_metrics.py计算指标
准备好了!可以开始上传了! 🎉