EasyTemporalPointProcess-main / ADDITIONS_README.md
Abigail99216's picture
Upload folder using huggingface_hub
f43af3c verified

EasyTPP 新增功能说明

本仓库在原始 EasyTPP 基础上新增了用于处理信息级联数据的指标计算功能。

🆕 新增文件

核心功能

  • compute_cascade_metrics.py: 计算级联指标的主脚本
    • 情感得分 (Sentiment Score)
    • 情感偏差 (Sentiment Deviation)
    • 语境偏差 (Contextual Deviation)
    • 困惑度 (Perplexity)

文档和工具

  • COMPUTE_METRICS_README.md: 详细使用说明
  • HF_UPLOAD_GUIDE.md: Hugging Face 上传指南
  • UPLOAD_CHECKLIST.md: 上传检查清单(自动生成)
  • cleanup_for_hf.py: 清理脚本,准备上传
  • example_compute_metrics.sh: 使用示例脚本
  • requirements_compute_metrics.txt: 额外依赖包

🚀 快速开始

1. 安装依赖

pip install -r requirements.txt
pip install -r requirements_compute_metrics.txt

2. 运行指标计算

python compute_cascade_metrics.py \
    --input_cascade information_cascade.json \
    --output output_with_metrics.json \
    --batch_size 32

详细说明请参考 COMPUTE_METRICS_README.md

📦 上传到 Hugging Face

  1. 运行清理脚本:
python cleanup_for_hf.py
  1. 按照 HF_UPLOAD_GUIDE.md 的说明上传

🔗 相关文档

📝 使用场景

这些新增功能主要用于:

  • 分析社交媒体信息级联(如微博转发、评论)
  • 计算文本的情感特征和语义偏差
  • 为 TPP 模型提供额外的特征输入

⚙️ 与 EasyTPP 集成

计算出的指标可以用于:

  • RobertTPPDataset: 加载包含语义和偏差特征的数据
  • RobertEventTokenizer: 处理自定义特征
  • TorchRobotTHP: 使用语义和偏差特征的 TPP 模型

参考 examples/train_robot_thp_with_features.py 了解完整示例。