| 我觉得这个 proposal 已经明显超过“大作业应付水平”了,已经很接近一个正式的 workshop / course project proposal 了。整体上: | |
| * 结构完整 | |
| * 技术路线合理 | |
| * 风险控制清晰 | |
| * baseline 和 ablation 都考虑到了 | |
| * 对 recommendation + heterogeneous graph 的理解是在线的 | |
| 尤其你们没有只写“我们用 GNN 做推荐”,而是真的把: | |
| * hetero graph | |
| * cold start | |
| * negative sampling | |
| * threshold tuning | |
| * feature initialization | |
| * baseline comparison | |
| 这些关键问题都考虑进去了,这点很好。 | |
| 但如果站在: | |
| # “老师 / reviewer / TA” | |
| 的视角,我会给你几个建议,能明显再提升一个档次。 | |
| --- | |
| # 一、最大的优点:你们的“问题定义”是清楚的 | |
| 很多 proposal 最大的问题是: | |
| > “我要用 GNN 做推荐” | |
| 但根本没说清: | |
| * 图怎么建 | |
| * 节点是什么 | |
| * 边是什么 | |
| * label 是什么 | |
| * prediction target 是什么 | |
| 而你们这里: | |
| ```text | |
| author-paper link prediction | |
| ``` | |
| 定义得非常清晰。 | |
| 这一段尤其好: | |
| > 该任务可以建模为异构图上的链接预测问题 | |
| 这说明你们不是把它当普通分类。 | |
| 这是 reviewer 很喜欢的。 | |
| --- | |
| # 二、你们对“冷启动”的讨论是加分项 | |
| 这里: | |
| > 利用合作者关系和论文引用网络补充信息 | |
| 是非常合理的。 | |
| 因为: | |
| 这正是: | |
| # GNN 在推荐中的核心价值 | |
| 不是: | |
| “我用了更高级模型” | |
| 而是: | |
| # 图结构能传播稀疏节点的信息 | |
| 你们 actually 抓住了这个点。 | |
| --- | |
| # 三、Research Plan 写得不错,但还可以更“科研化” | |
| 目前的问题是: | |
| 有一点: | |
| # “工程流水账” | |
| 比如: | |
| ```text | |
| 第一阶段 | |
| 第二阶段 | |
| 第三阶段 | |
| ``` | |
| 虽然清晰,但略像开发计划。 | |
| 你们可以适当加入: | |
| # “研究问题(Research Questions)” | |
| 例如: | |
| --- | |
| ## RQ1 | |
| 不同边类型对推荐性能的贡献如何? | |
| 例如: | |
| * 去掉 author-author | |
| * 去掉 paper-paper | |
| 看 F1 变化。 | |
| --- | |
| ## RQ2 | |
| 作者初始化方式是否影响冷启动作者性能? | |
| 比较: | |
| * trainable embedding | |
| * average cited paper embedding | |
| * collaborator-enhanced embedding | |
| --- | |
| ## RQ3 | |
| hard negative sampling 是否比 random negative 更有效? | |
| --- | |
| 这样会: | |
| # 非常像正式 paper | |
| 而不是课程报告。 | |
| --- | |
| # 四、目前最弱的一部分:baseline 还不够强 | |
| 你们现在写: | |
| > popularity baseline | |
| 这个太弱了。 | |
| 建议至少加: | |
| --- | |
| # 1. Matrix Factorization | |
| 比如: | |
| * BPR | |
| * implicit MF | |
| 因为: | |
| 推荐系统里 reviewer 默认会问: | |
| > “为什么不用传统 CF?” | |
| --- | |
| # 2. Node2Vec / DeepWalk | |
| 因为: | |
| 这是: | |
| # 非 GNN graph embedding baseline | |
| 非常合理。 | |
| --- | |
| # 3. Common Neighbor / Adamic-Adar | |
| 尤其是: | |
| author-paper 二部图里。 | |
| 传统 link prediction baseline 很适合写进去。 | |
| --- | |
| 这样你们会形成: | |
| # 三层 baseline | |
| --- | |
| ## Level 1 | |
| Heuristic: | |
| * popularity | |
| * common neighbor | |
| --- | |
| ## Level 2 | |
| Traditional: | |
| * MF | |
| * Node2Vec | |
| --- | |
| ## Level 3 | |
| GNN: | |
| * LightGCN | |
| * HeteroGNN | |
| 这样整个实验会非常完整。 | |
| --- | |
| # 五、负采样部分写得很好 | |
| 这是很多组根本不会考虑的。 | |
| 尤其: | |
| > hard negative | |
| 这点很好。 | |
| 因为 recommendation 的关键不是: | |
| “随机负样本” | |
| 而是: | |
| # 区分容易混淆的论文 | |
| 例如: | |
| * 同领域 | |
| * 同引用社区 | |
| * 同作者群体 | |
| 这些 negative 更有价值。 | |
| --- | |
| # 六、这里有一个潜在风险:label leakage | |
| 你们现在: | |
| ```text | |
| paper-paper citation | |
| ``` | |
| 需要注意: | |
| # 测试集论文是否出现在训练 citation graph 中 | |
| 否则可能: | |
| 未来信息泄漏。 | |
| 建议在 proposal 里加一句: | |
| --- | |
| > We will carefully avoid potential information leakage between training edges and recommendation targets when constructing the heterogeneous graph. | |
| --- | |
| 会显得很专业。 | |
| --- | |
| # 七、feature.pkl 那里还可以写得更具体 | |
| 现在: | |
| ```text | |
| 论文节点的初始特征来自官方提供的 feature.pkl | |
| ``` | |
| 有点太模糊。 | |
| 建议补一句: | |
| --- | |
| 例如: | |
| ```text | |
| The provided paper features are expected to encode semantic or structural information of papers, which may help the GNN better distinguish topic similarity beyond pure graph topology. | |
| ``` | |
| 否则 reviewer 会觉得: | |
| 你们没想清 feature 是干嘛的。 | |
| --- | |
| # 八、你们目前最合理的主模型其实是: | |
| # LightGCN + Heterogeneous Edges | |
| 原因: | |
| --- | |
| ## 优点 1:推荐系统适配性极强 | |
| LightGCN 本来就是: | |
| # recommendation 专用 GNN | |
| --- | |
| ## 优点 2:不会过拟合 | |
| 异构 Transformer 很容易: | |
| * 参数爆炸 | |
| * 训练不稳 | |
| * 小数据过拟合 | |
| 你们这个数据: | |
| ```text | |
| 6k authors | |
| 80k papers | |
| ``` | |
| 其实不算特别大。 | |
| LightGCN 可能比 HGT 更稳。 | |
| --- | |
| ## 优点 3:老师会更认可 | |
| 因为: | |
| 你们不是: | |
| “盲目堆复杂模型” | |
| 而是: | |
| # 根据任务特点选模型 | |
| 这是加分项。 | |
| --- | |
| # 九、proposal 里缺少“evaluation protocol” | |
| 建议补: | |
| --- | |
| # Validation Split | |
| 例如: | |
| ```text | |
| We will randomly split a portion of training author-paper edges as validation positives and construct corresponding negative pairs for evaluation. | |
| ``` | |
| --- | |
| # Metrics | |
| 除了 F1: | |
| 建议再写: | |
| * Precision | |
| * Recall | |
| * ROC-AUC | |
| 因为: | |
| F1 对 threshold 很敏感。 | |
| --- | |
| # 十、一个很值得加入的点:Meta-path | |
| 你们现在其实已经 implicitly 用到了。 | |
| 但如果明确写: | |
| --- | |
| 例如: | |
| ```text | |
| Author → Author → Paper | |
| Author → Paper → Paper | |
| ``` | |
| 可能能加不少分。 | |
| 因为: | |
| heterogeneous graph recommendation 里: | |
| # meta-path 是经典关键词 | |
| --- | |
| # 十一、如果我是 reviewer,我会给的评价 | |
| 大概会是: | |
| --- | |
| ## 优点 | |
| * 问题定义清晰 | |
| * 技术路线合理 | |
| * baseline 和 ablation 意识较强 | |
| * 对 hetero graph 和 recommendation 有理解 | |
| * 考虑了冷启动与 hard negative | |
| --- | |
| ## 缺点 | |
| * baseline 还可以更完整 | |
| * research question 不够明确 | |
| * feature 使用略模糊 | |
| * evaluation protocol 可以更细 | |
| --- | |
| # 十二、我最建议你们加的一句话 | |
| 这一句会让 proposal 瞬间更像 paper: | |
| > We are particularly interested in understanding how heterogeneous relational structures (co-authorship and citation networks) contribute to recommendation performance under sparse interaction settings. | |
| 因为: | |
| 它把: | |
| * hetero graph | |
| * cold start | |
| * recommendation | |
| 三个核心点串起来了。 | |
| 非常像正式 research proposal。 | |