File size: 3,411 Bytes
0525670
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
# Linux Codex Handoff

这份说明面向把仓库迁移到 Linux 服务器后,继续使用 Codex 无缝接手。

## 1. 这个交接包的目标

这个交接包优先保留以下内容:

- 仓库使命与长期目标
- 当前稳定的数据契约
- 架构文档与路线图
- Linux 首次实验清单
- 关键可执行代码
- 最小测试

也就是说,这个包优先保证:

1. Codex 在 Linux 上进入仓库后能快速读懂上下文
2. 你可以先跑通当前最稳定的受控实验链路
3. 不把巨大的历史数据和运行产物一股脑塞进迁移包

## 截至 2026-03-23 的交接补充

- Linux 上已经不只是“可开训”,而是实验 A 已完整训练结束并拿到首轮有效检测指标。
- 当前训练统一环境仍是 `lsy-agent`- 当前验证链路已经接通真实模型输出,且默认支持 `vllm` 推理。
- 迁移或接手时需要额外注意一件事:历史 vLLM 进程如果未清理,会长期占用 4 张卡,影响后续正式训练启动。
- 当前最值得保留的运行产物不是所有 `runs/`,而是实验 A 的训练日志、merged checkpoint 路径说明,以及验证结果摘要。

## 2. 建议保留在交接包中的内容

- `AGENTS.md`
- `README.md`
- `requirements.txt`
- `.env.example`
- `base_agent.py`
- `run_pipeline_silver.py`
- `agents/`
- `schemas/`
- `pipelines/`
- `tests/`
- `docs/`

其中最重要的文档读取顺序保持不变:

1. `AGENTS.md`
2. `README.md`
3. `docs/architecture.md`
4. `docs/roadmap.md`
5. `docs/current_status.md`
6. `docs/reference/repo_map.md`
7. `docs/deployment/deploy_linux.md`
8. `docs/deployment/linux_first_experiment_checklist.md`

## 3. 默认不放进交接包的大体积内容

以下内容通常不建议放进首次 Codex 迁移包:

- `clearn_base_data/`
- `base_data/`
- `runs/`
- `__pycache__/`
- 各类 `.pyc`
- 临时 jsonl、临时 notebook、临时测试文件

原因很简单:

- 这些内容体积大
- 很多是可再生成的运行产物
- 会显著拖慢首次传输和解压
- 不影响 Codex 先接手代码、文档和实验流程

## 4. Linux 上首次接手建议

解压后,建议先做以下动作:

1. 阅读 `AGENTS.md`
2. 阅读 `README.md`
3. 阅读 `docs/deployment/linux_first_experiment_checklist.md`
4. 创建虚拟环境并安装依赖
5. 配置 `.env`
6.`tests.test_reviewer`
7.`tests.test_gold_builder`

## 5. 如果之后要补回数据

如果你后续要在 Linux 上继续做实际实验,再单独补这些内容即可:

- 图片目录
- 历史 `runs/` 结果
- cleaned Silver 数据集
- Gold 数据集

建议把“代码与文档交接包”和“数据资产包”分开管理。

## 6. 当前最稳妥的 Linux 实验边界

当前最稳妥的稳定边界仍然是以下数据链路:

1. Silver 小样本试跑
2. cleaned Silver
3. Silver Eval
4. Gold 构建

训练链路已进入真实开训阶段,但仍需继续收敛训练框架兼容性、日志规范与评估闭环

以下模块目前还不应被视为已经可以无缝投入正式闭环实验:

- `SemanticEvaluator`
- `Orchestrator`

## 7. 给 Linux 上的 Codex 的一句话上下文

这个仓库当前的核心不是训练框架,而是稳定的结构化数据分层。任何继续开发都必须优先保护 `Raw -> Silver -> Gold -> Eval` 的边界,尤其不要把 Silver 审核逻辑和 Gold 训练格式转换混在一起。