zhou777
/

agent-l

Model card Files Files and versions

Metrics Training metrics Community

agent-l / docs /deployment /linux_codex_handoff.md

zhou777's picture

Add files using upload-large-folder tool

0525670 verified 13 days ago

|

History Blame Contribute Delete

3.41 kB

Linux Codex Handoff

这份说明面向把仓库迁移到 Linux 服务器后，继续使用 Codex 无缝接手。

1. 这个交接包的目标

这个交接包优先保留以下内容：

仓库使命与长期目标
当前稳定的数据契约
架构文档与路线图
Linux 首次实验清单
关键可执行代码
最小测试

也就是说，这个包优先保证：

Codex 在 Linux 上进入仓库后能快速读懂上下文
你可以先跑通当前最稳定的受控实验链路
不把巨大的历史数据和运行产物一股脑塞进迁移包

截至 2026-03-23 的交接补充

Linux 上已经不只是“可开训”，而是实验 A 已完整训练结束并拿到首轮有效检测指标。
当前训练统一环境仍是 lsy-agent。
当前验证链路已经接通真实模型输出，且默认支持 vllm 推理。
迁移或接手时需要额外注意一件事：历史 vLLM 进程如果未清理，会长期占用 4 张卡，影响后续正式训练启动。
当前最值得保留的运行产物不是所有 runs/，而是实验 A 的训练日志、merged checkpoint 路径说明，以及验证结果摘要。

2. 建议保留在交接包中的内容

AGENTS.md
README.md
requirements.txt
.env.example
base_agent.py
run_pipeline_silver.py
agents/
schemas/
pipelines/
tests/
docs/

其中最重要的文档读取顺序保持不变：

AGENTS.md
README.md
docs/architecture.md
docs/roadmap.md
docs/current_status.md
docs/reference/repo_map.md
docs/deployment/deploy_linux.md
docs/deployment/linux_first_experiment_checklist.md

3. 默认不放进交接包的大体积内容

以下内容通常不建议放进首次 Codex 迁移包：

clearn_base_data/
base_data/
runs/
__pycache__/
各类 .pyc
临时 jsonl、临时 notebook、临时测试文件

原因很简单：

这些内容体积大
很多是可再生成的运行产物
会显著拖慢首次传输和解压
不影响 Codex 先接手代码、文档和实验流程

4. Linux 上首次接手建议

解压后，建议先做以下动作：

阅读 AGENTS.md
阅读 README.md
阅读 docs/deployment/linux_first_experiment_checklist.md
创建虚拟环境并安装依赖
配置 .env
跑 tests.test_reviewer
跑 tests.test_gold_builder

5. 如果之后要补回数据

如果你后续要在 Linux 上继续做实际实验，再单独补这些内容即可：

图片目录
历史 runs/ 结果
cleaned Silver 数据集
Gold 数据集

建议把“代码与文档交接包”和“数据资产包”分开管理。

6. 当前最稳妥的 Linux 实验边界

当前最稳妥的稳定边界仍然是以下数据链路：

Silver 小样本试跑
cleaned Silver
Silver Eval
Gold 构建

训练链路已进入真实开训阶段，但仍需继续收敛训练框架兼容性、日志规范与评估闭环

以下模块目前还不应被视为已经可以无缝投入正式闭环实验：

SemanticEvaluator
Orchestrator

7. 给 Linux 上的 Codex 的一句话上下文

这个仓库当前的核心不是训练框架，而是稳定的结构化数据分层。任何继续开发都必须优先保护 Raw -> Silver -> Gold -> Eval 的边界，尤其不要把 Silver 审核逻辑和 Gold 训练格式转换混在一起。