Agent RL数据集和环境
yuchuqing
rain2sun
AI & ML interests
None yet
Recent Activity
liked a dataset 15 days ago
stepfun-ai/Step-3.5-Flash-SFT liked a dataset 20 days ago
SWE-Gym/SWE-Gym updated a collection 20 days ago
Agent RLOrganizations
None yet
Benchmark
评估集
RL-Datasets
Math-Code-Reason
可规则验证数据集,要求带标准答案
Open-LLM
全链路开源模型:至少包括模型(可能包括checkpoint)和数据
Pretrain-Datasets
预训练使用的超大规模开源数据集
Agent RL
Agent RL数据集和环境
mBase LLM
中小模型,作为优化任务后训练起点
Benchmark
评估集
NLP
NLP is more than LLM
RL-Datasets
Distilled
蒸馏数据集
Math-Code-Reason
可规则验证数据集,要求带标准答案
Code-IFT-Datasets
代码指令数据集
Open-LLM
全链路开源模型:至少包括模型(可能包括checkpoint)和数据
High-Quality-Datasets
高质量数据集,包含高密度的知识
Pretrain-Datasets
预训练使用的超大规模开源数据集
IFT-Datasets
用于LLM微调的数据集