Spaces:

JSCPPProgrammer
/

gensearcher-firered

Paused

Initial: GenSearcher workflow + FireRed /generate adapter + Gradio

80b7188 verified 2 months ago

958 Bytes

	import hydra

	from rllm.agents.code_agent import CompetitionCodingAgent
	from rllm.data.dataset import DatasetRegistry
	from rllm.environments.base.single_turn_env import SingleTurnEnvironment
	from rllm.rewards.reward_fn import code_reward_fn
	from rllm.trainer.agent_trainer import AgentTrainer


	@hydra.main(config_path="pkg://rllm.trainer.config", config_name="agent_ppo_trainer", version_base=None)
	def main(config):
	train_dataset = DatasetRegistry.load_dataset("deepcoder", "train")
	test_dataset = DatasetRegistry.load_dataset("deepcoder", "test")

	env_args = {"reward_fn": code_reward_fn}

	trainer = AgentTrainer(
	agent_class=CompetitionCodingAgent,
	agent_args={},
	env_args=env_args,
	env_class=SingleTurnEnvironment,
	config=config,
	train_dataset=train_dataset,
	val_dataset=test_dataset,
	)
	trainer.train()


	if __name__ == "__main__":
	main()