Spaces:

ayussssssiiii
/

codecourt

Sleeping

App Files Files Community

codecourt / tests /test_env.py

ayussssssiiii

Initial HF Space snapshot

fcb838d about 1 month ago

raw

history blame contribute delete

3.67 kB

	"""Tests for the CodeCourt environment."""

	import sys
	import os
	sys.path.insert(0, os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

	from env.codecourt_env import CodeCourtEnv
	from agents.setter import SetterAgent
	from agents.solver import SolverAgent


	def test_env_reset():
	env = CodeCourtEnv()
	obs = env.reset()
	assert "episode_id" in obs
	assert "archetype" in obs
	assert "difficulty" in obs
	assert "public_test_cases" in obs
	assert "hidden_test_count" in obs
	assert obs["generation_mode"] == "dynamic"
	print("✓ test_env_reset")


	def test_env_step():
	env = CodeCourtEnv()
	obs = env.reset()

	setter = SetterAgent(use_reference=True)
	solver = SolverAgent(use_reference=True)

	setter_code = setter.generate_solution(env._current_state.problem)
	solver_code = solver.solve(env._current_state.problem)

	setter_info, solver_info, done, info = env.step(setter_code, solver_code)

	assert done == True
	assert "outcome" in info
	assert "setter_valid" in info
	assert "solver_public_pass_rate" in info
	assert "solver_hidden_pass_rate" in info
	assert "dynamic_trap_count" in info
	print("✓ test_env_step")


	def test_dynamic_problem_metadata():
	env = CodeCourtEnv()
	env.reset()
	problem = env._current_state.problem
	assert problem["generation_mode"] == "dynamic"
	assert "trap_explanation" in problem
	assert problem["reference_solution"]
	print("✓ test_dynamic_problem_metadata")


	def test_dynamic_traps_added_for_bruteforce_solver():
	env = CodeCourtEnv()
	env.reset()

	setter = SetterAgent(use_reference=True)
	solver = SolverAgent(use_brute_force=True)

	setter_code = setter.generate_solution(env._current_state.problem)
	solver_code = solver.solve(env._current_state.problem)

	_, _, done, info = env.step(setter_code, solver_code)

	assert done is True
	assert info["dynamic_trap_count"] >= 1
	assert len(env._current_state.problem.get("trap_test_cases", [])) == info["dynamic_trap_count"]
	print("✓ test_dynamic_traps_added_for_bruteforce_solver")


	def test_difficulty_progression():
	env = CodeCourtEnv(difficulty_progression=True)
	setter = SetterAgent(use_reference=True)
	solver = SolverAgent(use_reference=True)

	# With reference solutions for both, solver will always pass
	# This tests that the difficulty progression logic runs
	for _ in range(10):
	obs = env.reset()
	setter_code = setter.generate_solution(env._current_state.problem)
	solver_code = solver.solve(env._current_state.problem)
	env.step(setter_code, solver_code)

	# Just verify the environment ran without errors
	assert env._episode_count == 10
	print("✓ test_difficulty_progression")


	def test_elo_tracker():
	env = CodeCourtEnv()
	setter = SetterAgent(use_reference=True)
	solver = SolverAgent(use_reference=True)

	for _ in range(10):
	obs = env.reset()
	setter_code = setter.generate_solution(env._current_state.problem)
	solver_code = solver.solve(env._current_state.problem)
	env.step(setter_code, solver_code)

	stats = env.elo.get_stats()
	assert "setter_elo" in stats
	assert "solver_elo" in stats
	assert stats["episodes"] == 10
	print("✓ test_elo_tracker")


	if __name__ == "__main__":
	print("Running Environment tests...")
	test_env_reset()
	test_env_step()
	test_dynamic_problem_metadata()
	test_dynamic_traps_added_for_bruteforce_solver()
	test_difficulty_progression()
	test_elo_tracker()
	print("\n✅ All environment tests passed!")