lucasschott
/

Enduro-v5-PPO

Reinforcement Learning

stable-baselines3

Eval Results (legacy)

Model card Files Files and versions

lucasschott commited on Mar 31, 2025

Commit

43cdcd3

·

1 Parent(s): f2c934b

add safetensors

Files changed (3) hide show

eval.py +5 -4
model.safetensors +3 -0
requirements.txt +2 -1

eval.py CHANGED Viewed

@@ -6,6 +6,7 @@ from stable_baselines3.common.evaluation import evaluate_policy
 from stable_baselines3.common.atari_wrappers import AtariWrapper
 from stable_baselines3.common.env_util import make_vec_env
 from stable_baselines3.common.vec_env import VecFrameStack
 if __name__ == "__main__":
@@ -18,10 +19,10 @@ if __name__ == "__main__":
     agent = PPO.load("model.zip")
-    print(agent.policy)
-    total_params = sum(p.numel() for p in agent.policy.parameters())
-    print("\nTotal number of parameters: {:,}".format(total_params))
     mean_reward, std_reward = evaluate_policy(agent, env, n_eval_episodes=n_eval_episodes, deterministic=deterministic)
     print(f"reward : {mean_reward} +/- {std_reward}")

 from stable_baselines3.common.atari_wrappers import AtariWrapper
 from stable_baselines3.common.env_util import make_vec_env
 from stable_baselines3.common.vec_env import VecFrameStack
+from safetensors.torch import save_model
 if __name__ == "__main__":
     agent = PPO.load("model.zip")
+    # Save the state dict as a safetensors file
+    policy_state_dict = agent.policy.state_dict()
+    save_model(agent.policy, "model.safetensors")
     mean_reward, std_reward = evaluate_policy(agent, env, n_eval_episodes=n_eval_episodes, deterministic=deterministic)
     print(f"reward : {mean_reward} +/- {std_reward}")

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32f14418431437b7d5f5a4e2ae80b4454939ccaab5cf811387a30409082e8baa
+size 8978048

requirements.txt CHANGED Viewed

@@ -3,4 +3,5 @@ ale_py==0.10.1
 gymnasium[atari]
 torch==2.4.0
 stable_baselines3==2.4.1
-opencv-python==25.0.1

 gymnasium[atari]
 torch==2.4.0
 stable_baselines3==2.4.1
+opencv-python==25.0.1
+safetensors==0.5.3