Upload 3 files

99a13cb verified 4 months ago

5.23 kB

	import datetime
	import json
	import tempfile
	from pathlib import Path

	import imageio
	import numpy as np
	import torch
	from huggingface_hub import HfApi
	from huggingface_hub.repocard import metadata_eval_result, metadata_save


	def evaluate_agent(env, max_steps, n_eval_episodes, policy):
	"""
	Evaluate the agent for ``n_eval_episodes`` episodes and returns average reward and std of reward.
	"""
	episode_scores = []
	for episode in range(n_eval_episodes):
	obs, info = env.reset()
	episode_score = 0.0
	for step in range(max_steps):
	action, _ = policy.act(obs)
	obs, reward, done, trunc, info = env.step(action)
	episode_score += reward
	if done or trunc:
	break

	episode_scores.append(episode_score)

	mean_reward = np.mean(episode_scores)
	std_reward = np.std(episode_scores)
	return mean_reward, std_reward


	def record_video(env, policy, out_directory, fps=30):
	"""
	Generate a replay video of the agent
	"""
	images = []

	obs, info = env.reset()
	img = env.render(mode="rgb_array")
	images.append(img)

	terminated = False
	while not terminated:
	action, _ = policy.act(obs)
	obs, reward, done, trunc, info = env.step(action)

	img = env.render(mode="rgb_array")
	images.append(img)

	if done or trunc:
	terminated = True

	imageio.mimsave(
	out_directory, [np.array(img) for i, img in enumerate(images)], fps=fps
	)


	def push_to_hub(repo_id, env_id, model, hyperparameters, eval_env, video_fps=30):
	"""
	Evaluate, Generate a video and Upload a model to Hugging Face Hub.
	This method does the complete pipeline:
	- It evaluates the model
	- It generates the model card
	- It generates a replay video of the agent
	- It pushes everything to the Hub
	"""
	_, repo_name = repo_id.split("/")
	api = HfApi()

	# Step 1: Create the repo
	repo_url = api.create_repo(
	repo_id=repo_id,
	exist_ok=True,
	)

	with tempfile.TemporaryDirectory() as tmpdirname:
	local_directory = Path(tmpdirname)

	# Step 2: Save the model
	torch.save(model, local_directory / "model.pt")

	# Step 3: Save the hyperparameters to JSON
	with open(local_directory / "hyperparameters.json", "w") as outfile:
	json.dump(hyperparameters, outfile)

	# Step 4: Evaluate the model and build JSON
	mean_reward, std_reward = evaluate_agent(
	eval_env,
	hyperparameters["max_t"],
	hyperparameters["n_evaluation_episodes"],
	model,
	)
	# Get datetime
	eval_datetime = datetime.datetime.now()
	eval_form_datetime = eval_datetime.isoformat()

	evaluate_data = {
	"env_id": hyperparameters["env_id"],
	"mean_reward": mean_reward,
	"n_evaluation_episodes": hyperparameters["n_evaluation_episodes"],
	"eval_datetime": eval_form_datetime,
	}

	# Write a JSON file
	with open(local_directory / "results.json", "w") as outfile:
	json.dump(evaluate_data, outfile)

	# Step 5: Create the model card
	env_name = hyperparameters["env_id"]

	metadata = {}
	metadata["tags"] = [
	env_name,
	"reinforce",
	"reinforcement-learning",
	"custom-implementation",
	"deep-rl-class",
	]

	# Add metrics
	eval = metadata_eval_result(
	model_pretty_name=repo_name,
	task_pretty_name="reinforcement-learning",
	task_id="reinforcement-learning",
	metrics_pretty_name="mean_reward",
	metrics_id="mean_reward",
	metrics_value=f"{mean_reward:.2f} +/- {std_reward:.2f}",
	dataset_pretty_name=env_name,
	dataset_id=env_name,
	)

	# Merges both dictionaries
	metadata = {metadata, eval}

	model_card = f"""
	# Reinforce Agent playing {env_id}
	This is a trained model of a Reinforce agent playing {env_id} .
	To learn to use this model and train yours check Unit 4 of the Deep Reinforcement Learning Course: https://huggingface.co/deep-rl-course/unit4/introduction
	"""

	readme_path = local_directory / "README.md"
	readme = ""
	if readme_path.exists():
	with readme_path.open("r", encoding="utf8") as f:
	readme = f.read()
	else:
	readme = model_card

	with readme_path.open("w", encoding="utf-8") as f:
	f.write(readme)

	# Save our metrics to Readme metadata
	metadata_save(readme_path, metadata)

	# Step 6: Record a video
	video_path = local_directory / "replay.mp4"
	record_video(eval_env, model, video_path, video_fps)

	# Step 7. Push everything to the Hub
	api.upload_folder(
	repo_id=repo_id,
	folder_path=local_directory,
	path_in_repo=".",
	)

	print(
	f"Your model is pushed to the Hub. You can view your model here: {repo_url}"
	)