leonepson
/

semantic_rl

Reinforcement Learning

interpretablity

Model card Files Files and versions

semantic_rl / baselines /deepq /experiments /enjoy_pong.py

leonepson's picture

Upload 254 files

5960497 verified 6 months ago

history blame contribute delete

625 Bytes

	import gym
	from baselines import deepq


	def main():
	env = gym.make("PongNoFrameskip-v4")
	env = deepq.wrap_atari_dqn(env)
	model = deepq.learn(
	env,
	"conv_only",
	convs=[(32, 8, 4), (64, 4, 2), (64, 3, 1)],
	hiddens=[256],
	dueling=True,
	total_timesteps=0
	)

	while True:
	obs, done = env.reset(), False
	episode_rew = 0
	while not done:
	env.render()
	obs, rew, done, _ = env.step(model(obs[None])[0])
	episode_rew += rew
	print("Episode reward", episode_rew)


	if __name__ == '__main__':
	main()