{"gamma": 0.9998988495234561, "lr": 0.008883871011964653, "n_evaluation_episodes": 9, "h_size": 16, "state_space": 4, "action_space": 2, "n_training_episodes": 1000, "max_t": 1000}