Upload model to Hugging Face

Browse files

Files changed (8) hide show

PPO-hardcoded.zip +2 -2
PPO-hardcoded/data +18 -18
PPO-hardcoded/policy.optimizer.pth +1 -1
PPO-hardcoded/policy.pth +1 -1
README.md +1 -1
config.json +1 -1
replay.mp4 +0 -0
results.json +1 -1

PPO-hardcoded.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee11045b25d7bb8aeed5dfad540741ced16f693af97097af93918ccaa3684ee7
-size 142256

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b6a2389644444329cc1b68e2d25f12c7122bf21eb84aaf255e2d788f39f0091
+size 142265

PPO-hardcoded/data CHANGED Viewed

@@ -4,20 +4,20 @@
         ":serialized:": "gAWVOwAAAAAAAACMIXN0YWJsZV9iYXNlbGluZXMzLmNvbW1vbi5wb2xpY2llc5SMEUFjdG9yQ3JpdGljUG9saWN5lJOULg==",
         "__module__": "stable_baselines3.common.policies",
         "__doc__": "\n    Policy class for actor-critic algorithms (has both policy and value prediction).\n    Used by A2C, PPO and the likes.\n\n    :param observation_space: Observation space\n    :param action_space: Action space\n    :param lr_schedule: Learning rate schedule (could be constant)\n    :param net_arch: The specification of the policy and value networks.\n    :param activation_fn: Activation function\n    :param ortho_init: Whether to use or not orthogonal initialization\n    :param use_sde: Whether to use State Dependent Exploration or not\n    :param log_std_init: Initial value for the log standard deviation\n    :param full_std: Whether to use (n_features x n_actions) parameters\n        for the std instead of only (n_features,) when using gSDE\n    :param use_expln: Use ``expln()`` function instead of ``exp()`` to ensure\n        a positive standard deviation (cf paper). It allows to keep variance\n        above zero and prevent it from growing too fast. In practice, ``exp()`` is usually enough.\n    :param squash_output: Whether to squash the output using a tanh function,\n        this allows to ensure boundaries when using gSDE.\n    :param features_extractor_class: Features extractor to use.\n    :param features_extractor_kwargs: Keyword arguments\n        to pass to the features extractor.\n    :param share_features_extractor: If True, the features extractor is shared between the policy and value networks.\n    :param normalize_images: Whether to normalize images or not,\n         dividing by 255.0 (True by default)\n    :param optimizer_class: The optimizer to use,\n        ``th.optim.Adam`` by default\n    :param optimizer_kwargs: Additional keyword arguments,\n        excluding the learning rate, to pass to the optimizer\n    ",
-        "__init__": "<function ActorCriticPolicy.__init__ at 0x7efd63ad8e50>",
-        "_get_constructor_parameters": "<function ActorCriticPolicy._get_constructor_parameters at 0x7efd63ad8ee0>",
-        "reset_noise": "<function ActorCriticPolicy.reset_noise at 0x7efd63ad8f70>",
-        "_build_mlp_extractor": "<function ActorCriticPolicy._build_mlp_extractor at 0x7efd63ad9000>",
-        "_build": "<function ActorCriticPolicy._build at 0x7efd63ad9090>",
-        "forward": "<function ActorCriticPolicy.forward at 0x7efd63ad9120>",
-        "extract_features": "<function ActorCriticPolicy.extract_features at 0x7efd63ad91b0>",
-        "_get_action_dist_from_latent": "<function ActorCriticPolicy._get_action_dist_from_latent at 0x7efd63ad9240>",
-        "_predict": "<function ActorCriticPolicy._predict at 0x7efd63ad92d0>",
-        "evaluate_actions": "<function ActorCriticPolicy.evaluate_actions at 0x7efd63ad9360>",
-        "get_distribution": "<function ActorCriticPolicy.get_distribution at 0x7efd63ad93f0>",
-        "predict_values": "<function ActorCriticPolicy.predict_values at 0x7efd63ad9480>",
         "__abstractmethods__": "frozenset()",
-        "_abc_impl": "<_abc._abc_data object at 0x7efd643ebf80>"
     },
     "verbose": true,
     "policy_kwargs": {},
@@ -48,7 +48,7 @@
     "_num_timesteps_at_start": 0,
     "seed": null,
     "action_noise": null,
-    "start_time": 1681154144902602908,
     "learning_rate": 0.0003,
     "tensorboard_log": null,
     "lr_schedule": {
@@ -57,7 +57,7 @@
     },
     "_last_obs": {
         ":type:": "<class 'numpy.ndarray'>",
-        ":serialized:": "gAWVxQAAAAAAAACMEm51bXB5LmNvcmUubnVtZXJpY5SMC19mcm9tYnVmZmVylJOUKJZQAAAAAAAAAC2FtEGb59e/AADIQgAAyEIAAMhCF4sAQ7dTFL8AAMhCAADIQgAAyEJCrLBC/mqhPgAAyEIAAMhCAADIQgFbqUIEFVK/AADIQgAAyEIAAMhClIwFbnVtcHmUjAVkdHlwZZSTlIwCZjSUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYksESwWGlIwBQ5R0lFKULg=="
     },
     "_last_episode_starts": {
         ":type:": "<class 'numpy.ndarray'>",
@@ -70,7 +70,7 @@
     "_current_progress_remaining": -0.0649599999999999,
     "ep_info_buffer": {
         ":type:": "<class 'collections.deque'>",
-        ":serialized:": "gAWVdBAAAAAAAACMC2NvbGxlY3Rpb25zlIwFZGVxdWWUk5QpS2SGlFKUKH2UKIwBcpSMFW51bXB5LmNvcmUubXVsdGlhcnJheZSMBnNjYWxhcpSTlIwFbnVtcHmUjAVkdHlwZZSTlIwCZjiUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYkMIOj3vxoICMcCUhpRSlIwBbJRN9QGMAXSUR0BQ570nPVurdX2UKGgGaAloD0MISgwCK4ckSMCUhpRSlGgVTfUBaBZHQFDteHSF49p1fZQoaAZoCWgPQwh9XBsqxrkiwJSGlFKUaBVN9QFoFkdAUO2gOBlMAXV9lChoBmgJaA9DCCiZnNoZjiHAlIaUUpRoFU31AWgWR0BSaLBO58SgdX2UKGgGaAloD0MI+KdUibKvLUCUhpRSlGgVTfUBaBZHQFKBdHlOoHd1fZQoaAZoCWgPQwieYP91bjoHwJSGlFKUaBVN9QFoFkdAUoqn1nM+vHV9lChoBmgJaA9DCIC21awz1jbAlIaUUpRoFU31AWgWR0BSis+iaiK0dX2UKGgGaAloD0MIyLJg4o9iKMCUhpRSlGgVTfUBaBZHQFKZ2t+1Bt11fZQoaAZoCWgPQwjQ7SWN0RItwJSGlFKUaBVN9QFoFkdAUqzaQFLWZ3V9lChoBmgJaA9DCPylRX2SUyvAlIaUUpRoFU31AWgWR0BSsdK/VRUFdX2UKGgGaAloD0MIggNauoJBOsCUhpRSlGgVTfUBaBZHQFKx+0w8GLV1fZQoaAZoCWgPQwiwyoXKv4BLwJSGlFKUaBVN9QFoFkdAUsEicG1QZXV9lChoBmgJaA9DCNMuppnudfo/lIaUUpRoFU31AWgWR0BS1vp6hQFcdX2UKGgGaAloD0MI0bGDSlwZQsCUhpRSlGgVTfUBaBZHQFLe1anrIHV1fZQoaAZoCWgPQwjP+SmOA08ywJSGlFKUaBVN9QFoFkdAUt8Xxe9i+nV9lChoBmgJaA9DCFfQtMTKpDLAlIaUUpRoFU31AWgWR0BS8NNi6QNkdX2UKGgGaAloD0MI8KKvIM0aRcCUhpRSlGgVTfUBaBZHQFMKGrCFbml1fZQoaAZoCWgPQwgR4srZO6P7v5SGlFKUaBVN9QFoFkdAUw9Q9A5aNnV9lChoBmgJaA9DCF6B6EmZ6DrAlIaUUpRoFU31AWgWR0BTD3lCCz1LdX2UKGgGaAloD0MIZ3v0hvswLMCUhpRSlGgVTfUBaBZHQFSz22G7Bft1fZQoaAZoCWgPQwgng6Pk9e+PQJSGlFKUaBVNmQFoFkdAVMNR4yGi6HV9lChoBmgJaA9DCIF2hxQD9BzAlIaUUpRoFU31AWgWR0BU0mUSqU/wdX2UKGgGaAloD0MIpfRMLzEcQsCUhpRSlGgVTfUBaBZHQFTSpKzzErJ1fZQoaAZoCWgPQwgCYhIu5GkywJSGlFKUaBVN9QFoFkdAVOQZWJaaC3V9lChoBmgJaA9DCKFoHsAif/Y/lIaUUpRoFU31AWgWR0BU81khA4XGdX2UKGgGaAloD0MI3dH/ci26MsCUhpRSlGgVTfUBaBZHQFUDVFx4ptt1fZQoaAZoCWgPQwid9/9xwqQywJSGlFKUaBVN9QFoFkdAVQN8Aq/dqXV9lChoBmgJaA9DCE4mbhXEWCvAlIaUUpRoFU31AWgWR0BVFd/z8P4EdX2UKGgGaAloD0MIebEwRE7TN8CUhpRSlGgVTfUBaBZHQFUmsYVIqb11fZQoaAZoCWgPQwhCXg8mFQ6QQJSGlFKUaBVLN2gWR0BVLsPJ7sv7dX2UKGgGaAloD0MIaww6IXT8OsCUhpRSlGgVTfUBaBZHQFU2iNsFdLR1fZQoaAZoCWgPQwiwxW6fVcYTwJSGlFKUaBVN9QFoFkdAVTawcHWz4XV9lChoBmgJaA9DCPuWOV0WrzLAlIaUUpRoFU31AWgWR0BVRbBXS0BwdX2UKGgGaAloD0MINKDejJqvIsCUhpRSlGgVTfUBaBZHQFVbJ0W/JvJ1fZQoaAZoCWgPQwjG20qvzYYAwJSGlFKUaBVN9QFoFkdAVWkPXkHUt3V9lChoBmgJaA9DCGL2su20fTLAlIaUUpRoFU31AWgWR0BVaVOKwY+CdX2UKGgGaAloD0MIDHcujPQeO8CUhpRSlGgVTfUBaBZHQFbjLLpzLfV1fZQoaAZoCWgPQwjjcOZX4wGQQJSGlFKUaBVNXQFoFkdAVvdo6CDmKnV9lChoBmgJaA9DCBUDJJpA4RjAlIaUUpRoFU31AWgWR0BW/HTmW+oMdX2UKGgGaAloD0MI4NqJkpDAM0CUhpRSlGgVTfUBaBZHQFcJOW0JF9d1fZQoaAZoCWgPQwg+BFWjV2MCQJSGlFKUaBVN9QFoFkdAVyCCcwxnF3V9lChoBmgJaA9DCPtZLEUSAJBAlIaUUpRoFUvoaBZHQFclUyYXwb51fZQoaAZoCWgPQwhsXWqEfoowwJSGlFKUaBVN9QFoFkdAVzCHGjsUqXV9lChoBmgJaA9DCIOI1LSLuSfAlIaUUpRoFU31AWgWR0BXNieVcD8tdX2UKGgGaAloD0MIRwINNtXsj0CUhpRSlGgVTQMBaBZHQFc6SDyvs7d1fZQoaAZoCWgPQwhDxw4qwQiQQJSGlFKUaBVLUmgWR0BXQxgRbr1NdX2UKGgGaAloD0MIqwg3GVWGK8CUhpRSlGgVTfUBaBZHQFdWALy+YdB1fZQoaAZoCWgPQwhBuW3fo74OwJSGlFKUaBVN9QFoFkdAV2PnZCfHxXV9lChoBmgJaA9DCA4tsp3vlxpAlIaUUpRoFU31AWgWR0BXam4ZuQ6qdX2UKGgGaAloD0MIkl1pGSnDj0CUhpRSlGgVS2poFkdAV3d7x/d69nV9lChoBmgJaA9DCBOCVfXyAyLAlIaUUpRoFU31AWgWR0BXew5FPSDzdX2UKGgGaAloD0MI3q6XpgjgGkCUhpRSlGgVTfUBaBZHQFeT9ZRsMy91fZQoaAZoCWgPQwgIPZtVnyv3v5SGlFKUaBVN9QFoFkdAV51xIatLc3V9lChoBmgJaA9DCNS6DWp/kY9AlIaUUpRoFU2WAWgWR0BXomPLgXMydX2UKGgGaAloD0MI8RKc+uDEj0CUhpRSlGgVS5poFkdAV6mEOAiFCnV9lChoBmgJaA9DCJuPa0Nl049AlIaUUpRoFU0NAWgWR0BXqYNI9TxYdX2UKGgGaAloD0MIEOoihbIIK8CUhpRSlGgVTfUBaBZHQFesEfkmx+t1fZQoaAZoCWgPQwg/xty15L+PQJSGlFKUaBVL/GgWR0BZMZFw1ivxdX2UKGgGaAloD0MIzv3V477nj0CUhpRSlGgVTVwBaBZHQFkx961LJ0Z1fZQoaAZoCWgPQwgDsWzm0PePQJSGlFKUaBVL4mgWR0BZMiK3uuzQdX2UKGgGaAloD0MItqD3xrBaj0CUhpRSlGgVTVIBaBZHQFk4UQTVUdd1fZQoaAZoCWgPQwivQspPStiPQJSGlFKUaBVNFAFoFkdAWU2bF0gbInV9lChoBmgJaA9DCKN5AIv8qhHAlIaUUpRoFU31AWgWR0BZYQRK6FufdX2UKGgGaAloD0MIrP2d7dFzIkCUhpRSlGgVTfUBaBZHQFlhaPjn3cp1fZQoaAZoCWgPQwjsMvynG3gVwJSGlFKUaBVN9QFoFkdAWWktBfKISHV9lChoBmgJaA9DCHLChNGsrABAlIaUUpRoFU31AWgWR0BZeIdZJTVEdX2UKGgGaAloD0MITyFX6rmlj0CUhpRSlGgVTU0BaBZHQFmAs+3Ytg91fZQoaAZoCWgPQwiPxwxUxh8YwJSGlFKUaBVN9QFoFkdAWZTsw+MZP3V9lChoBmgJaA9DCMnnFU89vjXAlIaUUpRoFU31AWgWR0BZn7iMo+fRdX2UKGgGaAloD0MIYg/tY+W7j0CUhpRSlGgVTYkBaBZHQFmxvsZ5zHV1fZQoaAZoCWgPQwhHj9/bNLWPQJSGlFKUaBVNCwFoFkdAWbZn27FsHnV9lChoBmgJaA9DCFDFjVvMJyxAlIaUUpRoFU31AWgWR0BZufKMefZmdX2UKGgGaAloD0MIzSN/MPAcGsCUhpRSlGgVTfUBaBZHQFnRlhgE2YR1fZQoaAZoCWgPQwjhfOpYRUKPQJSGlFKUaBVNmAFoFkdAWdvwAlv603V9lChoBmgJaA9DCJm36jqURo9AlIaUUpRoFU3NAWgWR0BZ4hi5NGmUdX2UKGgGaAloD0MI1a4JaY3BE8CUhpRSlGgVTfUBaBZHQFnieBxxT851fZQoaAZoCWgPQwgSiULL2uyPQJSGlFKUaBVLxWgWR0BZ9YUFjd56dX2UKGgGaAloD0MIEfxvJfv2j0CUhpRSlGgVTVQBaBZHQFn1vXbuc+d1fZQoaAZoCWgPQwjvN9pxg3aPQJSGlFKUaBVNYwFoFkdAW5rSgGr0a3V9lChoBmgJaA9DCPQau0S1l49AlIaUUpRoFU3IAWgWR0BbqqpgkTpQdX2UKGgGaAloD0MIBb8NMT5Ej0CUhpRSlGgVTUsBaBZHQFu+KPGQ0XR1fZQoaAZoCWgPQwiOI9bi8wiPQJSGlFKUaBVN5wFoFkdAW8KQxN7BwnV9lChoBmgJaA9DCBCWsaGbPQ3AlIaUUpRoFU31AWgWR0Bbw3w5NoJzdX2UKGgGaAloD0MIUaT7OeXDj0CUhpRSlGgVS/VoFkdAW9RRvWH1vnV9lChoBmgJaA9DCF8ktOV8rY9AlIaUUpRoFU0MAWgWR0Bb2PHktEofdX2UKGgGaAloD0MIcXFUbqL2BECUhpRSlGgVTfUBaBZHQFvZaGpMpPR1fZQoaAZoCWgPQwg3jliLT+KPQJSGlFKUaBVLP2gWR0Bb3cdDIBBBdX2UKGgGaAloD0MIqfV+o52Pj0CUhpRSlGgVTQABaBZHQFvppdrwe/51fZQoaAZoCWgPQwjWO9wO7cePQJSGlFKUaBVLp2gWR0Bb7EkSmIj4dX2UKGgGaAloD0MIm+RH/IqFE8CUhpRSlGgVTfUBaBZHQFvtcSXdCVt1fZQoaAZoCWgPQwihhm9h3SAowJSGlFKUaBVN9QFoFkdAXAG/j81n/XV9lChoBmgJaA9DCKezk8FxhY9AlIaUUpRoFU1YAWgWR0BcBu1jRUm2dX2UKGgGaAloD0MIl1ZD4t6Oj0CUhpRSlGgVTZYBaBZHQFwJE4Nqgyx1fZQoaAZoCWgPQwjjNEQV3hWPQJSGlFKUaBVNfAFoFkdAXAraJyhi9nV9lChoBmgJaA9DCLcpHhf1no9AlIaUUpRoFUtraBZHQFwPLmZE2Hd1fZQoaAZoCWgPQwiz0Tk/BdCPQJSGlFKUaBVLr2gWR0BcD0JF9a2XdX2UKGgGaAloD0MI7+TTY1sSj0CUhpRSlGgVTXIBaBZHQFwnZUT+NtJ1fZQoaAZoCWgPQwhOK4VALiktwJSGlFKUaBVN9QFoFkdAXDFKCg9Ne3V9lChoBmgJaA9DCOXyH9LPd49AlIaUUpRoFU3eAWgWR0BcNaUqx1PndX2UKGgGaAloD0MIMNXMWgpIHsCUhpRSlGgVTfUBaBZHQFw36qbSZ0F1ZS4="
     },
     "ep_success_buffer": {
         ":type:": "<class 'collections.deque'>",
@@ -78,8 +78,8 @@
     },
     "_n_updates": 130,
     "n_steps": 2048,
-    "gamma": 0.95,
-    "gae_lambda": 0.8,
     "ent_coef": 0.0,
     "vf_coef": 0.5,
     "max_grad_norm": 0.5,

         ":serialized:": "gAWVOwAAAAAAAACMIXN0YWJsZV9iYXNlbGluZXMzLmNvbW1vbi5wb2xpY2llc5SMEUFjdG9yQ3JpdGljUG9saWN5lJOULg==",
         "__module__": "stable_baselines3.common.policies",
         "__doc__": "\n    Policy class for actor-critic algorithms (has both policy and value prediction).\n    Used by A2C, PPO and the likes.\n\n    :param observation_space: Observation space\n    :param action_space: Action space\n    :param lr_schedule: Learning rate schedule (could be constant)\n    :param net_arch: The specification of the policy and value networks.\n    :param activation_fn: Activation function\n    :param ortho_init: Whether to use or not orthogonal initialization\n    :param use_sde: Whether to use State Dependent Exploration or not\n    :param log_std_init: Initial value for the log standard deviation\n    :param full_std: Whether to use (n_features x n_actions) parameters\n        for the std instead of only (n_features,) when using gSDE\n    :param use_expln: Use ``expln()`` function instead of ``exp()`` to ensure\n        a positive standard deviation (cf paper). It allows to keep variance\n        above zero and prevent it from growing too fast. In practice, ``exp()`` is usually enough.\n    :param squash_output: Whether to squash the output using a tanh function,\n        this allows to ensure boundaries when using gSDE.\n    :param features_extractor_class: Features extractor to use.\n    :param features_extractor_kwargs: Keyword arguments\n        to pass to the features extractor.\n    :param share_features_extractor: If True, the features extractor is shared between the policy and value networks.\n    :param normalize_images: Whether to normalize images or not,\n         dividing by 255.0 (True by default)\n    :param optimizer_class: The optimizer to use,\n        ``th.optim.Adam`` by default\n    :param optimizer_kwargs: Additional keyword arguments,\n        excluding the learning rate, to pass to the optimizer\n    ",
+        "__init__": "<function ActorCriticPolicy.__init__ at 0x7f3935be4e50>",
+        "_get_constructor_parameters": "<function ActorCriticPolicy._get_constructor_parameters at 0x7f3935be4ee0>",
+        "reset_noise": "<function ActorCriticPolicy.reset_noise at 0x7f3935be4f70>",
+        "_build_mlp_extractor": "<function ActorCriticPolicy._build_mlp_extractor at 0x7f3935be5000>",
+        "_build": "<function ActorCriticPolicy._build at 0x7f3935be5090>",
+        "forward": "<function ActorCriticPolicy.forward at 0x7f3935be5120>",
+        "extract_features": "<function ActorCriticPolicy.extract_features at 0x7f3935be51b0>",
+        "_get_action_dist_from_latent": "<function ActorCriticPolicy._get_action_dist_from_latent at 0x7f3935be5240>",
+        "_predict": "<function ActorCriticPolicy._predict at 0x7f3935be52d0>",
+        "evaluate_actions": "<function ActorCriticPolicy.evaluate_actions at 0x7f3935be5360>",
+        "get_distribution": "<function ActorCriticPolicy.get_distribution at 0x7f3935be53f0>",
+        "predict_values": "<function ActorCriticPolicy.predict_values at 0x7f3935be5480>",
         "__abstractmethods__": "frozenset()",
+        "_abc_impl": "<_abc._abc_data object at 0x7f3935bec540>"
     },
     "verbose": true,
     "policy_kwargs": {},
     "_num_timesteps_at_start": 0,
     "seed": null,
     "action_noise": null,
+    "start_time": 1681154414443284681,
     "learning_rate": 0.0003,
     "tensorboard_log": null,
     "lr_schedule": {
     },
     "_last_obs": {
         ":type:": "<class 'numpy.ndarray'>",
+        ":serialized:": "gAWVxQAAAAAAAACMEm51bXB5LmNvcmUubnVtZXJpY5SMC19mcm9tYnVmZmVylJOUKJZQAAAAAAAAAJT0zEKAbKC+AADIQgAAyEIAAMhC/YsaQ1AW9b4AAMhCAADIQgAAyEJkBrZCdi5YPQAAyEIAAMhCAADIQpznq0LSUdq/AADIQgAAyEIAAMhClIwFbnVtcHmUjAVkdHlwZZSTlIwCZjSUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYksESwWGlIwBQ5R0lFKULg=="
     },
     "_last_episode_starts": {
         ":type:": "<class 'numpy.ndarray'>",
     "_current_progress_remaining": -0.0649599999999999,
     "ep_info_buffer": {
         ":type:": "<class 'collections.deque'>",
+        ":serialized:": "gAWVehAAAAAAAACMC2NvbGxlY3Rpb25zlIwFZGVxdWWUk5QpS2SGlFKUKH2UKIwBcpSMFW51bXB5LmNvcmUubXVsdGlhcnJheZSMBnNjYWxhcpSTlIwFbnVtcHmUjAVkdHlwZZSTlIwCZjiUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYkMIBg/TvrmPI8CUhpRSlIwBbJRN9QGMAXSUR0BQNnTNMXabdX2UKGgGaAloD0MIyO4CJQV2DsCUhpRSlGgVTfUBaBZHQFBDaqjrRjV1fZQoaAZoCWgPQwgCEk2giM9AwJSGlFKUaBVN9QFoFkdAUEtdRiw0O3V9lChoBmgJaA9DCCBdbFopdDfAlIaUUpRoFU31AWgWR0BQZ4K+i8FqdX2UKGgGaAloD0MI0xVsI55sGUCUhpRSlGgVTfUBaBZHQFBow4sEq2B1fZQoaAZoCWgPQwihgVg28xmQQJSGlFKUaBVLU2gWR0BQc3h4t6HCdX2UKGgGaAloD0MIJ6Wg20tiR0CUhpRSlGgVTfUBaBZHQFB5utfXwsp1fZQoaAZoCWgPQwgDJQUWwAA1QJSGlFKUaBVN9QFoFkdAUH7ZqVQhwHV9lChoBmgJaA9DCKuTMxR3sFVAlIaUUpRoFU31AWgWR0BQn4aHbh3rdX2UKGgGaAloD0MI1edqK/YNQkCUhpRSlGgVTfUBaBZHQFCmwG4ZuQ91fZQoaAZoCWgPQwiwrgrUomuPQJSGlFKUaBVN5AFoFkdAUKvvG6wt8XV9lChoBmgJaA9DCGpsrwW9czJAlIaUUpRoFU31AWgWR0BQtMrAgxJvdX2UKGgGaAloD0MIueAM/n6dj0CUhpRSlGgVS4doFkdAULiqDK5kLHV9lChoBmgJaA9DCDv7yoOUB5BAlIaUUpRoFU0iAWgWR0BSTcNQTEiudX2UKGgGaAloD0MI8PyiBP3lE8CUhpRSlGgVTfUBaBZHQFJN2g3974V1fZQoaAZoCWgPQwiZKa2/Jew6QJSGlFKUaBVN9QFoFkdAUlcwlByCF3V9lChoBmgJaA9DCEOQgxJmZkTAlIaUUpRoFU31AWgWR0BSa9et0V8DdX2UKGgGaAloD0MI5ggZyJP0j0CUhpRSlGgVTVIBaBZHQFJ7uWrwOON1fZQoaAZoCWgPQwgE/1vJjlNCwJSGlFKUaBVN9QFoFkdAUoJhYvFm4HV9lChoBmgJaA9DCIJvmj47sExAlIaUUpRoFU31AWgWR0BSgn2ys0YTdX2UKGgGaAloD0MIjV4NUBomM8CUhpRSlGgVTfUBaBZHQFKam7rcCYF1fZQoaAZoCWgPQwh9rrZif3E5wJSGlFKUaBVN9QFoFkdAUqn8AJb+tXV9lChoBmgJaA9DCOCAlq5gm+g/lIaUUpRoFU31AWgWR0BSskI1LrX2dX2UKGgGaAloD0MIJezbSUQkMsCUhpRSlGgVTfUBaBZHQFKyYr8R+Sd1fZQoaAZoCWgPQwgjvD0IAZEqQJSGlFKUaBVN9QFoFkdAUsiPyTY/V3V9lChoBmgJaA9DCOW4UzpY9UvAlIaUUpRoFU31AWgWR0BS1a9f1HvudX2UKGgGaAloD0MIlMFR8uqsHUCUhpRSlGgVTfUBaBZHQFLazImw7kp1fZQoaAZoCWgPQwgi/fZ14PwjwJSGlFKUaBVN9QFoFkdAUtrjENvwVnV9lChoBmgJaA9DCPEpAMYzsEHAlIaUUpRoFU31AWgWR0BS8XgDRtxddX2UKGgGaAloD0MIZ/D3i1nej0CUhpRSlGgVTXcBaBZHQFL6Eovzvql1fZQoaAZoCWgPQwhaSwFp/wVGwJSGlFKUaBVN9QFoFkdAVEbmwJPZZnV9lChoBmgJaA9DCFJ+Uu3TQTfAlIaUUpRoFU31AWgWR0BUS/wy6+WXdX2UKGgGaAloD0MI9kArMMQWkECUhpRSlGgVS/poFkdAVFnUQTVUdnV9lChoBmgJaA9DCPbQPlbweyzAlIaUUpRoFU31AWgWR0BUX9HUc4o7dX2UKGgGaAloD0MIjNr9KsAvMUCUhpRSlGgVTfUBaBZHQFRob2lEZzh1fZQoaAZoCWgPQwgvppnu5YeQQJSGlFKUaBVNsQFoFkdAVG5KjBVMmHV9lChoBmgJaA9DCM7F3/bkjo9AlIaUUpRoFU3WAWgWR0BUgLrs0HhTdX2UKGgGaAloD0MIvHX+7bKHJ8CUhpRSlGgVTfUBaBZHQFSOoFFDv3J1fZQoaAZoCWgPQwj8+4wL1w6QQJSGlFKUaBVLK2gWR0BUkemWMS9NdX2UKGgGaAloD0MI6wHzkClPGcCUhpRSlGgVTfUBaBZHQFSaP8AJb+t1fZQoaAZoCWgPQwgZH2Yv234VQJSGlFKUaBVN9QFoFkdAVKFqREF4cHV9lChoBmgJaA9DCKG9+njoCxXAlIaUUpRoFU31AWgWR0BUvnlr/KhddX2UKGgGaAloD0MIrDjVWpgVJ8CUhpRSlGgVTfUBaBZHQFTPY3vQWvd1fZQoaAZoCWgPQwhOmZtvBA2QQJSGlFKUaBVLMWgWR0BU1MyFfzBidX2UKGgGaAloD0MI5sqg2uD4MUCUhpRSlGgVTfUBaBZHQFTWxsEaESN1fZQoaAZoCWgPQwhCCp5CrlQKQJSGlFKUaBVN9QFoFkdAVNytvGZNPHV9lChoBmgJaA9DCMwLsI9OjRZAlIaUUpRoFU31AWgWR0BU84pDu0CzdX2UKGgGaAloD0MIfentz0VjGECUhpRSlGgVTfUBaBZHQFUJFqzqrzZ1fZQoaAZoCWgPQwiID+z4L7wxQJSGlFKUaBVN9QFoFkdAVQrGaQV9GHV9lChoBmgJaA9DCETC9/4GvRXAlIaUUpRoFU31AWgWR0BVDxUBGQS0dX2UKGgGaAloD0MISN+kaVA0AMCUhpRSlGgVTfUBaBZHQFazAavRqoJ1fZQoaAZoCWgPQwj8G7RXHwM4wJSGlFKUaBVN9QFoFkdAVszhzeXRgXV9lChoBmgJaA9DCCfaVUj5gTrAlIaUUpRoFU31AWgWR0BWz6lxffGddX2UKGgGaAloD0MImu0KfbCqSECUhpRSlGgVTfUBaBZHQFbXalk6Lfl1fZQoaAZoCWgPQwhwd9Zuu6ASwJSGlFKUaBVN9QFoFkdAVur+ERJ2+3V9lChoBmgJaA9DCKTjamRX5jbAlIaUUpRoFU31AWgWR0BW/Ol41P30dX2UKGgGaAloD0MIthDkoIQlO8CUhpRSlGgVTfUBaBZHQFb+nXNC7bt1fZQoaAZoCWgPQwggmKPH7001wJSGlFKUaBVN9QFoFkdAVwWbF0gbInV9lChoBmgJaA9DCA6/m25ZKZBAlIaUUpRoFUv1aBZHQFcZV5a/yoZ1fZQoaAZoCWgPQwgly0kofW04wJSGlFKUaBVN9QFoFkdAVx1rk8zQ/3V9lChoBmgJaA9DCO/Lme0KzRTAlIaUUpRoFU31AWgWR0BXMqAjIJZ4dX2UKGgGaAloD0MIATPfwU+8GkCUhpRSlGgVTfUBaBZHQFc3AHVwxWV1fZQoaAZoCWgPQwjpfk5Bfg4rwJSGlFKUaBVN9QFoFkdAV0Vq1w5vL3V9lChoBmgJaA9DCDvI68GkmBHAlIaUUpRoFU31AWgWR0BXSYACGN70dX2UKGgGaAloD0MItAJDVreGMMCUhpRSlGgVTfUBaBZHQFdetRvWH1x1fZQoaAZoCWgPQwiCAYQPJYIrQJSGlFKUaBVN9QFoFkdAV2MIldC3PXV9lChoBmgJaA9DCJdxUwPNBynAlIaUUpRoFU31AWgWR0BZAPx6OYICdX2UKGgGaAloD0MIi3CTUWVqQcCUhpRSlGgVTfUBaBZHQFkHhh6Skj51fZQoaAZoCWgPQwgBNEqX/tU7wJSGlFKUaBVN9QFoFkdAWRiuMdcSoXV9lChoBmgJaA9DCNek2xK5gABAlIaUUpRoFU31AWgWR0BZH8zVMEiddX2UKGgGaAloD0MIuhPsv84FIkCUhpRSlGgVTfUBaBZHQFkwglF+d9V1fZQoaAZoCWgPQwiWtOIbCmVKQJSGlFKUaBVN9QFoFkdAWTceS0Sh8XV9lChoBmgJaA9DCMLDtG/u049AlIaUUpRoFU0UAWgWR0BZS9bcGkeqdX2UKGgGaAloD0MIa2RXWkYKPkCUhpRSlGgVTfUBaBZHQFlMAymALAp1fZQoaAZoCWgPQwgMkdPX8402QJSGlFKUaBVN9QFoFkdAWVBhuwX67HV9lChoBmgJaA9DCHszar5KtjzAlIaUUpRoFU31AWgWR0BZY3uJDVpcdX2UKGgGaAloD0MITaPJxRhYMECUhpRSlGgVTfUBaBZHQFl0SNOuaF51fZQoaAZoCWgPQwjrrYGtEiQpwJSGlFKUaBVN9QFoFkdAWXR01ZTya3V9lChoBmgJaA9DCObpXFFKCN+/lIaUUpRoFU31AWgWR0BZeyiudPLxdX2UKGgGaAloD0MIcmpnmNrCJkCUhpRSlGgVTfUBaBZHQFmSJ/oaDPJ1fZQoaAZoCWgPQwi+o8aEmA84QJSGlFKUaBVN9QFoFkdAWarY8Md92HV9lChoBmgJaA9DCPfoDfeRV0LAlIaUUpRoFU31AWgWR0BZqw8B+4LDdX2UKGgGaAloD0MIAruaPGW1GUCUhpRSlGgVTfUBaBZHQFmvWTot+Th1fZQoaAZoCWgPQwgkSKXY0YAmwJSGlFKUaBVN9QFoFkdAW0pS2phnanV9lChoBmgJaA9DCJ595UF68j3AlIaUUpRoFU31AWgWR0BbYYy44Ia+dX2UKGgGaAloD0MIct7/xwmnTsCUhpRSlGgVTfUBaBZHQFth0Xxe9jB1fZQoaAZoCWgPQwh4fHvXAJ6PQJSGlFKUaBVN1gFoFkdAW2PZbpu/DnV9lChoBmgJaA9DCGgHXFdMUpBAlIaUUpRoFUupaBZHQFtwtelbeM11fZQoaAZoCWgPQwjCE3r9SfwMQJSGlFKUaBVN9QFoFkdAW3b7k4m1IHV9lChoBmgJaA9DCOW5vg8H8SHAlIaUUpRoFU31AWgWR0BbimvKU3XJdX2UKGgGaAloD0MI9l0R/G9pQ0CUhpRSlGgVTfUBaBZHQFuKqzqrzXl1fZQoaAZoCWgPQwj7dac7TxwrQJSGlFKUaBVN9QFoFkdAW5nWsijcmHV9lChoBmgJaA9DCAx5BDdS+EVAlIaUUpRoFU31AWgWR0Bboajvd/KAdX2UKGgGaAloD0MIqn8QyZAj8j+UhpRSlGgVTfUBaBZHQFu0Ttb9qDd1fZQoaAZoCWgPQwghc2VQbeAtQJSGlFKUaBVN9QFoFkdAW7R7RfF72XV9lChoBmgJaA9DCOykvizthCRAlIaUUpRoFU31AWgWR0BbxEGFBY3edX2UKGgGaAloD0MIn1p9dVVg/D+UhpRSlGgVTfUBaBZHQFvKhpQDV6N1fZQoaAZoCWgPQwi5bHTOT19DQJSGlFKUaBVN9QFoFkdAW9uESM98qnV9lChoBmgJaA9DCCmWW1oNITBAlIaUUpRoFU31AWgWR0Bb27C79Q40dX2UKGgGaAloD0MIycnErYJAQkCUhpRSlGgVTfUBaBZHQFvwMwlByCF1ZS4="
     },
     "ep_success_buffer": {
         ":type:": "<class 'collections.deque'>",
     },
     "_n_updates": 130,
     "n_steps": 2048,
+    "gamma": 0.99,
+    "gae_lambda": 0.95,
     "ent_coef": 0.0,
     "vf_coef": 0.5,
     "max_grad_norm": 0.5,

PPO-hardcoded/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bc1061a2a4105adb326630ea5010d859105285cf977decfae4858284859c5846
 size 84857

 version https://git-lfs.github.com/spec/v1
+oid sha256:7045faf8194a38e20fbec8c2e8ef7ff87c03abb7873520d322b97974ccd7b127
 size 84857

PPO-hardcoded/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac3e76dc1ad3702674c69e77721b3ff460a7e794d83cee039a143e5a99a27e7b
 size 41857

 version https://git-lfs.github.com/spec/v1
+oid sha256:18b241845079aaba824df958d7a9ef763a455a7fd84f06befceef8beaf7376d0
 size 41857

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: RoombaAToB-Hardcoded
     metrics:
     - type: mean_reward
-      value: -13.11 +/- 0.00
       name: mean_reward
       verified: false
 ---

       type: RoombaAToB-Hardcoded
     metrics:
     - type: mean_reward
+      value: -44.62 +/- 0.00
       name: mean_reward
       verified: false
 ---

config.json CHANGED Viewed

@@ -1 +1 @@

- {"policy_class": {":type:": "<class 'abc.ABCMeta'>", ":serialized:": "gAWVOwAAAAAAAACMIXN0YWJsZV9iYXNlbGluZXMzLmNvbW1vbi5wb2xpY2llc5SMEUFjdG9yQ3JpdGljUG9saWN5lJOULg==", "__module__": "stable_baselines3.common.policies", "__doc__": "\n Policy class for actor-critic algorithms (has both policy and value prediction).\n Used by A2C, PPO and the likes.\n\n :param observation_space: Observation space\n :param action_space: Action space\n :param lr_schedule: Learning rate schedule (could be constant)\n :param net_arch: The specification of the policy and value networks.\n :param activation_fn: Activation function\n :param ortho_init: Whether to use or not orthogonal initialization\n :param use_sde: Whether to use State Dependent Exploration or not\n :param log_std_init: Initial value for the log standard deviation\n :param full_std: Whether to use (n_features x n_actions) parameters\n for the std instead of only (n_features,) when using gSDE\n :param use_expln: Use ``expln()`` function instead of ``exp()`` to ensure\n a positive standard deviation (cf paper). It allows to keep variance\n above zero and prevent it from growing too fast. In practice, ``exp()`` is usually enough.\n :param squash_output: Whether to squash the output using a tanh function,\n this allows to ensure boundaries when using gSDE.\n :param features_extractor_class: Features extractor to use.\n :param features_extractor_kwargs: Keyword arguments\n to pass to the features extractor.\n :param share_features_extractor: If True, the features extractor is shared between the policy and value networks.\n :param normalize_images: Whether to normalize images or not,\n dividing by 255.0 (True by default)\n :param optimizer_class: The optimizer to use,\n ``th.optim.Adam`` by default\n :param optimizer_kwargs: Additional keyword arguments,\n excluding the learning rate, to pass to the optimizer\n ", "__init__": "<function ActorCriticPolicy.__init__ at 0x7efd63ad8e50>", "_get_constructor_parameters": "<function ActorCriticPolicy._get_constructor_parameters at 0x7efd63ad8ee0>", "reset_noise": "<function ActorCriticPolicy.reset_noise at 0x7efd63ad8f70>", "_build_mlp_extractor": "<function ActorCriticPolicy._build_mlp_extractor at 0x7efd63ad9000>", "_build": "<function ActorCriticPolicy._build at 0x7efd63ad9090>", "forward": "<function ActorCriticPolicy.forward at 0x7efd63ad9120>", "extract_features": "<function ActorCriticPolicy.extract_features at 0x7efd63ad91b0>", "_get_action_dist_from_latent": "<function ActorCriticPolicy._get_action_dist_from_latent at 0x7efd63ad9240>", "_predict": "<function ActorCriticPolicy._predict at 0x7efd63ad92d0>", "evaluate_actions": "<function ActorCriticPolicy.evaluate_actions at 0x7efd63ad9360>", "get_distribution": "<function ActorCriticPolicy.get_distribution at 0x7efd63ad93f0>", "predict_values": "<function ActorCriticPolicy.predict_values at 0x7efd63ad9480>", "__abstractmethods__": "frozenset()", "_abc_impl": "<_abc._abc_data object at 0x7efd643ebf80>"}, "verbose": true, "policy_kwargs": {}, "observation_space": {":type:": "<class 'gym.spaces.box.Box'>", ":serialized:": "gAWVgQEAAAAAAACMDmd5bS5zcGFjZXMuYm94lIwDQm94lJOUKYGUfZQojAVkdHlwZZSMBW51bXB5lGgFk5SMAmY0lImIh5RSlChLA4wBPJROTk5K/////0r/////SwB0lGKMBl9zaGFwZZRLBYWUjANsb3eUjBJudW1weS5jb3JlLm51bWVyaWOUjAtfZnJvbWJ1ZmZlcpSTlCiWFAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAJRoCksFhZSMAUOUdJRSlIwEaGlnaJRoEiiWFAAAAAAAAAAA6P1I2w9JQAAAyEIAAMhCAADIQpRoCksFhZRoFXSUUpSMDWJvdW5kZWRfYmVsb3eUaBIolgUAAAAAAAAAAQEBAQGUaAeMAmIxlImIh5RSlChLA4wBfJROTk5K/////0r/////SwB0lGJLBYWUaBV0lFKUjA1ib3VuZGVkX2Fib3ZllGgSKJYFAAAAAAAAAAEBAQEBlGghSwWFlGgVdJRSlIwKX25wX3JhbmRvbZROdWIu", "dtype": "float32", "_shape": [5], "low": "[0. 0. 0. 0. 0.]", "high": "[5.2000000e+05 3.1415927e+00 1.0000000e+02 1.0000000e+02 1.0000000e+02]", "bounded_below": "[ True True True True True]", "bounded_above": "[ True True True True True]", "_np_random": null}, "action_space": {":type:": "<class 'gym.spaces.discrete.Discrete'>", ":serialized:": "gAWVggAAAAAAAACME2d5bS5zcGFjZXMuZGlzY3JldGWUjAhEaXNjcmV0ZZSTlCmBlH2UKIwBbpRLBIwGX3NoYXBllCmMBWR0eXBllIwFbnVtcHmUaAeTlIwCaTiUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYowKX25wX3JhbmRvbZROdWIu", "n": 4, "_shape": [], "dtype": "int64", "_np_random": null}, "n_envs": 4, "num_timesteps": 106496, "_total_timesteps": 100000, "_num_timesteps_at_start": 0, "seed": null, "action_noise": null, "start_time": 1681154144902602908, "learning_rate": 0.0003, "tensorboard_log": null, "lr_schedule": {":type:": "<class 'function'>", ":serialized:": "gAWV4QIAAAAAAACMF2Nsb3VkcGlja2xlLmNsb3VkcGlja2xllIwOX21ha2VfZnVuY3Rpb26Uk5QoaACMDV9idWlsdGluX3R5cGWUk5SMCENvZGVUeXBllIWUUpQoSwFLAEsASwFLAUsTQwSIAFMAlE6FlCmMAV+UhZSMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZSMBGZ1bmOUS4JDAgQBlIwDdmFslIWUKXSUUpR9lCiMC19fcGFja2FnZV9flIwYc3RhYmxlX2Jhc2VsaW5lczMuY29tbW9ulIwIX19uYW1lX1+UjB5zdGFibGVfYmFzZWxpbmVzMy5jb21tb24udXRpbHOUjAhfX2ZpbGVfX5SMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZR1Tk5oAIwQX21ha2VfZW1wdHlfY2VsbJSTlClSlIWUdJRSlIwcY2xvdWRwaWNrbGUuY2xvdWRwaWNrbGVfZmFzdJSMEl9mdW5jdGlvbl9zZXRzdGF0ZZSTlGgffZR9lChoFmgNjAxfX3F1YWxuYW1lX1+UjBljb25zdGFudF9mbi48bG9jYWxzPi5mdW5jlIwPX19hbm5vdGF0aW9uc19flH2UjA5fX2t3ZGVmYXVsdHNfX5ROjAxfX2RlZmF1bHRzX1+UTowKX19tb2R1bGVfX5RoF4wHX19kb2NfX5ROjAtfX2Nsb3N1cmVfX5RoAIwKX21ha2VfY2VsbJSTlEc/M6kqMFUyYYWUUpSFlIwXX2Nsb3VkcGlja2xlX3N1Ym1vZHVsZXOUXZSMC19fZ2xvYmFsc19flH2UdYaUhlIwLg=="}, "_last_obs": {":type:": "<class 'numpy.ndarray'>", ":serialized:": "gAWVxQAAAAAAAACMEm51bXB5LmNvcmUubnVtZXJpY5SMC19mcm9tYnVmZmVylJOUKJZQAAAAAAAAAC2FtEGb59e/AADIQgAAyEIAAMhCF4sAQ7dTFL8AAMhCAADIQgAAyEJCrLBC/mqhPgAAyEIAAMhCAADIQgFbqUIEFVK/AADIQgAAyEIAAMhClIwFbnVtcHmUjAVkdHlwZZSTlIwCZjSUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYksESwWGlIwBQ5R0lFKULg=="}, "_last_episode_starts": {":type:": "<class 'numpy.ndarray'>", ":serialized:": "gAWVdwAAAAAAAACMEm51bXB5LmNvcmUubnVtZXJpY5SMC19mcm9tYnVmZmVylJOUKJYEAAAAAAAAAAAAAACUjAVudW1weZSMBWR0eXBllJOUjAJiMZSJiIeUUpQoSwOMAXyUTk5OSv////9K/////0sAdJRiSwSFlIwBQ5R0lFKULg=="}, "_last_original_obs": null, "_episode_num": 0, "use_sde": false, "sde_sample_freq": -1, "_current_progress_remaining": -0.0649599999999999, "ep_info_buffer": {":type:": "<class 'collections.deque'>", ":serialized:": "gAWVdBAAAAAAAACMC2NvbGxlY3Rpb25zlIwFZGVxdWWUk5QpS2SGlFKUKH2UKIwBcpSMFW51bXB5LmNvcmUubXVsdGlhcnJheZSMBnNjYWxhcpSTlIwFbnVtcHmUjAVkdHlwZZSTlIwCZjiUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYkMIOj3vxoICMcCUhpRSlIwBbJRN9QGMAXSUR0BQ570nPVurdX2UKGgGaAloD0MISgwCK4ckSMCUhpRSlGgVTfUBaBZHQFDteHSF49p1fZQoaAZoCWgPQwh9XBsqxrkiwJSGlFKUaBVN9QFoFkdAUO2gOBlMAXV9lChoBmgJaA9DCCiZnNoZjiHAlIaUUpRoFU31AWgWR0BSaLBO58SgdX2UKGgGaAloD0MI+KdUibKvLUCUhpRSlGgVTfUBaBZHQFKBdHlOoHd1fZQoaAZoCWgPQwieYP91bjoHwJSGlFKUaBVN9QFoFkdAUoqn1nM+vHV9lChoBmgJaA9DCIC21awz1jbAlIaUUpRoFU31AWgWR0BSis+iaiK0dX2UKGgGaAloD0MIyLJg4o9iKMCUhpRSlGgVTfUBaBZHQFKZ2t+1Bt11fZQoaAZoCWgPQwjQ7SWN0RItwJSGlFKUaBVN9QFoFkdAUqzaQFLWZ3V9lChoBmgJaA9DCPylRX2SUyvAlIaUUpRoFU31AWgWR0BSsdK/VRUFdX2UKGgGaAloD0MIggNauoJBOsCUhpRSlGgVTfUBaBZHQFKx+0w8GLV1fZQoaAZoCWgPQwiwyoXKv4BLwJSGlFKUaBVN9QFoFkdAUsEicG1QZXV9lChoBmgJaA9DCNMuppnudfo/lIaUUpRoFU31AWgWR0BS1vp6hQFcdX2UKGgGaAloD0MI0bGDSlwZQsCUhpRSlGgVTfUBaBZHQFLe1anrIHV1fZQoaAZoCWgPQwjP+SmOA08ywJSGlFKUaBVN9QFoFkdAUt8Xxe9i+nV9lChoBmgJaA9DCFfQtMTKpDLAlIaUUpRoFU31AWgWR0BS8NNi6QNkdX2UKGgGaAloD0MI8KKvIM0aRcCUhpRSlGgVTfUBaBZHQFMKGrCFbml1fZQoaAZoCWgPQwgR4srZO6P7v5SGlFKUaBVN9QFoFkdAUw9Q9A5aNnV9lChoBmgJaA9DCF6B6EmZ6DrAlIaUUpRoFU31AWgWR0BTD3lCCz1LdX2UKGgGaAloD0MIZ3v0hvswLMCUhpRSlGgVTfUBaBZHQFSz22G7Bft1fZQoaAZoCWgPQwgng6Pk9e+PQJSGlFKUaBVNmQFoFkdAVMNR4yGi6HV9lChoBmgJaA9DCIF2hxQD9BzAlIaUUpRoFU31AWgWR0BU0mUSqU/wdX2UKGgGaAloD0MIpfRMLzEcQsCUhpRSlGgVTfUBaBZHQFTSpKzzErJ1fZQoaAZoCWgPQwgCYhIu5GkywJSGlFKUaBVN9QFoFkdAVOQZWJaaC3V9lChoBmgJaA9DCKFoHsAif/Y/lIaUUpRoFU31AWgWR0BU81khA4XGdX2UKGgGaAloD0MI3dH/ci26MsCUhpRSlGgVTfUBaBZHQFUDVFx4ptt1fZQoaAZoCWgPQwid9/9xwqQywJSGlFKUaBVN9QFoFkdAVQN8Aq/dqXV9lChoBmgJaA9DCE4mbhXEWCvAlIaUUpRoFU31AWgWR0BVFd/z8P4EdX2UKGgGaAloD0MIebEwRE7TN8CUhpRSlGgVTfUBaBZHQFUmsYVIqb11fZQoaAZoCWgPQwhCXg8mFQ6QQJSGlFKUaBVLN2gWR0BVLsPJ7sv7dX2UKGgGaAloD0MIaww6IXT8OsCUhpRSlGgVTfUBaBZHQFU2iNsFdLR1fZQoaAZoCWgPQwiwxW6fVcYTwJSGlFKUaBVN9QFoFkdAVTawcHWz4XV9lChoBmgJaA9DCPuWOV0WrzLAlIaUUpRoFU31AWgWR0BVRbBXS0BwdX2UKGgGaAloD0MINKDejJqvIsCUhpRSlGgVTfUBaBZHQFVbJ0W/JvJ1fZQoaAZoCWgPQwjG20qvzYYAwJSGlFKUaBVN9QFoFkdAVWkPXkHUt3V9lChoBmgJaA9DCGL2su20fTLAlIaUUpRoFU31AWgWR0BVaVOKwY+CdX2UKGgGaAloD0MIDHcujPQeO8CUhpRSlGgVTfUBaBZHQFbjLLpzLfV1fZQoaAZoCWgPQwjjcOZX4wGQQJSGlFKUaBVNXQFoFkdAVvdo6CDmKnV9lChoBmgJaA9DCBUDJJpA4RjAlIaUUpRoFU31AWgWR0BW/HTmW+oMdX2UKGgGaAloD0MI4NqJkpDAM0CUhpRSlGgVTfUBaBZHQFcJOW0JF9d1fZQoaAZoCWgPQwg+BFWjV2MCQJSGlFKUaBVN9QFoFkdAVyCCcwxnF3V9lChoBmgJaA9DCPtZLEUSAJBAlIaUUpRoFUvoaBZHQFclUyYXwb51fZQoaAZoCWgPQwhsXWqEfoowwJSGlFKUaBVN9QFoFkdAVzCHGjsUqXV9lChoBmgJaA9DCIOI1LSLuSfAlIaUUpRoFU31AWgWR0BXNieVcD8tdX2UKGgGaAloD0MIRwINNtXsj0CUhpRSlGgVTQMBaBZHQFc6SDyvs7d1fZQoaAZoCWgPQwhDxw4qwQiQQJSGlFKUaBVLUmgWR0BXQxgRbr1NdX2UKGgGaAloD0MIqwg3GVWGK8CUhpRSlGgVTfUBaBZHQFdWALy+YdB1fZQoaAZoCWgPQwhBuW3fo74OwJSGlFKUaBVN9QFoFkdAV2PnZCfHxXV9lChoBmgJaA9DCA4tsp3vlxpAlIaUUpRoFU31AWgWR0BXam4ZuQ6qdX2UKGgGaAloD0MIkl1pGSnDj0CUhpRSlGgVS2poFkdAV3d7x/d69nV9lChoBmgJaA9DCBOCVfXyAyLAlIaUUpRoFU31AWgWR0BXew5FPSDzdX2UKGgGaAloD0MI3q6XpgjgGkCUhpRSlGgVTfUBaBZHQFeT9ZRsMy91fZQoaAZoCWgPQwgIPZtVnyv3v5SGlFKUaBVN9QFoFkdAV51xIatLc3V9lChoBmgJaA9DCNS6DWp/kY9AlIaUUpRoFU2WAWgWR0BXomPLgXMydX2UKGgGaAloD0MI8RKc+uDEj0CUhpRSlGgVS5poFkdAV6mEOAiFCnV9lChoBmgJaA9DCJuPa0Nl049AlIaUUpRoFU0NAWgWR0BXqYNI9TxYdX2UKGgGaAloD0MIEOoihbIIK8CUhpRSlGgVTfUBaBZHQFesEfkmx+t1fZQoaAZoCWgPQwg/xty15L+PQJSGlFKUaBVL/GgWR0BZMZFw1ivxdX2UKGgGaAloD0MIzv3V477nj0CUhpRSlGgVTVwBaBZHQFkx961LJ0Z1fZQoaAZoCWgPQwgDsWzm0PePQJSGlFKUaBVL4mgWR0BZMiK3uuzQdX2UKGgGaAloD0MItqD3xrBaj0CUhpRSlGgVTVIBaBZHQFk4UQTVUdd1fZQoaAZoCWgPQwivQspPStiPQJSGlFKUaBVNFAFoFkdAWU2bF0gbInV9lChoBmgJaA9DCKN5AIv8qhHAlIaUUpRoFU31AWgWR0BZYQRK6FufdX2UKGgGaAloD0MIrP2d7dFzIkCUhpRSlGgVTfUBaBZHQFlhaPjn3cp1fZQoaAZoCWgPQwjsMvynG3gVwJSGlFKUaBVN9QFoFkdAWWktBfKISHV9lChoBmgJaA9DCHLChNGsrABAlIaUUpRoFU31AWgWR0BZeIdZJTVEdX2UKGgGaAloD0MITyFX6rmlj0CUhpRSlGgVTU0BaBZHQFmAs+3Ytg91fZQoaAZoCWgPQwiPxwxUxh8YwJSGlFKUaBVN9QFoFkdAWZTsw+MZP3V9lChoBmgJaA9DCMnnFU89vjXAlIaUUpRoFU31AWgWR0BZn7iMo+fRdX2UKGgGaAloD0MIYg/tY+W7j0CUhpRSlGgVTYkBaBZHQFmxvsZ5zHV1fZQoaAZoCWgPQwhHj9/bNLWPQJSGlFKUaBVNCwFoFkdAWbZn27FsHnV9lChoBmgJaA9DCFDFjVvMJyxAlIaUUpRoFU31AWgWR0BZufKMefZmdX2UKGgGaAloD0MIzSN/MPAcGsCUhpRSlGgVTfUBaBZHQFnRlhgE2YR1fZQoaAZoCWgPQwjhfOpYRUKPQJSGlFKUaBVNmAFoFkdAWdvwAlv603V9lChoBmgJaA9DCJm36jqURo9AlIaUUpRoFU3NAWgWR0BZ4hi5NGmUdX2UKGgGaAloD0MI1a4JaY3BE8CUhpRSlGgVTfUBaBZHQFnieBxxT851fZQoaAZoCWgPQwgSiULL2uyPQJSGlFKUaBVLxWgWR0BZ9YUFjd56dX2UKGgGaAloD0MIEfxvJfv2j0CUhpRSlGgVTVQBaBZHQFn1vXbuc+d1fZQoaAZoCWgPQwjvN9pxg3aPQJSGlFKUaBVNYwFoFkdAW5rSgGr0a3V9lChoBmgJaA9DCPQau0S1l49AlIaUUpRoFU3IAWgWR0BbqqpgkTpQdX2UKGgGaAloD0MIBb8NMT5Ej0CUhpRSlGgVTUsBaBZHQFu+KPGQ0XR1fZQoaAZoCWgPQwiOI9bi8wiPQJSGlFKUaBVN5wFoFkdAW8KQxN7BwnV9lChoBmgJaA9DCBCWsaGbPQ3AlIaUUpRoFU31AWgWR0Bbw3w5NoJzdX2UKGgGaAloD0MIUaT7OeXDj0CUhpRSlGgVS/VoFkdAW9RRvWH1vnV9lChoBmgJaA9DCF8ktOV8rY9AlIaUUpRoFU0MAWgWR0Bb2PHktEofdX2UKGgGaAloD0MIcXFUbqL2BECUhpRSlGgVTfUBaBZHQFvZaGpMpPR1fZQoaAZoCWgPQwg3jliLT+KPQJSGlFKUaBVLP2gWR0Bb3cdDIBBBdX2UKGgGaAloD0MIqfV+o52Pj0CUhpRSlGgVTQABaBZHQFvppdrwe/51fZQoaAZoCWgPQwjWO9wO7cePQJSGlFKUaBVLp2gWR0Bb7EkSmIj4dX2UKGgGaAloD0MIm+RH/IqFE8CUhpRSlGgVTfUBaBZHQFvtcSXdCVt1fZQoaAZoCWgPQwihhm9h3SAowJSGlFKUaBVN9QFoFkdAXAG/j81n/XV9lChoBmgJaA9DCKezk8FxhY9AlIaUUpRoFU1YAWgWR0BcBu1jRUm2dX2UKGgGaAloD0MIl1ZD4t6Oj0CUhpRSlGgVTZYBaBZHQFwJE4Nqgyx1fZQoaAZoCWgPQwjjNEQV3hWPQJSGlFKUaBVNfAFoFkdAXAraJyhi9nV9lChoBmgJaA9DCLcpHhf1no9AlIaUUpRoFUtraBZHQFwPLmZE2Hd1fZQoaAZoCWgPQwiz0Tk/BdCPQJSGlFKUaBVLr2gWR0BcD0JF9a2XdX2UKGgGaAloD0MI7+TTY1sSj0CUhpRSlGgVTXIBaBZHQFwnZUT+NtJ1fZQoaAZoCWgPQwhOK4VALiktwJSGlFKUaBVN9QFoFkdAXDFKCg9Ne3V9lChoBmgJaA9DCOXyH9LPd49AlIaUUpRoFU3eAWgWR0BcNaUqx1PndX2UKGgGaAloD0MIMNXMWgpIHsCUhpRSlGgVTfUBaBZHQFw36qbSZ0F1ZS4="}, "ep_success_buffer": {":type:": "<class 'collections.deque'>", ":serialized:": "gAWVIAAAAAAAAACMC2NvbGxlY3Rpb25zlIwFZGVxdWWUk5QpS2SGlFKULg=="}, "_n_updates": 130, "n_steps": 2048, "gamma": 0.95, "gae_lambda": 0.8, "ent_coef": 0.0, "vf_coef": 0.5, "max_grad_norm": 0.5, "batch_size": 64, "n_epochs": 10, "clip_range": {":type:": "<class 'function'>", ":serialized:": "gAWV4QIAAAAAAACMF2Nsb3VkcGlja2xlLmNsb3VkcGlja2xllIwOX21ha2VfZnVuY3Rpb26Uk5QoaACMDV9idWlsdGluX3R5cGWUk5SMCENvZGVUeXBllIWUUpQoSwFLAEsASwFLAUsTQwSIAFMAlE6FlCmMAV+UhZSMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZSMBGZ1bmOUS4JDAgQBlIwDdmFslIWUKXSUUpR9lCiMC19fcGFja2FnZV9flIwYc3RhYmxlX2Jhc2VsaW5lczMuY29tbW9ulIwIX19uYW1lX1+UjB5zdGFibGVfYmFzZWxpbmVzMy5jb21tb24udXRpbHOUjAhfX2ZpbGVfX5SMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZR1Tk5oAIwQX21ha2VfZW1wdHlfY2VsbJSTlClSlIWUdJRSlIwcY2xvdWRwaWNrbGUuY2xvdWRwaWNrbGVfZmFzdJSMEl9mdW5jdGlvbl9zZXRzdGF0ZZSTlGgffZR9lChoFmgNjAxfX3F1YWxuYW1lX1+UjBljb25zdGFudF9mbi48bG9jYWxzPi5mdW5jlIwPX19hbm5vdGF0aW9uc19flH2UjA5fX2t3ZGVmYXVsdHNfX5ROjAxfX2RlZmF1bHRzX1+UTowKX19tb2R1bGVfX5RoF4wHX19kb2NfX5ROjAtfX2Nsb3N1cmVfX5RoAIwKX21ha2VfY2VsbJSTlEc/yZmZmZmZmoWUUpSFlIwXX2Nsb3VkcGlja2xlX3N1Ym1vZHVsZXOUXZSMC19fZ2xvYmFsc19flH2UdYaUhlIwLg=="}, "clip_range_vf": null, "normalize_advantage": true, "target_kl": null, "system_info": {"OS": "Linux-5.19.0-35-generic-x86_64-with-glibc2.35 # 36~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Fri Feb 17 15:17:25 UTC 2", "Python": "3.10.9", "Stable-Baselines3": "1.7.0", "PyTorch": "2.0.0", "GPU Enabled": "True", "Numpy": "1.23.5", "Gym": "0.21.0"}}

+ {"policy_class": {":type:": "<class 'abc.ABCMeta'>", ":serialized:": "gAWVOwAAAAAAAACMIXN0YWJsZV9iYXNlbGluZXMzLmNvbW1vbi5wb2xpY2llc5SMEUFjdG9yQ3JpdGljUG9saWN5lJOULg==", "__module__": "stable_baselines3.common.policies", "__doc__": "\n Policy class for actor-critic algorithms (has both policy and value prediction).\n Used by A2C, PPO and the likes.\n\n :param observation_space: Observation space\n :param action_space: Action space\n :param lr_schedule: Learning rate schedule (could be constant)\n :param net_arch: The specification of the policy and value networks.\n :param activation_fn: Activation function\n :param ortho_init: Whether to use or not orthogonal initialization\n :param use_sde: Whether to use State Dependent Exploration or not\n :param log_std_init: Initial value for the log standard deviation\n :param full_std: Whether to use (n_features x n_actions) parameters\n for the std instead of only (n_features,) when using gSDE\n :param use_expln: Use ``expln()`` function instead of ``exp()`` to ensure\n a positive standard deviation (cf paper). It allows to keep variance\n above zero and prevent it from growing too fast. In practice, ``exp()`` is usually enough.\n :param squash_output: Whether to squash the output using a tanh function,\n this allows to ensure boundaries when using gSDE.\n :param features_extractor_class: Features extractor to use.\n :param features_extractor_kwargs: Keyword arguments\n to pass to the features extractor.\n :param share_features_extractor: If True, the features extractor is shared between the policy and value networks.\n :param normalize_images: Whether to normalize images or not,\n dividing by 255.0 (True by default)\n :param optimizer_class: The optimizer to use,\n ``th.optim.Adam`` by default\n :param optimizer_kwargs: Additional keyword arguments,\n excluding the learning rate, to pass to the optimizer\n ", "__init__": "<function ActorCriticPolicy.__init__ at 0x7f3935be4e50>", "_get_constructor_parameters": "<function ActorCriticPolicy._get_constructor_parameters at 0x7f3935be4ee0>", "reset_noise": "<function ActorCriticPolicy.reset_noise at 0x7f3935be4f70>", "_build_mlp_extractor": "<function ActorCriticPolicy._build_mlp_extractor at 0x7f3935be5000>", "_build": "<function ActorCriticPolicy._build at 0x7f3935be5090>", "forward": "<function ActorCriticPolicy.forward at 0x7f3935be5120>", "extract_features": "<function ActorCriticPolicy.extract_features at 0x7f3935be51b0>", "_get_action_dist_from_latent": "<function ActorCriticPolicy._get_action_dist_from_latent at 0x7f3935be5240>", "_predict": "<function ActorCriticPolicy._predict at 0x7f3935be52d0>", "evaluate_actions": "<function ActorCriticPolicy.evaluate_actions at 0x7f3935be5360>", "get_distribution": "<function ActorCriticPolicy.get_distribution at 0x7f3935be53f0>", "predict_values": "<function ActorCriticPolicy.predict_values at 0x7f3935be5480>", "__abstractmethods__": "frozenset()", "_abc_impl": "<_abc._abc_data object at 0x7f3935bec540>"}, "verbose": true, "policy_kwargs": {}, "observation_space": {":type:": "<class 'gym.spaces.box.Box'>", ":serialized:": "gAWVgQEAAAAAAACMDmd5bS5zcGFjZXMuYm94lIwDQm94lJOUKYGUfZQojAVkdHlwZZSMBW51bXB5lGgFk5SMAmY0lImIh5RSlChLA4wBPJROTk5K/////0r/////SwB0lGKMBl9zaGFwZZRLBYWUjANsb3eUjBJudW1weS5jb3JlLm51bWVyaWOUjAtfZnJvbWJ1ZmZlcpSTlCiWFAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAJRoCksFhZSMAUOUdJRSlIwEaGlnaJRoEiiWFAAAAAAAAAAA6P1I2w9JQAAAyEIAAMhCAADIQpRoCksFhZRoFXSUUpSMDWJvdW5kZWRfYmVsb3eUaBIolgUAAAAAAAAAAQEBAQGUaAeMAmIxlImIh5RSlChLA4wBfJROTk5K/////0r/////SwB0lGJLBYWUaBV0lFKUjA1ib3VuZGVkX2Fib3ZllGgSKJYFAAAAAAAAAAEBAQEBlGghSwWFlGgVdJRSlIwKX25wX3JhbmRvbZROdWIu", "dtype": "float32", "_shape": [5], "low": "[0. 0. 0. 0. 0.]", "high": "[5.2000000e+05 3.1415927e+00 1.0000000e+02 1.0000000e+02 1.0000000e+02]", "bounded_below": "[ True True True True True]", "bounded_above": "[ True True True True True]", "_np_random": null}, "action_space": {":type:": "<class 'gym.spaces.discrete.Discrete'>", ":serialized:": "gAWVggAAAAAAAACME2d5bS5zcGFjZXMuZGlzY3JldGWUjAhEaXNjcmV0ZZSTlCmBlH2UKIwBbpRLBIwGX3NoYXBllCmMBWR0eXBllIwFbnVtcHmUaAeTlIwCaTiUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYowKX25wX3JhbmRvbZROdWIu", "n": 4, "_shape": [], "dtype": "int64", "_np_random": null}, "n_envs": 4, "num_timesteps": 106496, "_total_timesteps": 100000, "_num_timesteps_at_start": 0, "seed": null, "action_noise": null, "start_time": 1681154414443284681, "learning_rate": 0.0003, "tensorboard_log": null, "lr_schedule": {":type:": "<class 'function'>", ":serialized:": "gAWV4QIAAAAAAACMF2Nsb3VkcGlja2xlLmNsb3VkcGlja2xllIwOX21ha2VfZnVuY3Rpb26Uk5QoaACMDV9idWlsdGluX3R5cGWUk5SMCENvZGVUeXBllIWUUpQoSwFLAEsASwFLAUsTQwSIAFMAlE6FlCmMAV+UhZSMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZSMBGZ1bmOUS4JDAgQBlIwDdmFslIWUKXSUUpR9lCiMC19fcGFja2FnZV9flIwYc3RhYmxlX2Jhc2VsaW5lczMuY29tbW9ulIwIX19uYW1lX1+UjB5zdGFibGVfYmFzZWxpbmVzMy5jb21tb24udXRpbHOUjAhfX2ZpbGVfX5SMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZR1Tk5oAIwQX21ha2VfZW1wdHlfY2VsbJSTlClSlIWUdJRSlIwcY2xvdWRwaWNrbGUuY2xvdWRwaWNrbGVfZmFzdJSMEl9mdW5jdGlvbl9zZXRzdGF0ZZSTlGgffZR9lChoFmgNjAxfX3F1YWxuYW1lX1+UjBljb25zdGFudF9mbi48bG9jYWxzPi5mdW5jlIwPX19hbm5vdGF0aW9uc19flH2UjA5fX2t3ZGVmYXVsdHNfX5ROjAxfX2RlZmF1bHRzX1+UTowKX19tb2R1bGVfX5RoF4wHX19kb2NfX5ROjAtfX2Nsb3N1cmVfX5RoAIwKX21ha2VfY2VsbJSTlEc/M6kqMFUyYYWUUpSFlIwXX2Nsb3VkcGlja2xlX3N1Ym1vZHVsZXOUXZSMC19fZ2xvYmFsc19flH2UdYaUhlIwLg=="}, "_last_obs": {":type:": "<class 'numpy.ndarray'>", ":serialized:": "gAWVxQAAAAAAAACMEm51bXB5LmNvcmUubnVtZXJpY5SMC19mcm9tYnVmZmVylJOUKJZQAAAAAAAAAJT0zEKAbKC+AADIQgAAyEIAAMhC/YsaQ1AW9b4AAMhCAADIQgAAyEJkBrZCdi5YPQAAyEIAAMhCAADIQpznq0LSUdq/AADIQgAAyEIAAMhClIwFbnVtcHmUjAVkdHlwZZSTlIwCZjSUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYksESwWGlIwBQ5R0lFKULg=="}, "_last_episode_starts": {":type:": "<class 'numpy.ndarray'>", ":serialized:": "gAWVdwAAAAAAAACMEm51bXB5LmNvcmUubnVtZXJpY5SMC19mcm9tYnVmZmVylJOUKJYEAAAAAAAAAAAAAACUjAVudW1weZSMBWR0eXBllJOUjAJiMZSJiIeUUpQoSwOMAXyUTk5OSv////9K/////0sAdJRiSwSFlIwBQ5R0lFKULg=="}, "_last_original_obs": null, "_episode_num": 0, "use_sde": false, "sde_sample_freq": -1, "_current_progress_remaining": -0.0649599999999999, "ep_info_buffer": {":type:": "<class 'collections.deque'>", ":serialized:": "gAWVehAAAAAAAACMC2NvbGxlY3Rpb25zlIwFZGVxdWWUk5QpS2SGlFKUKH2UKIwBcpSMFW51bXB5LmNvcmUubXVsdGlhcnJheZSMBnNjYWxhcpSTlIwFbnVtcHmUjAVkdHlwZZSTlIwCZjiUiYiHlFKUKEsDjAE8lE5OTkr/////Sv////9LAHSUYkMIBg/TvrmPI8CUhpRSlIwBbJRN9QGMAXSUR0BQNnTNMXabdX2UKGgGaAloD0MIyO4CJQV2DsCUhpRSlGgVTfUBaBZHQFBDaqjrRjV1fZQoaAZoCWgPQwgCEk2giM9AwJSGlFKUaBVN9QFoFkdAUEtdRiw0O3V9lChoBmgJaA9DCCBdbFopdDfAlIaUUpRoFU31AWgWR0BQZ4K+i8FqdX2UKGgGaAloD0MI0xVsI55sGUCUhpRSlGgVTfUBaBZHQFBow4sEq2B1fZQoaAZoCWgPQwihgVg28xmQQJSGlFKUaBVLU2gWR0BQc3h4t6HCdX2UKGgGaAloD0MIJ6Wg20tiR0CUhpRSlGgVTfUBaBZHQFB5utfXwsp1fZQoaAZoCWgPQwgDJQUWwAA1QJSGlFKUaBVN9QFoFkdAUH7ZqVQhwHV9lChoBmgJaA9DCKuTMxR3sFVAlIaUUpRoFU31AWgWR0BQn4aHbh3rdX2UKGgGaAloD0MI1edqK/YNQkCUhpRSlGgVTfUBaBZHQFCmwG4ZuQ91fZQoaAZoCWgPQwiwrgrUomuPQJSGlFKUaBVN5AFoFkdAUKvvG6wt8XV9lChoBmgJaA9DCGpsrwW9czJAlIaUUpRoFU31AWgWR0BQtMrAgxJvdX2UKGgGaAloD0MIueAM/n6dj0CUhpRSlGgVS4doFkdAULiqDK5kLHV9lChoBmgJaA9DCDv7yoOUB5BAlIaUUpRoFU0iAWgWR0BSTcNQTEiudX2UKGgGaAloD0MI8PyiBP3lE8CUhpRSlGgVTfUBaBZHQFJN2g3974V1fZQoaAZoCWgPQwiZKa2/Jew6QJSGlFKUaBVN9QFoFkdAUlcwlByCF3V9lChoBmgJaA9DCEOQgxJmZkTAlIaUUpRoFU31AWgWR0BSa9et0V8DdX2UKGgGaAloD0MI5ggZyJP0j0CUhpRSlGgVTVIBaBZHQFJ7uWrwOON1fZQoaAZoCWgPQwgE/1vJjlNCwJSGlFKUaBVN9QFoFkdAUoJhYvFm4HV9lChoBmgJaA9DCIJvmj47sExAlIaUUpRoFU31AWgWR0BSgn2ys0YTdX2UKGgGaAloD0MIjV4NUBomM8CUhpRSlGgVTfUBaBZHQFKam7rcCYF1fZQoaAZoCWgPQwh9rrZif3E5wJSGlFKUaBVN9QFoFkdAUqn8AJb+tXV9lChoBmgJaA9DCOCAlq5gm+g/lIaUUpRoFU31AWgWR0BSskI1LrX2dX2UKGgGaAloD0MIJezbSUQkMsCUhpRSlGgVTfUBaBZHQFKyYr8R+Sd1fZQoaAZoCWgPQwgjvD0IAZEqQJSGlFKUaBVN9QFoFkdAUsiPyTY/V3V9lChoBmgJaA9DCOW4UzpY9UvAlIaUUpRoFU31AWgWR0BS1a9f1HvudX2UKGgGaAloD0MIlMFR8uqsHUCUhpRSlGgVTfUBaBZHQFLazImw7kp1fZQoaAZoCWgPQwgi/fZ14PwjwJSGlFKUaBVN9QFoFkdAUtrjENvwVnV9lChoBmgJaA9DCPEpAMYzsEHAlIaUUpRoFU31AWgWR0BS8XgDRtxddX2UKGgGaAloD0MIZ/D3i1nej0CUhpRSlGgVTXcBaBZHQFL6Eovzvql1fZQoaAZoCWgPQwhaSwFp/wVGwJSGlFKUaBVN9QFoFkdAVEbmwJPZZnV9lChoBmgJaA9DCFJ+Uu3TQTfAlIaUUpRoFU31AWgWR0BUS/wy6+WXdX2UKGgGaAloD0MI9kArMMQWkECUhpRSlGgVS/poFkdAVFnUQTVUdnV9lChoBmgJaA9DCPbQPlbweyzAlIaUUpRoFU31AWgWR0BUX9HUc4o7dX2UKGgGaAloD0MIjNr9KsAvMUCUhpRSlGgVTfUBaBZHQFRob2lEZzh1fZQoaAZoCWgPQwgvppnu5YeQQJSGlFKUaBVNsQFoFkdAVG5KjBVMmHV9lChoBmgJaA9DCM7F3/bkjo9AlIaUUpRoFU3WAWgWR0BUgLrs0HhTdX2UKGgGaAloD0MIvHX+7bKHJ8CUhpRSlGgVTfUBaBZHQFSOoFFDv3J1fZQoaAZoCWgPQwj8+4wL1w6QQJSGlFKUaBVLK2gWR0BUkemWMS9NdX2UKGgGaAloD0MI6wHzkClPGcCUhpRSlGgVTfUBaBZHQFSaP8AJb+t1fZQoaAZoCWgPQwgZH2Yv234VQJSGlFKUaBVN9QFoFkdAVKFqREF4cHV9lChoBmgJaA9DCKG9+njoCxXAlIaUUpRoFU31AWgWR0BUvnlr/KhddX2UKGgGaAloD0MIrDjVWpgVJ8CUhpRSlGgVTfUBaBZHQFTPY3vQWvd1fZQoaAZoCWgPQwhOmZtvBA2QQJSGlFKUaBVLMWgWR0BU1MyFfzBidX2UKGgGaAloD0MI5sqg2uD4MUCUhpRSlGgVTfUBaBZHQFTWxsEaESN1fZQoaAZoCWgPQwhCCp5CrlQKQJSGlFKUaBVN9QFoFkdAVNytvGZNPHV9lChoBmgJaA9DCMwLsI9OjRZAlIaUUpRoFU31AWgWR0BU84pDu0CzdX2UKGgGaAloD0MIfentz0VjGECUhpRSlGgVTfUBaBZHQFUJFqzqrzZ1fZQoaAZoCWgPQwiID+z4L7wxQJSGlFKUaBVN9QFoFkdAVQrGaQV9GHV9lChoBmgJaA9DCETC9/4GvRXAlIaUUpRoFU31AWgWR0BVDxUBGQS0dX2UKGgGaAloD0MISN+kaVA0AMCUhpRSlGgVTfUBaBZHQFazAavRqoJ1fZQoaAZoCWgPQwj8G7RXHwM4wJSGlFKUaBVN9QFoFkdAVszhzeXRgXV9lChoBmgJaA9DCCfaVUj5gTrAlIaUUpRoFU31AWgWR0BWz6lxffGddX2UKGgGaAloD0MImu0KfbCqSECUhpRSlGgVTfUBaBZHQFbXalk6Lfl1fZQoaAZoCWgPQwhwd9Zuu6ASwJSGlFKUaBVN9QFoFkdAVur+ERJ2+3V9lChoBmgJaA9DCKTjamRX5jbAlIaUUpRoFU31AWgWR0BW/Ol41P30dX2UKGgGaAloD0MIthDkoIQlO8CUhpRSlGgVTfUBaBZHQFb+nXNC7bt1fZQoaAZoCWgPQwggmKPH7001wJSGlFKUaBVN9QFoFkdAVwWbF0gbInV9lChoBmgJaA9DCA6/m25ZKZBAlIaUUpRoFUv1aBZHQFcZV5a/yoZ1fZQoaAZoCWgPQwgly0kofW04wJSGlFKUaBVN9QFoFkdAVx1rk8zQ/3V9lChoBmgJaA9DCO/Lme0KzRTAlIaUUpRoFU31AWgWR0BXMqAjIJZ4dX2UKGgGaAloD0MIATPfwU+8GkCUhpRSlGgVTfUBaBZHQFc3AHVwxWV1fZQoaAZoCWgPQwjpfk5Bfg4rwJSGlFKUaBVN9QFoFkdAV0Vq1w5vL3V9lChoBmgJaA9DCDvI68GkmBHAlIaUUpRoFU31AWgWR0BXSYACGN70dX2UKGgGaAloD0MItAJDVreGMMCUhpRSlGgVTfUBaBZHQFdetRvWH1x1fZQoaAZoCWgPQwiCAYQPJYIrQJSGlFKUaBVN9QFoFkdAV2MIldC3PXV9lChoBmgJaA9DCJdxUwPNBynAlIaUUpRoFU31AWgWR0BZAPx6OYICdX2UKGgGaAloD0MIi3CTUWVqQcCUhpRSlGgVTfUBaBZHQFkHhh6Skj51fZQoaAZoCWgPQwgBNEqX/tU7wJSGlFKUaBVN9QFoFkdAWRiuMdcSoXV9lChoBmgJaA9DCNek2xK5gABAlIaUUpRoFU31AWgWR0BZH8zVMEiddX2UKGgGaAloD0MIuhPsv84FIkCUhpRSlGgVTfUBaBZHQFkwglF+d9V1fZQoaAZoCWgPQwiWtOIbCmVKQJSGlFKUaBVN9QFoFkdAWTceS0Sh8XV9lChoBmgJaA9DCMLDtG/u049AlIaUUpRoFU0UAWgWR0BZS9bcGkeqdX2UKGgGaAloD0MIa2RXWkYKPkCUhpRSlGgVTfUBaBZHQFlMAymALAp1fZQoaAZoCWgPQwgMkdPX8402QJSGlFKUaBVN9QFoFkdAWVBhuwX67HV9lChoBmgJaA9DCHszar5KtjzAlIaUUpRoFU31AWgWR0BZY3uJDVpcdX2UKGgGaAloD0MITaPJxRhYMECUhpRSlGgVTfUBaBZHQFl0SNOuaF51fZQoaAZoCWgPQwjrrYGtEiQpwJSGlFKUaBVN9QFoFkdAWXR01ZTya3V9lChoBmgJaA9DCObpXFFKCN+/lIaUUpRoFU31AWgWR0BZeyiudPLxdX2UKGgGaAloD0MIcmpnmNrCJkCUhpRSlGgVTfUBaBZHQFmSJ/oaDPJ1fZQoaAZoCWgPQwi+o8aEmA84QJSGlFKUaBVN9QFoFkdAWarY8Md92HV9lChoBmgJaA9DCPfoDfeRV0LAlIaUUpRoFU31AWgWR0BZqw8B+4LDdX2UKGgGaAloD0MIAruaPGW1GUCUhpRSlGgVTfUBaBZHQFmvWTot+Th1fZQoaAZoCWgPQwgkSKXY0YAmwJSGlFKUaBVN9QFoFkdAW0pS2phnanV9lChoBmgJaA9DCJ595UF68j3AlIaUUpRoFU31AWgWR0BbYYy44Ia+dX2UKGgGaAloD0MIct7/xwmnTsCUhpRSlGgVTfUBaBZHQFth0Xxe9jB1fZQoaAZoCWgPQwh4fHvXAJ6PQJSGlFKUaBVN1gFoFkdAW2PZbpu/DnV9lChoBmgJaA9DCGgHXFdMUpBAlIaUUpRoFUupaBZHQFtwtelbeM11fZQoaAZoCWgPQwjCE3r9SfwMQJSGlFKUaBVN9QFoFkdAW3b7k4m1IHV9lChoBmgJaA9DCOW5vg8H8SHAlIaUUpRoFU31AWgWR0BbimvKU3XJdX2UKGgGaAloD0MI9l0R/G9pQ0CUhpRSlGgVTfUBaBZHQFuKqzqrzXl1fZQoaAZoCWgPQwj7dac7TxwrQJSGlFKUaBVN9QFoFkdAW5nWsijcmHV9lChoBmgJaA9DCAx5BDdS+EVAlIaUUpRoFU31AWgWR0Bboajvd/KAdX2UKGgGaAloD0MIqn8QyZAj8j+UhpRSlGgVTfUBaBZHQFu0Ttb9qDd1fZQoaAZoCWgPQwghc2VQbeAtQJSGlFKUaBVN9QFoFkdAW7R7RfF72XV9lChoBmgJaA9DCOykvizthCRAlIaUUpRoFU31AWgWR0BbxEGFBY3edX2UKGgGaAloD0MIn1p9dVVg/D+UhpRSlGgVTfUBaBZHQFvKhpQDV6N1fZQoaAZoCWgPQwi5bHTOT19DQJSGlFKUaBVN9QFoFkdAW9uESM98qnV9lChoBmgJaA9DCCmWW1oNITBAlIaUUpRoFU31AWgWR0Bb27C79Q40dX2UKGgGaAloD0MIycnErYJAQkCUhpRSlGgVTfUBaBZHQFvwMwlByCF1ZS4="}, "ep_success_buffer": {":type:": "<class 'collections.deque'>", ":serialized:": "gAWVIAAAAAAAAACMC2NvbGxlY3Rpb25zlIwFZGVxdWWUk5QpS2SGlFKULg=="}, "_n_updates": 130, "n_steps": 2048, "gamma": 0.99, "gae_lambda": 0.95, "ent_coef": 0.0, "vf_coef": 0.5, "max_grad_norm": 0.5, "batch_size": 64, "n_epochs": 10, "clip_range": {":type:": "<class 'function'>", ":serialized:": "gAWV4QIAAAAAAACMF2Nsb3VkcGlja2xlLmNsb3VkcGlja2xllIwOX21ha2VfZnVuY3Rpb26Uk5QoaACMDV9idWlsdGluX3R5cGWUk5SMCENvZGVUeXBllIWUUpQoSwFLAEsASwFLAUsTQwSIAFMAlE6FlCmMAV+UhZSMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZSMBGZ1bmOUS4JDAgQBlIwDdmFslIWUKXSUUpR9lCiMC19fcGFja2FnZV9flIwYc3RhYmxlX2Jhc2VsaW5lczMuY29tbW9ulIwIX19uYW1lX1+UjB5zdGFibGVfYmFzZWxpbmVzMy5jb21tb24udXRpbHOUjAhfX2ZpbGVfX5SMVy9ob21lL25vaXNlYnJpZGdlLy5sb2NhbC9saWIvcHl0aG9uMy4xMC9zaXRlLXBhY2thZ2VzL3N0YWJsZV9iYXNlbGluZXMzL2NvbW1vbi91dGlscy5weZR1Tk5oAIwQX21ha2VfZW1wdHlfY2VsbJSTlClSlIWUdJRSlIwcY2xvdWRwaWNrbGUuY2xvdWRwaWNrbGVfZmFzdJSMEl9mdW5jdGlvbl9zZXRzdGF0ZZSTlGgffZR9lChoFmgNjAxfX3F1YWxuYW1lX1+UjBljb25zdGFudF9mbi48bG9jYWxzPi5mdW5jlIwPX19hbm5vdGF0aW9uc19flH2UjA5fX2t3ZGVmYXVsdHNfX5ROjAxfX2RlZmF1bHRzX1+UTowKX19tb2R1bGVfX5RoF4wHX19kb2NfX5ROjAtfX2Nsb3N1cmVfX5RoAIwKX21ha2VfY2VsbJSTlEc/yZmZmZmZmoWUUpSFlIwXX2Nsb3VkcGlja2xlX3N1Ym1vZHVsZXOUXZSMC19fZ2xvYmFsc19flH2UdYaUhlIwLg=="}, "clip_range_vf": null, "normalize_advantage": true, "target_kl": null, "system_info": {"OS": "Linux-5.19.0-35-generic-x86_64-with-glibc2.35 # 36~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Fri Feb 17 15:17:25 UTC 2", "Python": "3.10.9", "Stable-Baselines3": "1.7.0", "PyTorch": "2.0.0", "GPU Enabled": "True", "Numpy": "1.23.5", "Gym": "0.21.0"}}

replay.mp4 CHANGED Viewed

Binary files a/replay.mp4 and b/replay.mp4 differ

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": -13.~~11405273437494~~, "std_reward": 0.0, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2023-04-10T12:17:51.~~807852~~"}


1	+ {"mean_reward": -44.616852722167984, "std_reward": 7.105427357601002e-15, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2023-04-10T12:22:20.495874"}