OpenDILabCommunity
/

Lunarlander-v2-C51

@@ -11,10 +11,10 @@ exp_config = {
             'cfg_type': 'BaseEnvManagerDict'
         },
         'stop_value': 200,
         'collector_env_num': 8,
         'evaluator_env_num': 8,
-        'env_id': 'LunarLander-v2',
-        'n_evaluator_episode': 8
     },
     'policy': {
         'model': {
@@ -59,9 +59,10 @@ exp_config = {
                     'render_freq': -1,
                     'mode': 'train_iter'
                 },
                 'cfg_type': 'InteractionSerialEvaluatorDict',
-                'n_episode': 8,
-                'stop_value': 200
             }
         },
         'other': {
@@ -87,7 +88,7 @@ exp_config = {
         'nstep': 3,
         'cfg_type': 'C51PolicyDict'
     },
-    'exp_name': 'Lunarlander-v2-C51',
     'seed': 0,
     'wandb_logger': {
         'gradient_logger': True,

             'cfg_type': 'BaseEnvManagerDict'
         },
         'stop_value': 200,
+        'n_evaluator_episode': 8,
         'collector_env_num': 8,
         'evaluator_env_num': 8,
+        'env_id': 'LunarLander-v2'
     },
     'policy': {
         'model': {
                     'render_freq': -1,
                     'mode': 'train_iter'
                 },
+                'figure_path': None,
                 'cfg_type': 'InteractionSerialEvaluatorDict',
+                'stop_value': 200,
+                'n_episode': 8
             }
         },
         'other': {
         'nstep': 3,
         'cfg_type': 'C51PolicyDict'
     },
+    'exp_name': 'LunarLander-v2-C51',
     'seed': 0,
     'wandb_logger': {
         'gradient_logger': True,