diff --git "a/sf_log.txt" "b/sf_log.txt"
--- "a/sf_log.txt"
+++ "b/sf_log.txt"
@@ -1,38 +1,36 @@
-[2023-07-08 10:00:48,002][906159] Saving configuration to /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/config.json...
-[2023-07-08 10:00:48,023][906159] Rollout worker 0 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 1 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 2 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 3 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 4 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 5 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 6 uses device cpu
-[2023-07-08 10:00:48,024][906159] Rollout worker 7 uses device cpu
-[2023-07-08 10:00:48,025][906159] In synchronous mode, we only accumulate one batch. Setting num_batches_to_accumulate to 1
-[2023-07-08 10:00:48,036][906159] InferenceWorker_p0-w0: min num requests: 2
-[2023-07-08 10:00:48,055][906159] Starting all processes...
-[2023-07-08 10:00:48,055][906159] Starting process learner_proc0
-[2023-07-08 10:00:48,077][906159] Starting all processes...
-[2023-07-08 10:00:48,080][906159] Starting process inference_proc0-0
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc0
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc1
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc2
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc3
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc4
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc5
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc6
-[2023-07-08 10:00:48,080][906159] Starting process rollout_proc7
-[2023-07-08 10:00:49,926][906413] Worker 0 uses CPU cores [0, 1, 2, 3]
-[2023-07-08 10:00:50,021][906447] Worker 1 uses CPU cores [4, 5, 6, 7]
-[2023-07-08 10:00:50,057][906545] Worker 7 uses CPU cores [28, 29, 30, 31]
-[2023-07-08 10:00:50,209][906506] Worker 5 uses CPU cores [20, 21, 22, 23]
-[2023-07-08 10:00:50,350][906446] Worker 2 uses CPU cores [8, 9, 10, 11]
-[2023-07-08 10:00:50,499][906400] Starting seed is not provided
-[2023-07-08 10:00:50,499][906400] Initializing actor-critic model on device cpu
-[2023-07-08 10:00:50,500][906400] RunningMeanStd input shape: (39,)
-[2023-07-08 10:00:50,500][906400] RunningMeanStd input shape: (1,)
-[2023-07-08 10:00:50,545][906513] Worker 6 uses CPU cores [24, 25, 26, 27]
-[2023-07-08 10:00:50,554][906400] Created Actor Critic model with architecture:
-[2023-07-08 10:00:50,554][906400] ActorCriticSharedWeights(
+[2023-07-09 02:26:05,424][1151233] Saving configuration to /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/config.json...
+[2023-07-09 02:26:05,447][1151233] Rollout worker 0 uses device cpu
+[2023-07-09 02:26:05,447][1151233] Rollout worker 1 uses device cpu
+[2023-07-09 02:26:05,447][1151233] Rollout worker 2 uses device cpu
+[2023-07-09 02:26:05,447][1151233] Rollout worker 3 uses device cpu
+[2023-07-09 02:26:05,448][1151233] Rollout worker 4 uses device cpu
+[2023-07-09 02:26:05,448][1151233] Rollout worker 5 uses device cpu
+[2023-07-09 02:26:05,448][1151233] Rollout worker 6 uses device cpu
+[2023-07-09 02:26:05,448][1151233] Rollout worker 7 uses device cpu
+[2023-07-09 02:26:05,448][1151233] In synchronous mode, we only accumulate one batch. Setting num_batches_to_accumulate to 1
+[2023-07-09 02:26:05,464][1151233] InferenceWorker_p0-w0: min num requests: 2
+[2023-07-09 02:26:05,487][1151233] Starting all processes...
+[2023-07-09 02:26:05,487][1151233] Starting process learner_proc0
+[2023-07-09 02:26:05,495][1151233] Starting all processes...
+[2023-07-09 02:26:05,499][1151233] Starting process inference_proc0-0
+[2023-07-09 02:26:05,499][1151233] Starting process rollout_proc0
+[2023-07-09 02:26:05,499][1151233] Starting process rollout_proc1
+[2023-07-09 02:26:05,500][1151233] Starting process rollout_proc2
+[2023-07-09 02:26:05,500][1151233] Starting process rollout_proc3
+[2023-07-09 02:26:05,500][1151233] Starting process rollout_proc4
+[2023-07-09 02:26:05,500][1151233] Starting process rollout_proc5
+[2023-07-09 02:26:05,500][1151233] Starting process rollout_proc6
+[2023-07-09 02:26:05,502][1151233] Starting process rollout_proc7
+[2023-07-09 02:26:07,662][1151489] Worker 1 uses CPU cores [4, 5, 6, 7]
+[2023-07-09 02:26:07,681][1151522] Worker 3 uses CPU cores [12, 13, 14, 15]
+[2023-07-09 02:26:07,833][1151488] Worker 0 uses CPU cores [0, 1, 2, 3]
+[2023-07-09 02:26:07,877][1151474] Starting seed is not provided
+[2023-07-09 02:26:07,878][1151474] Initializing actor-critic model on device cpu
+[2023-07-09 02:26:07,878][1151474] RunningMeanStd input shape: (39,)
+[2023-07-09 02:26:07,878][1151474] RunningMeanStd input shape: (1,)
+[2023-07-09 02:26:07,900][1151521] Worker 2 uses CPU cores [8, 9, 10, 11]
+[2023-07-09 02:26:07,956][1151474] Created Actor Critic model with architecture:
+[2023-07-09 02:26:07,957][1151474] ActorCriticSharedWeights(
   (obs_normalizer): ObservationNormalizer(
     (running_mean_std): RunningMeanStdDictInPlace(
       (running_mean_std): ModuleDict(
@@ -63,1207 +61,1171 @@
     (distribution_linear): Linear(in_features=64, out_features=4, bias=True)
   )
 )
-[2023-07-08 10:00:50,557][906448] Worker 3 uses CPU cores [12, 13, 14, 15]
-[2023-07-08 10:00:50,692][906449] Worker 4 uses CPU cores [16, 17, 18, 19]
-[2023-07-08 10:00:50,848][906400] Using optimizer <class 'torch.optim.adam.Adam'>
-[2023-07-08 10:00:50,849][906400] No checkpoints found
-[2023-07-08 10:00:50,849][906400] Did not load from checkpoint, starting from scratch!
-[2023-07-08 10:00:50,849][906400] Initialized policy 0 weights for model version 0
-[2023-07-08 10:00:50,850][906400] LearnerWorker_p0 finished initialization!
-[2023-07-08 10:00:50,852][906414] RunningMeanStd input shape: (39,)
-[2023-07-08 10:00:50,853][906414] RunningMeanStd input shape: (1,)
-[2023-07-08 10:00:50,945][906159] Inference worker 0-0 is ready!
-[2023-07-08 10:00:50,945][906159] All inference workers are ready! Signal rollout workers to start!
-[2023-07-08 10:00:55,077][906159] Fps is (10 sec: nan, 60 sec: nan, 300 sec: nan). Total num frames: 0. Throughput: 0: nan. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
-[2023-07-08 10:00:55,766][906413] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,784][906413] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,785][906446] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,803][906446] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,805][906545] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,810][906448] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,811][906506] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,811][906513] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,818][906447] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,821][906449] Decorrelating experience for 0 frames...
-[2023-07-08 10:00:55,822][906545] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,827][906448] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,829][906513] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,829][906506] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,832][906413] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,835][906447] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,838][906449] Decorrelating experience for 64 frames...
-[2023-07-08 10:00:55,851][906446] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,871][906545] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,875][906448] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,876][906513] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,877][906506] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,883][906447] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,886][906449] Decorrelating experience for 128 frames...
-[2023-07-08 10:00:55,927][906413] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,945][906446] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,966][906545] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,970][906448] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,971][906513] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,974][906506] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,978][906447] Decorrelating experience for 192 frames...
-[2023-07-08 10:00:55,982][906449] Decorrelating experience for 192 frames...
-[2023-07-08 10:01:00,077][906159] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 0.0. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
-[2023-07-08 10:01:00,079][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000000_0.pth...
-[2023-07-08 10:01:00,736][906413] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,740][906446] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,782][906448] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,783][906545] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,787][906513] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,799][906506] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,823][906447] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,827][906449] Decorrelating experience for 256 frames...
-[2023-07-08 10:01:00,911][906413] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:00,912][906446] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:00,955][906448] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:00,958][906545] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:00,960][906513] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:00,975][906506] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:00,996][906447] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:01,002][906449] Decorrelating experience for 320 frames...
-[2023-07-08 10:01:01,132][906446] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,134][906413] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,177][906448] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,180][906545] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,182][906513] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,197][906506] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,217][906447] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,226][906449] Decorrelating experience for 384 frames...
-[2023-07-08 10:01:01,381][906446] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,386][906413] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,428][906448] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,432][906545] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,433][906513] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,451][906506] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,470][906447] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:01,479][906449] Decorrelating experience for 448 frames...
-[2023-07-08 10:01:05,077][906159] Fps is (10 sec: 2457.6, 60 sec: 2457.6, 300 sec: 2457.6). Total num frames: 24576. Throughput: 0: 819.2. Samples: 8192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:05,077][906159] Avg episode reward: [(0, '3.332')]
-[2023-07-08 10:01:06,517][906414] Updated weights for policy 0, policy_version 80 (0.0005)
-[2023-07-08 10:01:08,032][906159] Heartbeat connected on Batcher_0
-[2023-07-08 10:01:08,034][906159] Heartbeat connected on LearnerWorker_p0
-[2023-07-08 10:01:08,037][906159] Heartbeat connected on InferenceWorker_p0-w0
-[2023-07-08 10:01:08,042][906159] Heartbeat connected on RolloutWorker_w0
-[2023-07-08 10:01:08,045][906159] Heartbeat connected on RolloutWorker_w1
-[2023-07-08 10:01:08,046][906159] Heartbeat connected on RolloutWorker_w2
-[2023-07-08 10:01:08,048][906159] Heartbeat connected on RolloutWorker_w3
-[2023-07-08 10:01:08,050][906159] Heartbeat connected on RolloutWorker_w4
-[2023-07-08 10:01:08,052][906159] Heartbeat connected on RolloutWorker_w5
-[2023-07-08 10:01:08,055][906159] Heartbeat connected on RolloutWorker_w6
-[2023-07-08 10:01:08,058][906159] Heartbeat connected on RolloutWorker_w7
-[2023-07-08 10:01:10,077][906159] Fps is (10 sec: 6963.3, 60 sec: 4642.1, 300 sec: 4642.1). Total num frames: 69632. Throughput: 0: 4242.7. Samples: 63640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:10,077][906159] Avg episode reward: [(0, '5.973')]
-[2023-07-08 10:01:11,043][906414] Updated weights for policy 0, policy_version 160 (0.0005)
-[2023-07-08 10:01:15,077][906159] Fps is (10 sec: 9420.7, 60 sec: 5939.2, 300 sec: 5939.2). Total num frames: 118784. Throughput: 0: 5942.8. Samples: 118856. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:01:15,077][906159] Avg episode reward: [(0, '14.607')]
-[2023-07-08 10:01:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000232_118784.pth...
-[2023-07-08 10:01:15,084][906400] Saving new best policy, reward=14.607!
-[2023-07-08 10:01:15,375][906414] Updated weights for policy 0, policy_version 240 (0.0005)
-[2023-07-08 10:01:19,884][906414] Updated weights for policy 0, policy_version 320 (0.0005)
-[2023-07-08 10:01:20,077][906159] Fps is (10 sec: 9420.8, 60 sec: 6553.6, 300 sec: 6553.6). Total num frames: 163840. Throughput: 0: 5890.9. Samples: 147272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:20,077][906159] Avg episode reward: [(0, '42.703')]
-[2023-07-08 10:01:20,078][906400] Saving new best policy, reward=42.703!
-[2023-07-08 10:01:24,504][906414] Updated weights for policy 0, policy_version 400 (0.0005)
-[2023-07-08 10:01:25,077][906159] Fps is (10 sec: 9011.3, 60 sec: 6963.2, 300 sec: 6963.2). Total num frames: 208896. Throughput: 0: 6677.3. Samples: 200320. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:01:25,077][906159] Avg episode reward: [(0, '104.801')]
-[2023-07-08 10:01:25,078][906400] Saving new best policy, reward=104.801!
-[2023-07-08 10:01:29,221][906414] Updated weights for policy 0, policy_version 480 (0.0005)
-[2023-07-08 10:01:30,077][906159] Fps is (10 sec: 8601.5, 60 sec: 7138.7, 300 sec: 7138.7). Total num frames: 249856. Throughput: 0: 7213.8. Samples: 252484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:30,077][906159] Avg episode reward: [(0, '86.460')]
-[2023-07-08 10:01:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000488_249856.pth...
-[2023-07-08 10:01:30,141][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000000_0.pth
-[2023-07-08 10:01:34,203][906414] Updated weights for policy 0, policy_version 560 (0.0005)
-[2023-07-08 10:01:35,077][906159] Fps is (10 sec: 8191.9, 60 sec: 7270.4, 300 sec: 7270.4). Total num frames: 290816. Throughput: 0: 6931.5. Samples: 277260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:35,077][906159] Avg episode reward: [(0, '182.774')]
-[2023-07-08 10:01:35,078][906400] Saving new best policy, reward=182.774!
-[2023-07-08 10:01:39,368][906414] Updated weights for policy 0, policy_version 640 (0.0005)
-[2023-07-08 10:01:40,077][906159] Fps is (10 sec: 8192.1, 60 sec: 7372.8, 300 sec: 7372.8). Total num frames: 331776. Throughput: 0: 7217.8. Samples: 324800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:40,077][906159] Avg episode reward: [(0, '244.618')]
-[2023-07-08 10:01:40,078][906400] Saving new best policy, reward=244.618!
-[2023-07-08 10:01:45,024][906414] Updated weights for policy 0, policy_version 720 (0.0005)
-[2023-07-08 10:01:45,077][906159] Fps is (10 sec: 7782.3, 60 sec: 7372.8, 300 sec: 7372.8). Total num frames: 368640. Throughput: 0: 8192.0. Samples: 368640. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:01:45,077][906159] Avg episode reward: [(0, '291.070')]
-[2023-07-08 10:01:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000720_368640.pth...
-[2023-07-08 10:01:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000232_118784.pth
-[2023-07-08 10:01:45,083][906400] Saving new best policy, reward=291.070!
-[2023-07-08 10:01:50,077][906159] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7372.8). Total num frames: 405504. Throughput: 0: 8515.5. Samples: 391388. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:01:50,077][906159] Avg episode reward: [(0, '283.135')]
-[2023-07-08 10:01:50,393][906414] Updated weights for policy 0, policy_version 800 (0.0005)
-[2023-07-08 10:01:55,077][906159] Fps is (10 sec: 7372.9, 60 sec: 7372.8, 300 sec: 7372.8). Total num frames: 442368. Throughput: 0: 8295.5. Samples: 436936. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:01:55,077][906159] Avg episode reward: [(0, '329.599')]
-[2023-07-08 10:01:55,078][906400] Saving new best policy, reward=329.599!
-[2023-07-08 10:01:55,815][906414] Updated weights for policy 0, policy_version 880 (0.0005)
-[2023-07-08 10:02:00,077][906159] Fps is (10 sec: 7372.7, 60 sec: 7987.2, 300 sec: 7372.8). Total num frames: 479232. Throughput: 0: 8039.8. Samples: 480648. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:02:00,078][906159] Avg episode reward: [(0, '358.137')]
-[2023-07-08 10:02:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000936_479232.pth...
-[2023-07-08 10:02:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000488_249856.pth
-[2023-07-08 10:02:00,083][906400] Saving new best policy, reward=358.137!
-[2023-07-08 10:02:01,401][906414] Updated weights for policy 0, policy_version 960 (0.0005)
-[2023-07-08 10:02:05,077][906159] Fps is (10 sec: 7372.8, 60 sec: 8192.0, 300 sec: 7372.8). Total num frames: 516096. Throughput: 0: 7923.0. Samples: 503808. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:02:05,077][906159] Avg episode reward: [(0, '385.836')]
-[2023-07-08 10:02:05,078][906400] Saving new best policy, reward=385.836!
-[2023-07-08 10:02:06,871][906414] Updated weights for policy 0, policy_version 1040 (0.0005)
-[2023-07-08 10:02:10,077][906159] Fps is (10 sec: 7372.9, 60 sec: 8055.5, 300 sec: 7372.8). Total num frames: 552960. Throughput: 0: 7731.0. Samples: 548216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:10,077][906159] Avg episode reward: [(0, '339.545')]
-[2023-07-08 10:02:12,426][906414] Updated weights for policy 0, policy_version 1120 (0.0005)
-[2023-07-08 10:02:15,077][906159] Fps is (10 sec: 7372.8, 60 sec: 7850.7, 300 sec: 7372.8). Total num frames: 589824. Throughput: 0: 7533.8. Samples: 591504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:15,077][906159] Avg episode reward: [(0, '313.340')]
-[2023-07-08 10:02:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001152_589824.pth...
-[2023-07-08 10:02:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000720_368640.pth
-[2023-07-08 10:02:18,318][906414] Updated weights for policy 0, policy_version 1200 (0.0005)
-[2023-07-08 10:02:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 7645.9, 300 sec: 7324.6). Total num frames: 622592. Throughput: 0: 7441.2. Samples: 612112. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:02:20,077][906159] Avg episode reward: [(0, '359.687')]
-[2023-07-08 10:02:24,240][906414] Updated weights for policy 0, policy_version 1280 (0.0005)
-[2023-07-08 10:02:25,077][906159] Fps is (10 sec: 6963.2, 60 sec: 7509.3, 300 sec: 7327.3). Total num frames: 659456. Throughput: 0: 7311.7. Samples: 653828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:25,077][906159] Avg episode reward: [(0, '324.225')]
-[2023-07-08 10:02:30,077][906159] Fps is (10 sec: 6963.1, 60 sec: 7372.8, 300 sec: 7286.6). Total num frames: 692224. Throughput: 0: 7246.3. Samples: 694724. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:30,077][906159] Avg episode reward: [(0, '375.513')]
-[2023-07-08 10:02:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001352_692224.pth...
-[2023-07-08 10:02:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000936_479232.pth
-[2023-07-08 10:02:30,248][906414] Updated weights for policy 0, policy_version 1360 (0.0004)
-[2023-07-08 10:02:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7290.9). Total num frames: 729088. Throughput: 0: 7199.0. Samples: 715344. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:02:35,078][906159] Avg episode reward: [(0, '339.508')]
-[2023-07-08 10:02:36,204][906414] Updated weights for policy 0, policy_version 1440 (0.0005)
-[2023-07-08 10:02:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7255.8). Total num frames: 761856. Throughput: 0: 7097.5. Samples: 756324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:40,077][906159] Avg episode reward: [(0, '361.648')]
-[2023-07-08 10:02:42,244][906414] Updated weights for policy 0, policy_version 1520 (0.0003)
-[2023-07-08 10:02:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 7099.7, 300 sec: 7223.9). Total num frames: 794624. Throughput: 0: 7022.5. Samples: 796660. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:02:45,077][906159] Avg episode reward: [(0, '287.491')]
-[2023-07-08 10:02:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001552_794624.pth...
-[2023-07-08 10:02:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001152_589824.pth
-[2023-07-08 10:02:48,320][906414] Updated weights for policy 0, policy_version 1600 (0.0003)
-[2023-07-08 10:02:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 7031.5, 300 sec: 7194.7). Total num frames: 827392. Throughput: 0: 6959.2. Samples: 816972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:50,077][906159] Avg episode reward: [(0, '338.499')]
-[2023-07-08 10:02:54,531][906414] Updated weights for policy 0, policy_version 1680 (0.0004)
-[2023-07-08 10:02:55,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6963.2, 300 sec: 7168.0). Total num frames: 860160. Throughput: 0: 6847.9. Samples: 856372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:02:55,077][906159] Avg episode reward: [(0, '366.843')]
-[2023-07-08 10:03:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6894.9, 300 sec: 7143.4). Total num frames: 892928. Throughput: 0: 6783.7. Samples: 896768. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:03:00,077][906159] Avg episode reward: [(0, '369.789')]
-[2023-07-08 10:03:00,095][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001752_897024.pth...
-[2023-07-08 10:03:00,098][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001352_692224.pth
-[2023-07-08 10:03:00,684][906414] Updated weights for policy 0, policy_version 1760 (0.0004)
-[2023-07-08 10:03:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 7152.2). Total num frames: 929792. Throughput: 0: 6776.2. Samples: 917040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:05,077][906159] Avg episode reward: [(0, '374.508')]
-[2023-07-08 10:03:06,790][906414] Updated weights for policy 0, policy_version 1840 (0.0005)
-[2023-07-08 10:03:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 7130.1). Total num frames: 962560. Throughput: 0: 6734.6. Samples: 956884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:10,077][906159] Avg episode reward: [(0, '401.715')]
-[2023-07-08 10:03:10,078][906400] Saving new best policy, reward=401.715!
-[2023-07-08 10:03:12,918][906414] Updated weights for policy 0, policy_version 1920 (0.0006)
-[2023-07-08 10:03:15,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 7109.5). Total num frames: 995328. Throughput: 0: 6710.5. Samples: 996696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:15,077][906159] Avg episode reward: [(0, '391.832')]
-[2023-07-08 10:03:15,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001944_995328.pth...
-[2023-07-08 10:03:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001552_794624.pth
-[2023-07-08 10:03:19,083][906414] Updated weights for policy 0, policy_version 2000 (0.0005)
-[2023-07-08 10:03:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 7090.3). Total num frames: 1028096. Throughput: 0: 6690.6. Samples: 1016420. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:20,077][906159] Avg episode reward: [(0, '316.155')]
-[2023-07-08 10:03:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 7072.4). Total num frames: 1060864. Throughput: 0: 6665.5. Samples: 1056272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:25,077][906159] Avg episode reward: [(0, '417.967')]
-[2023-07-08 10:03:25,078][906400] Saving new best policy, reward=417.967!
-[2023-07-08 10:03:25,393][906414] Updated weights for policy 0, policy_version 2080 (0.0005)
-[2023-07-08 10:03:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 7082.1). Total num frames: 1097728. Throughput: 0: 6684.8. Samples: 1097476. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:30,077][906159] Avg episode reward: [(0, '322.268')]
-[2023-07-08 10:03:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002144_1097728.pth...
-[2023-07-08 10:03:30,082][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001752_897024.pth
-[2023-07-08 10:03:31,272][906414] Updated weights for policy 0, policy_version 2160 (0.0005)
-[2023-07-08 10:03:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 7065.6). Total num frames: 1130496. Throughput: 0: 6677.8. Samples: 1117472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:35,077][906159] Avg episode reward: [(0, '398.229')]
-[2023-07-08 10:03:37,511][906414] Updated weights for policy 0, policy_version 2240 (0.0005)
-[2023-07-08 10:03:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 7050.1). Total num frames: 1163264. Throughput: 0: 6670.8. Samples: 1156560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:40,077][906159] Avg episode reward: [(0, '375.098')]
-[2023-07-08 10:03:43,492][906414] Updated weights for policy 0, policy_version 2320 (0.0005)
-[2023-07-08 10:03:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 7035.5). Total num frames: 1196032. Throughput: 0: 6694.6. Samples: 1198024. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:03:45,077][906159] Avg episode reward: [(0, '405.527')]
-[2023-07-08 10:03:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002336_1196032.pth...
-[2023-07-08 10:03:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001944_995328.pth
-[2023-07-08 10:03:49,556][906414] Updated weights for policy 0, policy_version 2400 (0.0005)
-[2023-07-08 10:03:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 7021.7). Total num frames: 1228800. Throughput: 0: 6691.8. Samples: 1218168. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:03:50,077][906159] Avg episode reward: [(0, '272.825')]
-[2023-07-08 10:03:55,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6758.4, 300 sec: 7031.5). Total num frames: 1265664. Throughput: 0: 6713.4. Samples: 1258988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:03:55,077][906159] Avg episode reward: [(0, '350.017')]
-[2023-07-08 10:03:55,566][906414] Updated weights for policy 0, policy_version 2480 (0.0005)
-[2023-07-08 10:04:00,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 7018.5). Total num frames: 1298432. Throughput: 0: 6727.8. Samples: 1299448. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:04:00,077][906159] Avg episode reward: [(0, '338.235')]
-[2023-07-08 10:04:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002536_1298432.pth...
-[2023-07-08 10:04:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002144_1097728.pth
-[2023-07-08 10:04:01,622][906414] Updated weights for policy 0, policy_version 2560 (0.0005)
-[2023-07-08 10:04:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 7006.3). Total num frames: 1331200. Throughput: 0: 6728.1. Samples: 1319184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:05,077][906159] Avg episode reward: [(0, '361.738')]
-[2023-07-08 10:04:07,888][906414] Updated weights for policy 0, policy_version 2640 (0.0005)
-[2023-07-08 10:04:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6994.7). Total num frames: 1363968. Throughput: 0: 6732.2. Samples: 1359220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:10,077][906159] Avg episode reward: [(0, '353.405')]
-[2023-07-08 10:04:14,323][906414] Updated weights for policy 0, policy_version 2720 (0.0005)
-[2023-07-08 10:04:15,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6983.7). Total num frames: 1396736. Throughput: 0: 6658.8. Samples: 1397120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:15,077][906159] Avg episode reward: [(0, '348.776')]
-[2023-07-08 10:04:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002728_1396736.pth...
-[2023-07-08 10:04:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002336_1196032.pth
-[2023-07-08 10:04:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6973.2). Total num frames: 1429504. Throughput: 0: 6647.9. Samples: 1416628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:20,077][906159] Avg episode reward: [(0, '353.014')]
-[2023-07-08 10:04:20,670][906414] Updated weights for policy 0, policy_version 2800 (0.0005)
-[2023-07-08 10:04:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6963.2). Total num frames: 1462272. Throughput: 0: 6639.1. Samples: 1455320. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:04:25,077][906159] Avg episode reward: [(0, '358.294')]
-[2023-07-08 10:04:26,958][906414] Updated weights for policy 0, policy_version 2880 (0.0005)
-[2023-07-08 10:04:30,077][906159] Fps is (10 sec: 6144.0, 60 sec: 6553.6, 300 sec: 6934.6). Total num frames: 1490944. Throughput: 0: 6591.8. Samples: 1494656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:30,077][906159] Avg episode reward: [(0, '399.912')]
-[2023-07-08 10:04:30,090][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002920_1495040.pth...
-[2023-07-08 10:04:30,093][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002536_1298432.pth
-[2023-07-08 10:04:33,260][906414] Updated weights for policy 0, policy_version 2960 (0.0005)
-[2023-07-08 10:04:35,077][906159] Fps is (10 sec: 6144.0, 60 sec: 6553.6, 300 sec: 6926.0). Total num frames: 1523712. Throughput: 0: 6574.0. Samples: 1514000. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:04:35,077][906159] Avg episode reward: [(0, '355.577')]
-[2023-07-08 10:04:39,327][906414] Updated weights for policy 0, policy_version 3040 (0.0005)
-[2023-07-08 10:04:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6621.9, 300 sec: 6935.9). Total num frames: 1560576. Throughput: 0: 6557.2. Samples: 1554064. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:04:40,077][906159] Avg episode reward: [(0, '351.041')]
-[2023-07-08 10:04:45,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6621.9, 300 sec: 6927.6). Total num frames: 1593344. Throughput: 0: 6532.5. Samples: 1593408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:45,077][906159] Avg episode reward: [(0, '390.092')]
-[2023-07-08 10:04:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003112_1593344.pth...
-[2023-07-08 10:04:45,085][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002728_1396736.pth
-[2023-07-08 10:04:45,643][906414] Updated weights for policy 0, policy_version 3120 (0.0004)
-[2023-07-08 10:04:50,077][906159] Fps is (10 sec: 6144.0, 60 sec: 6553.6, 300 sec: 6902.2). Total num frames: 1622016. Throughput: 0: 6512.4. Samples: 1612240. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:04:50,077][906159] Avg episode reward: [(0, '379.979')]
-[2023-07-08 10:04:52,149][906414] Updated weights for policy 0, policy_version 3200 (0.0005)
-[2023-07-08 10:04:55,077][906159] Fps is (10 sec: 6144.0, 60 sec: 6485.3, 300 sec: 6894.9). Total num frames: 1654784. Throughput: 0: 6468.7. Samples: 1650312. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:04:55,077][906159] Avg episode reward: [(0, '368.331')]
-[2023-07-08 10:04:58,564][906414] Updated weights for policy 0, policy_version 3280 (0.0005)
-[2023-07-08 10:05:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6485.3, 300 sec: 6888.0). Total num frames: 1687552. Throughput: 0: 6479.6. Samples: 1688700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:05:00,077][906159] Avg episode reward: [(0, '329.234')]
-[2023-07-08 10:05:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003296_1687552.pth...
-[2023-07-08 10:05:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002920_1495040.pth
-[2023-07-08 10:05:05,008][906414] Updated weights for policy 0, policy_version 3360 (0.0005)
-[2023-07-08 10:05:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6485.3, 300 sec: 6881.3). Total num frames: 1720320. Throughput: 0: 6473.2. Samples: 1707920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:05:05,077][906159] Avg episode reward: [(0, '361.239')]
-[2023-07-08 10:05:10,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6485.3, 300 sec: 6874.9). Total num frames: 1753088. Throughput: 0: 6470.9. Samples: 1746512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:05:10,078][906159] Avg episode reward: [(0, '351.747')]
-[2023-07-08 10:05:11,321][906414] Updated weights for policy 0, policy_version 3440 (0.0005)
-[2023-07-08 10:05:15,077][906159] Fps is (10 sec: 6143.9, 60 sec: 6417.1, 300 sec: 6852.9). Total num frames: 1781760. Throughput: 0: 6458.5. Samples: 1785288. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:05:15,077][906159] Avg episode reward: [(0, '320.539')]
-[2023-07-08 10:05:15,133][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003488_1785856.pth...
-[2023-07-08 10:05:15,135][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003112_1593344.pth
-[2023-07-08 10:05:17,628][906414] Updated weights for policy 0, policy_version 3520 (0.0005)
-[2023-07-08 10:05:20,077][906159] Fps is (10 sec: 6144.1, 60 sec: 6417.1, 300 sec: 6847.3). Total num frames: 1814528. Throughput: 0: 6460.8. Samples: 1804736. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:05:20,077][906159] Avg episode reward: [(0, '313.049')]
-[2023-07-08 10:05:24,124][906414] Updated weights for policy 0, policy_version 3600 (0.0004)
-[2023-07-08 10:05:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6417.1, 300 sec: 6841.8). Total num frames: 1847296. Throughput: 0: 6415.3. Samples: 1842752. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:05:25,077][906159] Avg episode reward: [(0, '302.494')]
-[2023-07-08 10:05:30,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6485.3, 300 sec: 6836.6). Total num frames: 1880064. Throughput: 0: 6424.8. Samples: 1882524. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:05:30,077][906159] Avg episode reward: [(0, '284.819')]
-[2023-07-08 10:05:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003672_1880064.pth...
-[2023-07-08 10:05:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003296_1687552.pth
-[2023-07-08 10:05:30,229][906414] Updated weights for policy 0, policy_version 3680 (0.0004)
-[2023-07-08 10:05:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6485.3, 300 sec: 6831.5). Total num frames: 1912832. Throughput: 0: 6456.4. Samples: 1902780. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:05:35,077][906159] Avg episode reward: [(0, '272.626')]
-[2023-07-08 10:05:36,313][906414] Updated weights for policy 0, policy_version 3760 (0.0005)
-[2023-07-08 10:05:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6485.3, 300 sec: 6841.0). Total num frames: 1949696. Throughput: 0: 6504.5. Samples: 1943016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:05:40,078][906159] Avg episode reward: [(0, '269.178')]
-[2023-07-08 10:05:42,389][906414] Updated weights for policy 0, policy_version 3840 (0.0005)
-[2023-07-08 10:05:45,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6485.3, 300 sec: 6836.1). Total num frames: 1982464. Throughput: 0: 6554.3. Samples: 1983644. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:05:45,077][906159] Avg episode reward: [(0, '287.202')]
-[2023-07-08 10:05:45,079][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003872_1982464.pth...
-[2023-07-08 10:05:45,082][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003488_1785856.pth
-[2023-07-08 10:05:48,511][906414] Updated weights for policy 0, policy_version 3920 (0.0005)
-[2023-07-08 10:05:50,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6553.6, 300 sec: 6831.3). Total num frames: 2015232. Throughput: 0: 6567.5. Samples: 2003456. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:05:50,077][906159] Avg episode reward: [(0, '285.213')]
-[2023-07-08 10:05:54,327][906414] Updated weights for policy 0, policy_version 4000 (0.0005)
-[2023-07-08 10:05:55,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6621.9, 300 sec: 6956.3). Total num frames: 2052096. Throughput: 0: 6649.3. Samples: 2045728. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:05:55,077][906159] Avg episode reward: [(0, '304.238')]
-[2023-07-08 10:06:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6621.9, 300 sec: 6984.0). Total num frames: 2084864. Throughput: 0: 6712.5. Samples: 2087348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:00,077][906159] Avg episode reward: [(0, '311.893')]
-[2023-07-08 10:06:00,079][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004072_2084864.pth...
-[2023-07-08 10:06:00,081][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003672_1880064.pth
-[2023-07-08 10:06:00,275][906414] Updated weights for policy 0, policy_version 4080 (0.0005)
-[2023-07-08 10:06:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6956.3). Total num frames: 2121728. Throughput: 0: 6734.9. Samples: 2107804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:05,077][906159] Avg episode reward: [(0, '306.161')]
-[2023-07-08 10:06:06,239][906414] Updated weights for policy 0, policy_version 4160 (0.0005)
-[2023-07-08 10:06:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6900.7). Total num frames: 2154496. Throughput: 0: 6798.8. Samples: 2148696. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:06:10,077][906159] Avg episode reward: [(0, '329.263')]
-[2023-07-08 10:06:12,280][906414] Updated weights for policy 0, policy_version 4240 (0.0005)
-[2023-07-08 10:06:15,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6758.4, 300 sec: 6859.1). Total num frames: 2187264. Throughput: 0: 6827.5. Samples: 2189760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:15,077][906159] Avg episode reward: [(0, '284.435')]
-[2023-07-08 10:06:15,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004272_2187264.pth...
-[2023-07-08 10:06:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003872_1982464.pth
-[2023-07-08 10:06:18,228][906414] Updated weights for policy 0, policy_version 4320 (0.0005)
-[2023-07-08 10:06:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 2224128. Throughput: 0: 6837.9. Samples: 2210484. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:06:20,077][906159] Avg episode reward: [(0, '320.249')]
-[2023-07-08 10:06:24,191][906414] Updated weights for policy 0, policy_version 4400 (0.0005)
-[2023-07-08 10:06:25,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 2256896. Throughput: 0: 6858.1. Samples: 2251632. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:25,077][906159] Avg episode reward: [(0, '307.508')]
-[2023-07-08 10:06:30,030][906414] Updated weights for policy 0, policy_version 4480 (0.0005)
-[2023-07-08 10:06:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6789.6). Total num frames: 2293760. Throughput: 0: 6890.0. Samples: 2293696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:30,077][906159] Avg episode reward: [(0, '295.314')]
-[2023-07-08 10:06:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004480_2293760.pth...
-[2023-07-08 10:06:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004072_2084864.pth
-[2023-07-08 10:06:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6761.9). Total num frames: 2326528. Throughput: 0: 6907.9. Samples: 2314312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:35,077][906159] Avg episode reward: [(0, '298.630')]
-[2023-07-08 10:06:35,931][906414] Updated weights for policy 0, policy_version 4560 (0.0005)
-[2023-07-08 10:06:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6761.9). Total num frames: 2363392. Throughput: 0: 6907.7. Samples: 2356576. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:06:40,077][906159] Avg episode reward: [(0, '298.306')]
-[2023-07-08 10:06:41,656][906414] Updated weights for policy 0, policy_version 4640 (0.0005)
-[2023-07-08 10:06:45,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6894.9, 300 sec: 6748.0). Total num frames: 2396160. Throughput: 0: 6932.8. Samples: 2399324. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:06:45,077][906159] Avg episode reward: [(0, '290.954')]
-[2023-07-08 10:06:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004680_2396160.pth...
-[2023-07-08 10:06:45,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004272_2187264.pth
-[2023-07-08 10:06:47,584][906414] Updated weights for policy 0, policy_version 4720 (0.0005)
-[2023-07-08 10:06:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6748.0). Total num frames: 2433024. Throughput: 0: 6927.5. Samples: 2419540. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:50,077][906159] Avg episode reward: [(0, '273.305')]
-[2023-07-08 10:06:53,770][906414] Updated weights for policy 0, policy_version 4800 (0.0005)
-[2023-07-08 10:06:55,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6894.9, 300 sec: 6734.1). Total num frames: 2465792. Throughput: 0: 6895.7. Samples: 2459004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:06:55,077][906159] Avg episode reward: [(0, '280.462')]
-[2023-07-08 10:06:59,844][906414] Updated weights for policy 0, policy_version 4880 (0.0005)
-[2023-07-08 10:07:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 2498560. Throughput: 0: 6885.1. Samples: 2499588. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:07:00,077][906159] Avg episode reward: [(0, '308.302')]
-[2023-07-08 10:07:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004880_2498560.pth...
-[2023-07-08 10:07:00,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004480_2293760.pth
-[2023-07-08 10:07:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 2531328. Throughput: 0: 6865.0. Samples: 2519408. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:07:05,078][906159] Avg episode reward: [(0, '289.091')]
-[2023-07-08 10:07:06,024][906414] Updated weights for policy 0, policy_version 4960 (0.0005)
-[2023-07-08 10:07:10,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6826.7, 300 sec: 6692.4). Total num frames: 2564096. Throughput: 0: 6852.6. Samples: 2560000. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:07:10,078][906159] Avg episode reward: [(0, '297.689')]
-[2023-07-08 10:07:12,092][906414] Updated weights for policy 0, policy_version 5040 (0.0005)
-[2023-07-08 10:07:15,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6692.4). Total num frames: 2596864. Throughput: 0: 6812.8. Samples: 2600272. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:07:15,077][906159] Avg episode reward: [(0, '292.018')]
-[2023-07-08 10:07:15,118][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005080_2600960.pth...
-[2023-07-08 10:07:15,121][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004680_2396160.pth
-[2023-07-08 10:07:18,134][906414] Updated weights for policy 0, policy_version 5120 (0.0005)
-[2023-07-08 10:07:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6692.4). Total num frames: 2633728. Throughput: 0: 6807.6. Samples: 2620656. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:07:20,077][906159] Avg episode reward: [(0, '296.777')]
-[2023-07-08 10:07:24,180][906414] Updated weights for policy 0, policy_version 5200 (0.0005)
-[2023-07-08 10:07:25,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6692.4). Total num frames: 2666496. Throughput: 0: 6765.5. Samples: 2661024. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:07:25,077][906159] Avg episode reward: [(0, '300.511')]
-[2023-07-08 10:07:30,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6678.6). Total num frames: 2699264. Throughput: 0: 6714.9. Samples: 2701492. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:07:30,077][906159] Avg episode reward: [(0, '319.673')]
-[2023-07-08 10:07:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005272_2699264.pth...
-[2023-07-08 10:07:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004880_2498560.pth
-[2023-07-08 10:07:30,285][906414] Updated weights for policy 0, policy_version 5280 (0.0005)
-[2023-07-08 10:07:35,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6678.6). Total num frames: 2732032. Throughput: 0: 6720.0. Samples: 2721940. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:07:35,077][906159] Avg episode reward: [(0, '321.584')]
-[2023-07-08 10:07:36,291][906414] Updated weights for policy 0, policy_version 5360 (0.0006)
-[2023-07-08 10:07:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 2768896. Throughput: 0: 6737.5. Samples: 2762192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:07:40,077][906159] Avg episode reward: [(0, '285.863')]
-[2023-07-08 10:07:42,368][906414] Updated weights for policy 0, policy_version 5440 (0.0006)
-[2023-07-08 10:07:45,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 2801664. Throughput: 0: 6760.1. Samples: 2803792. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:07:45,078][906159] Avg episode reward: [(0, '320.510')]
-[2023-07-08 10:07:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005472_2801664.pth...
-[2023-07-08 10:07:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005080_2600960.pth
-[2023-07-08 10:07:48,255][906414] Updated weights for policy 0, policy_version 5520 (0.0006)
-[2023-07-08 10:07:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6692.4). Total num frames: 2834432. Throughput: 0: 6781.7. Samples: 2824584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:07:50,077][906159] Avg episode reward: [(0, '310.386')]
-[2023-07-08 10:07:54,432][906414] Updated weights for policy 0, policy_version 5600 (0.0005)
-[2023-07-08 10:07:55,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 2871296. Throughput: 0: 6750.1. Samples: 2863756. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:07:55,078][906159] Avg episode reward: [(0, '318.179')]
-[2023-07-08 10:08:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 2904064. Throughput: 0: 6792.2. Samples: 2905920. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:08:00,077][906159] Avg episode reward: [(0, '338.853')]
-[2023-07-08 10:08:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005672_2904064.pth...
-[2023-07-08 10:08:00,082][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005272_2699264.pth
-[2023-07-08 10:08:00,343][906414] Updated weights for policy 0, policy_version 5680 (0.0005)
-[2023-07-08 10:08:05,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 2936832. Throughput: 0: 6792.8. Samples: 2926332. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:05,077][906159] Avg episode reward: [(0, '321.699')]
-[2023-07-08 10:08:06,405][906414] Updated weights for policy 0, policy_version 5760 (0.0005)
-[2023-07-08 10:08:10,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 2973696. Throughput: 0: 6778.0. Samples: 2966032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:10,077][906159] Avg episode reward: [(0, '316.100')]
-[2023-07-08 10:08:12,414][906414] Updated weights for policy 0, policy_version 5840 (0.0005)
-[2023-07-08 10:08:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 3006464. Throughput: 0: 6818.6. Samples: 3008328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:15,077][906159] Avg episode reward: [(0, '332.547')]
-[2023-07-08 10:08:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005872_3006464.pth...
-[2023-07-08 10:08:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005472_2801664.pth
-[2023-07-08 10:08:18,188][906414] Updated weights for policy 0, policy_version 5920 (0.0005)
-[2023-07-08 10:08:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6720.2). Total num frames: 3043328. Throughput: 0: 6842.9. Samples: 3029872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:20,077][906159] Avg episode reward: [(0, '326.096')]
-[2023-07-08 10:08:23,873][906414] Updated weights for policy 0, policy_version 6000 (0.0005)
-[2023-07-08 10:08:25,077][906159] Fps is (10 sec: 7372.8, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 3080192. Throughput: 0: 6899.0. Samples: 3072648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:25,077][906159] Avg episode reward: [(0, '302.389')]
-[2023-07-08 10:08:29,951][906414] Updated weights for policy 0, policy_version 6080 (0.0005)
-[2023-07-08 10:08:30,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 3112960. Throughput: 0: 6872.0. Samples: 3113032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:30,078][906159] Avg episode reward: [(0, '316.164')]
-[2023-07-08 10:08:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006080_3112960.pth...
-[2023-07-08 10:08:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005672_2904064.pth
-[2023-07-08 10:08:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 3145728. Throughput: 0: 6871.1. Samples: 3133784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:35,077][906159] Avg episode reward: [(0, '302.421')]
-[2023-07-08 10:08:35,856][906414] Updated weights for policy 0, policy_version 6160 (0.0005)
-[2023-07-08 10:08:40,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6894.9, 300 sec: 6734.1). Total num frames: 3182592. Throughput: 0: 6914.8. Samples: 3174924. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:40,078][906159] Avg episode reward: [(0, '319.579')]
-[2023-07-08 10:08:41,847][906414] Updated weights for policy 0, policy_version 6240 (0.0006)
-[2023-07-08 10:08:45,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6734.1). Total num frames: 3215360. Throughput: 0: 6913.6. Samples: 3217032. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:45,077][906159] Avg episode reward: [(0, '316.802')]
-[2023-07-08 10:08:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006280_3215360.pth...
-[2023-07-08 10:08:45,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005872_3006464.pth
-[2023-07-08 10:08:47,621][906414] Updated weights for policy 0, policy_version 6320 (0.0004)
-[2023-07-08 10:08:50,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6963.2, 300 sec: 6734.1). Total num frames: 3252224. Throughput: 0: 6935.6. Samples: 3238432. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:50,077][906159] Avg episode reward: [(0, '312.318')]
-[2023-07-08 10:08:53,395][906414] Updated weights for policy 0, policy_version 6400 (0.0005)
-[2023-07-08 10:08:55,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6734.1). Total num frames: 3284992. Throughput: 0: 6998.6. Samples: 3280968. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:08:55,077][906159] Avg episode reward: [(0, '304.886')]
-[2023-07-08 10:08:59,127][906414] Updated weights for policy 0, policy_version 6480 (0.0005)
-[2023-07-08 10:09:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6748.0). Total num frames: 3321856. Throughput: 0: 7012.4. Samples: 3323888. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:09:00,077][906159] Avg episode reward: [(0, '278.958')]
-[2023-07-08 10:09:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006488_3321856.pth...
-[2023-07-08 10:09:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006080_3112960.pth
-[2023-07-08 10:09:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6748.0). Total num frames: 3354624. Throughput: 0: 6971.7. Samples: 3343600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:05,077][906159] Avg episode reward: [(0, '300.746')]
-[2023-07-08 10:09:05,203][906414] Updated weights for policy 0, policy_version 6560 (0.0005)
-[2023-07-08 10:09:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6761.9). Total num frames: 3391488. Throughput: 0: 6916.6. Samples: 3383896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:10,077][906159] Avg episode reward: [(0, '315.676')]
-[2023-07-08 10:09:11,242][906414] Updated weights for policy 0, policy_version 6640 (0.0005)
-[2023-07-08 10:09:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6761.9). Total num frames: 3424256. Throughput: 0: 6917.7. Samples: 3424328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:15,077][906159] Avg episode reward: [(0, '302.819')]
-[2023-07-08 10:09:15,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006688_3424256.pth...
-[2023-07-08 10:09:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006280_3215360.pth
-[2023-07-08 10:09:17,402][906414] Updated weights for policy 0, policy_version 6720 (0.0005)
-[2023-07-08 10:09:20,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6894.9, 300 sec: 6761.9). Total num frames: 3457024. Throughput: 0: 6910.0. Samples: 3444736. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:09:20,077][906159] Avg episode reward: [(0, '327.681')]
-[2023-07-08 10:09:23,359][906414] Updated weights for policy 0, policy_version 6800 (0.0005)
-[2023-07-08 10:09:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6775.8). Total num frames: 3489792. Throughput: 0: 6907.5. Samples: 3485760. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:09:25,077][906159] Avg episode reward: [(0, '310.017')]
-[2023-07-08 10:09:29,477][906414] Updated weights for policy 0, policy_version 6880 (0.0005)
-[2023-07-08 10:09:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6895.0, 300 sec: 6789.6). Total num frames: 3526656. Throughput: 0: 6873.2. Samples: 3526324. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:09:30,077][906159] Avg episode reward: [(0, '335.572')]
-[2023-07-08 10:09:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006888_3526656.pth...
-[2023-07-08 10:09:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006488_3321856.pth
-[2023-07-08 10:09:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6775.8). Total num frames: 3559424. Throughput: 0: 6854.8. Samples: 3546900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:35,077][906159] Avg episode reward: [(0, '307.972')]
-[2023-07-08 10:09:35,531][906414] Updated weights for policy 0, policy_version 6960 (0.0005)
-[2023-07-08 10:09:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6775.8). Total num frames: 3592192. Throughput: 0: 6802.4. Samples: 3587076. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:40,077][906159] Avg episode reward: [(0, '316.202')]
-[2023-07-08 10:09:41,543][906414] Updated weights for policy 0, policy_version 7040 (0.0005)
-[2023-07-08 10:09:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6789.6). Total num frames: 3624960. Throughput: 0: 6774.0. Samples: 3628716. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:45,077][906159] Avg episode reward: [(0, '327.138')]
-[2023-07-08 10:09:45,085][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007088_3629056.pth...
-[2023-07-08 10:09:45,086][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006688_3424256.pth
-[2023-07-08 10:09:47,441][906414] Updated weights for policy 0, policy_version 7120 (0.0005)
-[2023-07-08 10:09:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 3661824. Throughput: 0: 6795.7. Samples: 3649408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:50,077][906159] Avg episode reward: [(0, '312.092')]
-[2023-07-08 10:09:53,270][906414] Updated weights for policy 0, policy_version 7200 (0.0005)
-[2023-07-08 10:09:55,077][906159] Fps is (10 sec: 7372.8, 60 sec: 6894.9, 300 sec: 6817.4). Total num frames: 3698688. Throughput: 0: 6835.4. Samples: 3691488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:09:55,077][906159] Avg episode reward: [(0, '321.693')]
-[2023-07-08 10:09:59,261][906414] Updated weights for policy 0, policy_version 7280 (0.0005)
-[2023-07-08 10:10:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 3731456. Throughput: 0: 6842.2. Samples: 3732228. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:10:00,077][906159] Avg episode reward: [(0, '307.025')]
-[2023-07-08 10:10:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007288_3731456.pth...
-[2023-07-08 10:10:00,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006888_3526656.pth
-[2023-07-08 10:10:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 3764224. Throughput: 0: 6838.2. Samples: 3752456. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:10:05,077][906159] Avg episode reward: [(0, '322.891')]
-[2023-07-08 10:10:05,315][906414] Updated weights for policy 0, policy_version 7360 (0.0005)
-[2023-07-08 10:10:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6831.3). Total num frames: 3796992. Throughput: 0: 6840.4. Samples: 3793580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:10:10,077][906159] Avg episode reward: [(0, '349.100')]
-[2023-07-08 10:10:11,273][906414] Updated weights for policy 0, policy_version 7440 (0.0005)
-[2023-07-08 10:10:15,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 3833856. Throughput: 0: 6835.8. Samples: 3833936. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:10:15,077][906159] Avg episode reward: [(0, '304.939')]
-[2023-07-08 10:10:15,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007488_3833856.pth...
-[2023-07-08 10:10:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007088_3629056.pth
-[2023-07-08 10:10:17,356][906414] Updated weights for policy 0, policy_version 7520 (0.0005)
-[2023-07-08 10:10:19,154][906400] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000005
-[2023-07-08 10:10:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 3866624. Throughput: 0: 6833.3. Samples: 3854400. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:10:20,077][906159] Avg episode reward: [(0, '309.431')]
-[2023-07-08 10:10:23,511][906414] Updated weights for policy 0, policy_version 7600 (0.0005)
-[2023-07-08 10:10:25,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 3899392. Throughput: 0: 6830.1. Samples: 3894432. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:10:25,077][906159] Avg episode reward: [(0, '311.654')]
-[2023-07-08 10:10:29,556][906414] Updated weights for policy 0, policy_version 7680 (0.0005)
-[2023-07-08 10:10:30,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6845.2). Total num frames: 3932160. Throughput: 0: 6812.1. Samples: 3935260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:10:30,077][906159] Avg episode reward: [(0, '315.092')]
-[2023-07-08 10:10:30,079][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007680_3932160.pth...
-[2023-07-08 10:10:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007288_3731456.pth
-[2023-07-08 10:10:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 3969024. Throughput: 0: 6799.3. Samples: 3955376. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:10:35,077][906159] Avg episode reward: [(0, '316.439')]
-[2023-07-08 10:10:35,694][906414] Updated weights for policy 0, policy_version 7760 (0.0005)
-[2023-07-08 10:10:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 4001792. Throughput: 0: 6749.6. Samples: 3995220. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:10:40,077][906159] Avg episode reward: [(0, '324.058')]
-[2023-07-08 10:10:41,779][906414] Updated weights for policy 0, policy_version 7840 (0.0005)
-[2023-07-08 10:10:45,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 4034560. Throughput: 0: 6748.7. Samples: 4035920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:10:45,077][906159] Avg episode reward: [(0, '321.093')]
-[2023-07-08 10:10:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007880_4034560.pth...
-[2023-07-08 10:10:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007488_3833856.pth
-[2023-07-08 10:10:47,841][906414] Updated weights for policy 0, policy_version 7920 (0.0005)
-[2023-07-08 10:10:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6831.3). Total num frames: 4067328. Throughput: 0: 6745.5. Samples: 4056004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:10:50,077][906159] Avg episode reward: [(0, '304.921')]
-[2023-07-08 10:10:54,018][906414] Updated weights for policy 0, policy_version 8000 (0.0005)
-[2023-07-08 10:10:55,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6831.3). Total num frames: 4100096. Throughput: 0: 6720.4. Samples: 4096000. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:10:55,077][906159] Avg episode reward: [(0, '291.725')]
-[2023-07-08 10:11:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6817.4). Total num frames: 4132864. Throughput: 0: 6723.4. Samples: 4136488. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:11:00,077][906159] Avg episode reward: [(0, '273.548')]
-[2023-07-08 10:11:00,084][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008080_4136960.pth...
-[2023-07-08 10:11:00,085][906414] Updated weights for policy 0, policy_version 8080 (0.0005)
-[2023-07-08 10:11:00,087][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007680_3932160.pth
-[2023-07-08 10:11:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6831.3). Total num frames: 4169728. Throughput: 0: 6704.5. Samples: 4156104. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:11:05,077][906159] Avg episode reward: [(0, '276.385')]
-[2023-07-08 10:11:06,259][906414] Updated weights for policy 0, policy_version 8160 (0.0005)
-[2023-07-08 10:11:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6831.3). Total num frames: 4202496. Throughput: 0: 6717.3. Samples: 4196712. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:11:10,077][906159] Avg episode reward: [(0, '292.334')]
-[2023-07-08 10:11:12,332][906414] Updated weights for policy 0, policy_version 8240 (0.0005)
-[2023-07-08 10:11:15,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6690.1, 300 sec: 6817.4). Total num frames: 4235264. Throughput: 0: 6691.8. Samples: 4236392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:11:15,077][906159] Avg episode reward: [(0, '311.729')]
-[2023-07-08 10:11:15,106][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008272_4235264.pth...
-[2023-07-08 10:11:15,109][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007880_4034560.pth
-[2023-07-08 10:11:18,414][906414] Updated weights for policy 0, policy_version 8320 (0.0005)
-[2023-07-08 10:11:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6817.4). Total num frames: 4268032. Throughput: 0: 6702.1. Samples: 4256972. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:11:20,077][906159] Avg episode reward: [(0, '312.029')]
-[2023-07-08 10:11:24,532][906414] Updated weights for policy 0, policy_version 8400 (0.0005)
-[2023-07-08 10:11:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6803.5). Total num frames: 4300800. Throughput: 0: 6705.7. Samples: 4296976. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:11:25,077][906159] Avg episode reward: [(0, '297.840')]
-[2023-07-08 10:11:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 4337664. Throughput: 0: 6705.4. Samples: 4337664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:11:30,077][906159] Avg episode reward: [(0, '302.536')]
-[2023-07-08 10:11:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008472_4337664.pth...
-[2023-07-08 10:11:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008080_4136960.pth
-[2023-07-08 10:11:30,647][906414] Updated weights for policy 0, policy_version 8480 (0.0005)
-[2023-07-08 10:11:35,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6690.1, 300 sec: 6803.5). Total num frames: 4370432. Throughput: 0: 6710.2. Samples: 4357964. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:11:35,078][906159] Avg episode reward: [(0, '309.152')]
-[2023-07-08 10:11:36,536][906414] Updated weights for policy 0, policy_version 8560 (0.0005)
-[2023-07-08 10:11:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 4407296. Throughput: 0: 6751.1. Samples: 4399800. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:11:40,077][906159] Avg episode reward: [(0, '293.533')]
-[2023-07-08 10:11:42,349][906414] Updated weights for policy 0, policy_version 8640 (0.0005)
-[2023-07-08 10:11:45,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 4440064. Throughput: 0: 6784.3. Samples: 4441784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:11:45,077][906159] Avg episode reward: [(0, '315.560')]
-[2023-07-08 10:11:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008672_4440064.pth...
-[2023-07-08 10:11:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008272_4235264.pth
-[2023-07-08 10:11:48,213][906414] Updated weights for policy 0, policy_version 8720 (0.0005)
-[2023-07-08 10:11:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 4476928. Throughput: 0: 6822.1. Samples: 4463100. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:11:50,077][906159] Avg episode reward: [(0, '293.734')]
-[2023-07-08 10:11:54,009][906414] Updated weights for policy 0, policy_version 8800 (0.0005)
-[2023-07-08 10:11:55,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 4509696. Throughput: 0: 6863.5. Samples: 4505568. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:11:55,077][906159] Avg episode reward: [(0, '303.773')]
-[2023-07-08 10:11:59,893][906414] Updated weights for policy 0, policy_version 8880 (0.0005)
-[2023-07-08 10:12:00,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6894.9, 300 sec: 6831.3). Total num frames: 4546560. Throughput: 0: 6902.8. Samples: 4547020. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:12:00,077][906159] Avg episode reward: [(0, '302.833')]
-[2023-07-08 10:12:00,086][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008880_4546560.pth...
-[2023-07-08 10:12:00,089][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008472_4337664.pth
-[2023-07-08 10:12:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 4579328. Throughput: 0: 6913.4. Samples: 4568076. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:12:05,077][906159] Avg episode reward: [(0, '317.112')]
-[2023-07-08 10:12:05,837][906414] Updated weights for policy 0, policy_version 8960 (0.0005)
-[2023-07-08 10:12:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6845.2). Total num frames: 4616192. Throughput: 0: 6938.7. Samples: 4609216. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:12:10,077][906159] Avg episode reward: [(0, '320.622')]
-[2023-07-08 10:12:11,843][906414] Updated weights for policy 0, policy_version 9040 (0.0005)
-[2023-07-08 10:12:15,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6894.9, 300 sec: 6831.3). Total num frames: 4648960. Throughput: 0: 6957.4. Samples: 4650748. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:12:15,077][906159] Avg episode reward: [(0, '327.473')]
-[2023-07-08 10:12:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009080_4648960.pth...
-[2023-07-08 10:12:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008672_4440064.pth
-[2023-07-08 10:12:17,638][906414] Updated weights for policy 0, policy_version 9120 (0.0005)
-[2023-07-08 10:12:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6845.2). Total num frames: 4685824. Throughput: 0: 6975.6. Samples: 4671864. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:12:20,077][906159] Avg episode reward: [(0, '324.335')]
-[2023-07-08 10:12:23,546][906414] Updated weights for policy 0, policy_version 9200 (0.0005)
-[2023-07-08 10:12:25,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6845.2). Total num frames: 4718592. Throughput: 0: 6970.7. Samples: 4713480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:12:25,077][906159] Avg episode reward: [(0, '309.591')]
-[2023-07-08 10:12:29,641][906414] Updated weights for policy 0, policy_version 9280 (0.0006)
-[2023-07-08 10:12:30,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6894.9, 300 sec: 6845.2). Total num frames: 4751360. Throughput: 0: 6932.6. Samples: 4753752. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:12:30,077][906159] Avg episode reward: [(0, '326.177')]
-[2023-07-08 10:12:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009280_4751360.pth...
-[2023-07-08 10:12:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008880_4546560.pth
-[2023-07-08 10:12:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6963.2, 300 sec: 6845.2). Total num frames: 4788224. Throughput: 0: 6912.0. Samples: 4774140. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:12:35,077][906159] Avg episode reward: [(0, '317.850')]
-[2023-07-08 10:12:35,610][906414] Updated weights for policy 0, policy_version 9360 (0.0005)
-[2023-07-08 10:12:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6845.2). Total num frames: 4820992. Throughput: 0: 6868.0. Samples: 4814628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:12:40,077][906159] Avg episode reward: [(0, '312.153')]
-[2023-07-08 10:12:41,733][906414] Updated weights for policy 0, policy_version 9440 (0.0005)
-[2023-07-08 10:12:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6894.9, 300 sec: 6845.2). Total num frames: 4853760. Throughput: 0: 6848.2. Samples: 4855188. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:12:45,077][906159] Avg episode reward: [(0, '341.815')]
-[2023-07-08 10:12:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009480_4853760.pth...
-[2023-07-08 10:12:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009080_4648960.pth
-[2023-07-08 10:12:47,648][906414] Updated weights for policy 0, policy_version 9520 (0.0005)
-[2023-07-08 10:12:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6845.2). Total num frames: 4890624. Throughput: 0: 6855.4. Samples: 4876568. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:12:50,077][906159] Avg episode reward: [(0, '322.407')]
-[2023-07-08 10:12:53,555][906414] Updated weights for policy 0, policy_version 9600 (0.0004)
-[2023-07-08 10:12:55,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6845.2). Total num frames: 4923392. Throughput: 0: 6871.1. Samples: 4918416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:12:55,077][906159] Avg episode reward: [(0, '320.244')]
-[2023-07-08 10:12:59,708][906414] Updated weights for policy 0, policy_version 9680 (0.0005)
-[2023-07-08 10:13:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 4956160. Throughput: 0: 6831.2. Samples: 4958152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:00,077][906159] Avg episode reward: [(0, '314.442')]
-[2023-07-08 10:13:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009680_4956160.pth...
-[2023-07-08 10:13:00,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009280_4751360.pth
-[2023-07-08 10:13:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 4988928. Throughput: 0: 6804.3. Samples: 4978056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:05,077][906159] Avg episode reward: [(0, '333.920')]
-[2023-07-08 10:13:05,755][906414] Updated weights for policy 0, policy_version 9760 (0.0005)
-[2023-07-08 10:13:10,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6826.7, 300 sec: 6845.2). Total num frames: 5025792. Throughput: 0: 6785.1. Samples: 5018808. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:13:10,078][906159] Avg episode reward: [(0, '318.653')]
-[2023-07-08 10:13:11,805][906414] Updated weights for policy 0, policy_version 9840 (0.0005)
-[2023-07-08 10:13:15,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 5058560. Throughput: 0: 6799.0. Samples: 5059708. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:13:15,077][906159] Avg episode reward: [(0, '338.208')]
-[2023-07-08 10:13:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009880_5058560.pth...
-[2023-07-08 10:13:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009480_4853760.pth
-[2023-07-08 10:13:17,777][906414] Updated weights for policy 0, policy_version 9920 (0.0005)
-[2023-07-08 10:13:20,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 5091328. Throughput: 0: 6806.2. Samples: 5080420. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:13:20,077][906159] Avg episode reward: [(0, '335.953')]
-[2023-07-08 10:13:23,851][906414] Updated weights for policy 0, policy_version 10000 (0.0004)
-[2023-07-08 10:13:25,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 5124096. Throughput: 0: 6801.7. Samples: 5120704. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:25,077][906159] Avg episode reward: [(0, '318.361')]
-[2023-07-08 10:13:29,982][906414] Updated weights for policy 0, policy_version 10080 (0.0003)
-[2023-07-08 10:13:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 5160960. Throughput: 0: 6795.2. Samples: 5160972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:30,077][906159] Avg episode reward: [(0, '312.369')]
-[2023-07-08 10:13:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010080_5160960.pth...
-[2023-07-08 10:13:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009680_4956160.pth
-[2023-07-08 10:13:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 5193728. Throughput: 0: 6774.5. Samples: 5181420. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:35,077][906159] Avg episode reward: [(0, '308.888')]
-[2023-07-08 10:13:36,048][906414] Updated weights for policy 0, policy_version 10160 (0.0005)
-[2023-07-08 10:13:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 5226496. Throughput: 0: 6752.3. Samples: 5222268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:40,077][906159] Avg episode reward: [(0, '312.831')]
-[2023-07-08 10:13:42,097][906414] Updated weights for policy 0, policy_version 10240 (0.0006)
-[2023-07-08 10:13:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5259264. Throughput: 0: 6763.2. Samples: 5262496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:13:45,077][906159] Avg episode reward: [(0, '317.288')]
-[2023-07-08 10:13:45,079][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010272_5259264.pth...
-[2023-07-08 10:13:45,081][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009880_5058560.pth
-[2023-07-08 10:13:48,163][906414] Updated weights for policy 0, policy_version 10320 (0.0005)
-[2023-07-08 10:13:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 5296128. Throughput: 0: 6768.2. Samples: 5282624. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:13:50,077][906159] Avg episode reward: [(0, '319.722')]
-[2023-07-08 10:13:54,128][906414] Updated weights for policy 0, policy_version 10400 (0.0005)
-[2023-07-08 10:13:55,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5328896. Throughput: 0: 6785.0. Samples: 5324132. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:13:55,077][906159] Avg episode reward: [(0, '312.142')]
-[2023-07-08 10:13:59,958][906414] Updated weights for policy 0, policy_version 10480 (0.0006)
-[2023-07-08 10:14:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 5365760. Throughput: 0: 6802.6. Samples: 5365824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:00,077][906159] Avg episode reward: [(0, '340.109')]
-[2023-07-08 10:14:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010480_5365760.pth...
-[2023-07-08 10:14:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010080_5160960.pth
-[2023-07-08 10:14:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 5398528. Throughput: 0: 6801.1. Samples: 5386468. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:05,077][906159] Avg episode reward: [(0, '313.401')]
-[2023-07-08 10:14:05,893][906414] Updated weights for policy 0, policy_version 10560 (0.0006)
-[2023-07-08 10:14:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5431296. Throughput: 0: 6816.2. Samples: 5427432. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:10,077][906159] Avg episode reward: [(0, '318.168')]
-[2023-07-08 10:14:11,979][906414] Updated weights for policy 0, policy_version 10640 (0.0005)
-[2023-07-08 10:14:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 5468160. Throughput: 0: 6821.1. Samples: 5467920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:15,078][906159] Avg episode reward: [(0, '309.972')]
-[2023-07-08 10:14:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010680_5468160.pth...
-[2023-07-08 10:14:15,086][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010272_5259264.pth
-[2023-07-08 10:14:18,114][906414] Updated weights for policy 0, policy_version 10720 (0.0005)
-[2023-07-08 10:14:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 5500928. Throughput: 0: 6816.3. Samples: 5488152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:20,077][906159] Avg episode reward: [(0, '303.205')]
-[2023-07-08 10:14:24,044][906414] Updated weights for policy 0, policy_version 10800 (0.0006)
-[2023-07-08 10:14:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 5533696. Throughput: 0: 6821.6. Samples: 5529240. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:25,077][906159] Avg episode reward: [(0, '325.952')]
-[2023-07-08 10:14:29,896][906414] Updated weights for policy 0, policy_version 10880 (0.0006)
-[2023-07-08 10:14:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 5570560. Throughput: 0: 6856.0. Samples: 5571016. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:14:30,077][906159] Avg episode reward: [(0, '306.780')]
-[2023-07-08 10:14:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010880_5570560.pth...
-[2023-07-08 10:14:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010480_5365760.pth
-[2023-07-08 10:14:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 5603328. Throughput: 0: 6862.8. Samples: 5591448. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:14:35,077][906159] Avg episode reward: [(0, '309.627')]
-[2023-07-08 10:14:35,848][906414] Updated weights for policy 0, policy_version 10960 (0.0005)
-[2023-07-08 10:14:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6831.3). Total num frames: 5640192. Throughput: 0: 6864.5. Samples: 5633036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:40,077][906159] Avg episode reward: [(0, '310.464')]
-[2023-07-08 10:14:41,874][906414] Updated weights for policy 0, policy_version 11040 (0.0005)
-[2023-07-08 10:14:45,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6894.9, 300 sec: 6817.4). Total num frames: 5672960. Throughput: 0: 6826.7. Samples: 5673024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:45,077][906159] Avg episode reward: [(0, '305.233')]
-[2023-07-08 10:14:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011080_5672960.pth...
-[2023-07-08 10:14:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010680_5468160.pth
-[2023-07-08 10:14:48,061][906414] Updated weights for policy 0, policy_version 11120 (0.0006)
-[2023-07-08 10:14:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 5705728. Throughput: 0: 6815.6. Samples: 5693172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:50,077][906159] Avg episode reward: [(0, '316.409')]
-[2023-07-08 10:14:54,227][906414] Updated weights for policy 0, policy_version 11200 (0.0005)
-[2023-07-08 10:14:55,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 5738496. Throughput: 0: 6790.5. Samples: 5733004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:14:55,077][906159] Avg episode reward: [(0, '324.601')]
-[2023-07-08 10:15:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5771264. Throughput: 0: 6786.9. Samples: 5773332. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:15:00,077][906159] Avg episode reward: [(0, '315.355')]
-[2023-07-08 10:15:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011272_5771264.pth...
-[2023-07-08 10:15:00,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010880_5570560.pth
-[2023-07-08 10:15:00,314][906414] Updated weights for policy 0, policy_version 11280 (0.0005)
-[2023-07-08 10:15:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5804032. Throughput: 0: 6762.8. Samples: 5792480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:15:05,077][906159] Avg episode reward: [(0, '327.774')]
-[2023-07-08 10:15:06,573][906414] Updated weights for policy 0, policy_version 11360 (0.0005)
-[2023-07-08 10:15:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6789.6). Total num frames: 5836800. Throughput: 0: 6743.5. Samples: 5832696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:15:10,077][906159] Avg episode reward: [(0, '326.457')]
-[2023-07-08 10:15:12,596][906414] Updated weights for policy 0, policy_version 11440 (0.0005)
-[2023-07-08 10:15:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5873664. Throughput: 0: 6722.6. Samples: 5873532. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:15:15,077][906159] Avg episode reward: [(0, '313.834')]
-[2023-07-08 10:15:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011472_5873664.pth...
-[2023-07-08 10:15:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011080_5672960.pth
-[2023-07-08 10:15:18,587][906414] Updated weights for policy 0, policy_version 11520 (0.0005)
-[2023-07-08 10:15:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5906432. Throughput: 0: 6728.0. Samples: 5894208. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:15:20,077][906159] Avg episode reward: [(0, '313.855')]
-[2023-07-08 10:15:24,593][906414] Updated weights for policy 0, policy_version 11600 (0.0006)
-[2023-07-08 10:15:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5939200. Throughput: 0: 6712.8. Samples: 5935112. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:15:25,077][906159] Avg episode reward: [(0, '309.560')]
-[2023-07-08 10:15:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 5976064. Throughput: 0: 6734.2. Samples: 5976064. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:15:30,077][906159] Avg episode reward: [(0, '314.561')]
-[2023-07-08 10:15:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011672_5976064.pth...
-[2023-07-08 10:15:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011272_5771264.pth
-[2023-07-08 10:15:30,648][906414] Updated weights for policy 0, policy_version 11680 (0.0005)
-[2023-07-08 10:15:35,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 6008832. Throughput: 0: 6726.4. Samples: 5995860. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:15:35,077][906159] Avg episode reward: [(0, '314.272')]
-[2023-07-08 10:15:36,685][906414] Updated weights for policy 0, policy_version 11760 (0.0006)
-[2023-07-08 10:15:40,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6690.1, 300 sec: 6803.5). Total num frames: 6041600. Throughput: 0: 6761.6. Samples: 6037276. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:15:40,077][906159] Avg episode reward: [(0, '299.582')]
-[2023-07-08 10:15:42,743][906414] Updated weights for policy 0, policy_version 11840 (0.0006)
-[2023-07-08 10:15:45,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6690.1, 300 sec: 6803.5). Total num frames: 6074368. Throughput: 0: 6742.0. Samples: 6076724. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:15:45,077][906159] Avg episode reward: [(0, '308.252')]
-[2023-07-08 10:15:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011864_6074368.pth...
-[2023-07-08 10:15:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011472_5873664.pth
-[2023-07-08 10:15:48,770][906414] Updated weights for policy 0, policy_version 11920 (0.0006)
-[2023-07-08 10:15:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 6111232. Throughput: 0: 6782.6. Samples: 6097696. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:15:50,077][906159] Avg episode reward: [(0, '329.341')]
-[2023-07-08 10:15:54,752][906414] Updated weights for policy 0, policy_version 12000 (0.0006)
-[2023-07-08 10:15:55,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6817.4). Total num frames: 6144000. Throughput: 0: 6806.1. Samples: 6138972. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:15:55,077][906159] Avg episode reward: [(0, '330.112')]
-[2023-07-08 10:16:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 6180864. Throughput: 0: 6823.8. Samples: 6180604. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:16:00,077][906159] Avg episode reward: [(0, '315.773')]
-[2023-07-08 10:16:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012072_6180864.pth...
-[2023-07-08 10:16:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011672_5976064.pth
-[2023-07-08 10:16:00,654][906414] Updated weights for policy 0, policy_version 12080 (0.0006)
-[2023-07-08 10:16:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 6213632. Throughput: 0: 6821.1. Samples: 6201156. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:16:05,077][906159] Avg episode reward: [(0, '318.760')]
-[2023-07-08 10:16:06,568][906414] Updated weights for policy 0, policy_version 12160 (0.0006)
-[2023-07-08 10:16:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 6246400. Throughput: 0: 6827.9. Samples: 6242368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:10,077][906159] Avg episode reward: [(0, '298.183')]
-[2023-07-08 10:16:12,506][906414] Updated weights for policy 0, policy_version 12240 (0.0006)
-[2023-07-08 10:16:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 6283264. Throughput: 0: 6846.4. Samples: 6284152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:15,077][906159] Avg episode reward: [(0, '325.243')]
-[2023-07-08 10:16:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012272_6283264.pth...
-[2023-07-08 10:16:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011864_6074368.pth
-[2023-07-08 10:16:18,437][906414] Updated weights for policy 0, policy_version 12320 (0.0006)
-[2023-07-08 10:16:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 6316032. Throughput: 0: 6862.8. Samples: 6304684. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:20,077][906159] Avg episode reward: [(0, '323.771')]
-[2023-07-08 10:16:24,427][906414] Updated weights for policy 0, policy_version 12400 (0.0005)
-[2023-07-08 10:16:25,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6831.3). Total num frames: 6352896. Throughput: 0: 6854.1. Samples: 6345712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:25,077][906159] Avg episode reward: [(0, '310.710')]
-[2023-07-08 10:16:30,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6826.7, 300 sec: 6831.3). Total num frames: 6385664. Throughput: 0: 6894.0. Samples: 6386956. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:30,077][906159] Avg episode reward: [(0, '299.205')]
-[2023-07-08 10:16:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012472_6385664.pth...
-[2023-07-08 10:16:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012072_6180864.pth
-[2023-07-08 10:16:30,395][906414] Updated weights for policy 0, policy_version 12480 (0.0005)
-[2023-07-08 10:16:35,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 6418432. Throughput: 0: 6892.3. Samples: 6407848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:35,077][906159] Avg episode reward: [(0, '323.042')]
-[2023-07-08 10:16:36,312][906414] Updated weights for policy 0, policy_version 12560 (0.0005)
-[2023-07-08 10:16:40,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6894.9, 300 sec: 6831.3). Total num frames: 6455296. Throughput: 0: 6892.4. Samples: 6449132. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:16:40,077][906159] Avg episode reward: [(0, '325.120')]
-[2023-07-08 10:16:42,296][906414] Updated weights for policy 0, policy_version 12640 (0.0006)
-[2023-07-08 10:16:45,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6894.9, 300 sec: 6817.4). Total num frames: 6488064. Throughput: 0: 6869.4. Samples: 6489728. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:16:45,077][906159] Avg episode reward: [(0, '342.241')]
-[2023-07-08 10:16:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012672_6488064.pth...
-[2023-07-08 10:16:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012272_6283264.pth
-[2023-07-08 10:16:48,429][906414] Updated weights for policy 0, policy_version 12720 (0.0006)
-[2023-07-08 10:16:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6817.4). Total num frames: 6520832. Throughput: 0: 6857.3. Samples: 6509736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:50,077][906159] Avg episode reward: [(0, '316.504')]
-[2023-07-08 10:16:54,652][906414] Updated weights for policy 0, policy_version 12800 (0.0006)
-[2023-07-08 10:16:55,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6826.7, 300 sec: 6803.5). Total num frames: 6553600. Throughput: 0: 6825.2. Samples: 6549500. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:16:55,077][906159] Avg episode reward: [(0, '330.616')]
-[2023-07-08 10:17:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6803.5). Total num frames: 6586368. Throughput: 0: 6788.8. Samples: 6589648. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:17:00,077][906159] Avg episode reward: [(0, '331.874')]
-[2023-07-08 10:17:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012864_6586368.pth...
-[2023-07-08 10:17:00,081][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012472_6385664.pth
-[2023-07-08 10:17:00,728][906414] Updated weights for policy 0, policy_version 12880 (0.0005)
-[2023-07-08 10:17:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6789.6). Total num frames: 6619136. Throughput: 0: 6776.5. Samples: 6609628. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:17:05,077][906159] Avg episode reward: [(0, '339.088')]
-[2023-07-08 10:17:07,015][906414] Updated weights for policy 0, policy_version 12960 (0.0005)
-[2023-07-08 10:17:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6789.6). Total num frames: 6651904. Throughput: 0: 6714.7. Samples: 6647872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:17:10,077][906159] Avg episode reward: [(0, '325.293')]
-[2023-07-08 10:17:13,254][906414] Updated weights for policy 0, policy_version 13040 (0.0006)
-[2023-07-08 10:17:15,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6789.6). Total num frames: 6688768. Throughput: 0: 6695.8. Samples: 6688268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:17:15,078][906159] Avg episode reward: [(0, '315.206')]
-[2023-07-08 10:17:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013064_6688768.pth...
-[2023-07-08 10:17:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012672_6488064.pth
-[2023-07-08 10:17:19,288][906414] Updated weights for policy 0, policy_version 13120 (0.0006)
-[2023-07-08 10:17:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6789.6). Total num frames: 6721536. Throughput: 0: 6689.7. Samples: 6708884. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:17:20,077][906159] Avg episode reward: [(0, '322.891')]
-[2023-07-08 10:17:25,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6690.1, 300 sec: 6789.6). Total num frames: 6754304. Throughput: 0: 6677.8. Samples: 6749632. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:17:25,077][906159] Avg episode reward: [(0, '319.057')]
-[2023-07-08 10:17:25,317][906414] Updated weights for policy 0, policy_version 13200 (0.0005)
-[2023-07-08 10:17:30,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6775.8). Total num frames: 6787072. Throughput: 0: 6652.4. Samples: 6789084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:17:30,077][906159] Avg episode reward: [(0, '306.919')]
-[2023-07-08 10:17:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013256_6787072.pth...
-[2023-07-08 10:17:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012864_6586368.pth
-[2023-07-08 10:17:31,587][906414] Updated weights for policy 0, policy_version 13280 (0.0005)
-[2023-07-08 10:17:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6775.8). Total num frames: 6819840. Throughput: 0: 6647.8. Samples: 6808888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:17:35,077][906159] Avg episode reward: [(0, '326.886')]
-[2023-07-08 10:17:37,794][906414] Updated weights for policy 0, policy_version 13360 (0.0005)
-[2023-07-08 10:17:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6775.8). Total num frames: 6852608. Throughput: 0: 6639.6. Samples: 6848280. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:17:40,077][906159] Avg episode reward: [(0, '311.443')]
-[2023-07-08 10:17:44,051][906414] Updated weights for policy 0, policy_version 13440 (0.0006)
-[2023-07-08 10:17:45,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6621.9, 300 sec: 6761.9). Total num frames: 6885376. Throughput: 0: 6621.7. Samples: 6887624. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:17:45,078][906159] Avg episode reward: [(0, '317.656')]
-[2023-07-08 10:17:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013448_6885376.pth...
-[2023-07-08 10:17:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013064_6688768.pth
-[2023-07-08 10:17:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6761.9). Total num frames: 6918144. Throughput: 0: 6608.0. Samples: 6906988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:17:50,077][906159] Avg episode reward: [(0, '322.351')]
-[2023-07-08 10:17:50,339][906414] Updated weights for policy 0, policy_version 13520 (0.0005)
-[2023-07-08 10:17:55,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6761.9). Total num frames: 6950912. Throughput: 0: 6633.0. Samples: 6946356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:17:55,077][906159] Avg episode reward: [(0, '325.878')]
-[2023-07-08 10:17:56,594][906414] Updated weights for policy 0, policy_version 13600 (0.0006)
-[2023-07-08 10:18:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6761.9). Total num frames: 6983680. Throughput: 0: 6592.8. Samples: 6984944. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:18:00,078][906159] Avg episode reward: [(0, '320.694')]
-[2023-07-08 10:18:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013640_6983680.pth...
-[2023-07-08 10:18:00,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013256_6787072.pth
-[2023-07-08 10:18:03,000][906414] Updated weights for policy 0, policy_version 13680 (0.0005)
-[2023-07-08 10:18:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6748.0). Total num frames: 7016448. Throughput: 0: 6561.9. Samples: 7004168. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:18:05,077][906159] Avg episode reward: [(0, '305.090')]
-[2023-07-08 10:18:09,256][906414] Updated weights for policy 0, policy_version 13760 (0.0005)
-[2023-07-08 10:18:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6748.0). Total num frames: 7049216. Throughput: 0: 6529.1. Samples: 7043440. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:18:10,077][906159] Avg episode reward: [(0, '311.521')]
-[2023-07-08 10:18:15,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6553.6, 300 sec: 6748.0). Total num frames: 7081984. Throughput: 0: 6522.5. Samples: 7082596. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:18:15,078][906159] Avg episode reward: [(0, '323.040')]
-[2023-07-08 10:18:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013832_7081984.pth...
-[2023-07-08 10:18:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013448_6885376.pth
-[2023-07-08 10:18:15,507][906414] Updated weights for policy 0, policy_version 13840 (0.0005)
-[2023-07-08 10:18:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6748.0). Total num frames: 7114752. Throughput: 0: 6524.1. Samples: 7102472. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:18:20,077][906159] Avg episode reward: [(0, '318.633')]
-[2023-07-08 10:18:21,707][906414] Updated weights for policy 0, policy_version 13920 (0.0005)
-[2023-07-08 10:18:25,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6553.6, 300 sec: 6734.1). Total num frames: 7147520. Throughput: 0: 6533.9. Samples: 7142304. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:18:25,077][906159] Avg episode reward: [(0, '328.928')]
-[2023-07-08 10:18:27,948][906414] Updated weights for policy 0, policy_version 14000 (0.0005)
-[2023-07-08 10:18:30,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6734.1). Total num frames: 7180288. Throughput: 0: 6516.9. Samples: 7180884. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:18:30,077][906159] Avg episode reward: [(0, '344.196')]
-[2023-07-08 10:18:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014024_7180288.pth...
-[2023-07-08 10:18:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013640_6983680.pth
-[2023-07-08 10:18:34,216][906414] Updated weights for policy 0, policy_version 14080 (0.0005)
-[2023-07-08 10:18:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6734.1). Total num frames: 7213056. Throughput: 0: 6529.9. Samples: 7200832. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:18:35,077][906159] Avg episode reward: [(0, '344.424')]
-[2023-07-08 10:18:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6734.1). Total num frames: 7245824. Throughput: 0: 6538.2. Samples: 7240576. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:18:40,077][906159] Avg episode reward: [(0, '328.653')]
-[2023-07-08 10:18:40,476][906414] Updated weights for policy 0, policy_version 14160 (0.0005)
-[2023-07-08 10:18:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6720.2). Total num frames: 7278592. Throughput: 0: 6534.0. Samples: 7278972. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 10:18:45,077][906159] Avg episode reward: [(0, '330.277')]
-[2023-07-08 10:18:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014216_7278592.pth...
-[2023-07-08 10:18:45,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013832_7081984.pth
-[2023-07-08 10:18:46,784][906414] Updated weights for policy 0, policy_version 14240 (0.0005)
-[2023-07-08 10:18:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6720.2). Total num frames: 7311360. Throughput: 0: 6550.9. Samples: 7298960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:18:50,077][906159] Avg episode reward: [(0, '323.907')]
-[2023-07-08 10:18:53,084][906414] Updated weights for policy 0, policy_version 14320 (0.0005)
-[2023-07-08 10:18:55,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6706.3). Total num frames: 7344128. Throughput: 0: 6541.3. Samples: 7337796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:18:55,077][906159] Avg episode reward: [(0, '331.223')]
-[2023-07-08 10:18:59,373][906414] Updated weights for policy 0, policy_version 14400 (0.0005)
-[2023-07-08 10:19:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6706.3). Total num frames: 7376896. Throughput: 0: 6540.0. Samples: 7376896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:19:00,077][906159] Avg episode reward: [(0, '332.910')]
-[2023-07-08 10:19:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014408_7376896.pth...
-[2023-07-08 10:19:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014024_7180288.pth
-[2023-07-08 10:19:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6706.3). Total num frames: 7409664. Throughput: 0: 6529.3. Samples: 7396292. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:19:05,077][906159] Avg episode reward: [(0, '328.734')]
-[2023-07-08 10:19:05,685][906414] Updated weights for policy 0, policy_version 14480 (0.0005)
-[2023-07-08 10:19:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6692.4). Total num frames: 7442432. Throughput: 0: 6513.8. Samples: 7435424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:19:10,077][906159] Avg episode reward: [(0, '319.394')]
-[2023-07-08 10:19:11,823][906414] Updated weights for policy 0, policy_version 14560 (0.0006)
-[2023-07-08 10:19:15,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6553.6, 300 sec: 6692.4). Total num frames: 7475200. Throughput: 0: 6560.9. Samples: 7476124. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:19:15,077][906159] Avg episode reward: [(0, '326.654')]
-[2023-07-08 10:19:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014600_7475200.pth...
-[2023-07-08 10:19:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014216_7278592.pth
-[2023-07-08 10:19:17,826][906414] Updated weights for policy 0, policy_version 14640 (0.0005)
-[2023-07-08 10:19:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6553.6, 300 sec: 6692.4). Total num frames: 7507968. Throughput: 0: 6574.1. Samples: 7496668. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:19:20,077][906159] Avg episode reward: [(0, '328.319')]
-[2023-07-08 10:19:23,828][906414] Updated weights for policy 0, policy_version 14720 (0.0006)
-[2023-07-08 10:19:25,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6621.9, 300 sec: 6692.4). Total num frames: 7544832. Throughput: 0: 6601.8. Samples: 7537656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:19:25,077][906159] Avg episode reward: [(0, '315.247')]
-[2023-07-08 10:19:29,804][906414] Updated weights for policy 0, policy_version 14800 (0.0006)
-[2023-07-08 10:19:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6621.9, 300 sec: 6692.4). Total num frames: 7577600. Throughput: 0: 6661.0. Samples: 7578716. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:19:30,077][906159] Avg episode reward: [(0, '326.492')]
-[2023-07-08 10:19:30,082][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014800_7577600.pth...
-[2023-07-08 10:19:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014408_7376896.pth
-[2023-07-08 10:19:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6621.9, 300 sec: 6678.6). Total num frames: 7610368. Throughput: 0: 6670.7. Samples: 7599140. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:19:35,077][906159] Avg episode reward: [(0, '324.853')]
-[2023-07-08 10:19:35,817][906414] Updated weights for policy 0, policy_version 14880 (0.0005)
-[2023-07-08 10:19:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6692.4). Total num frames: 7647232. Throughput: 0: 6725.2. Samples: 7640432. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:19:40,077][906159] Avg episode reward: [(0, '321.365')]
-[2023-07-08 10:19:41,694][906414] Updated weights for policy 0, policy_version 14960 (0.0005)
-[2023-07-08 10:19:45,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6692.4). Total num frames: 7680000. Throughput: 0: 6784.3. Samples: 7682188. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:19:45,077][906159] Avg episode reward: [(0, '336.014')]
-[2023-07-08 10:19:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015000_7680000.pth...
-[2023-07-08 10:19:45,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014600_7475200.pth
-[2023-07-08 10:19:47,649][906414] Updated weights for policy 0, policy_version 15040 (0.0005)
-[2023-07-08 10:19:50,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 7716864. Throughput: 0: 6813.8. Samples: 7702912. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 10:19:50,078][906159] Avg episode reward: [(0, '329.016')]
-[2023-07-08 10:19:53,543][906414] Updated weights for policy 0, policy_version 15120 (0.0005)
-[2023-07-08 10:19:55,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 7749632. Throughput: 0: 6870.8. Samples: 7744608. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:19:55,077][906159] Avg episode reward: [(0, '341.736')]
-[2023-07-08 10:19:59,561][906414] Updated weights for policy 0, policy_version 15200 (0.0005)
-[2023-07-08 10:20:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 7782400. Throughput: 0: 6873.8. Samples: 7785444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:00,077][906159] Avg episode reward: [(0, '342.179')]
-[2023-07-08 10:20:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015200_7782400.pth...
-[2023-07-08 10:20:00,082][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014800_7577600.pth
-[2023-07-08 10:20:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6720.2). Total num frames: 7819264. Throughput: 0: 6850.6. Samples: 7804944. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:05,077][906159] Avg episode reward: [(0, '352.542')]
-[2023-07-08 10:20:05,660][906414] Updated weights for policy 0, policy_version 15280 (0.0005)
-[2023-07-08 10:20:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 7852032. Throughput: 0: 6860.8. Samples: 7846392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:10,077][906159] Avg episode reward: [(0, '347.919')]
-[2023-07-08 10:20:11,481][906414] Updated weights for policy 0, policy_version 15360 (0.0006)
-[2023-07-08 10:20:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 7888896. Throughput: 0: 6892.9. Samples: 7888896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:15,077][906159] Avg episode reward: [(0, '364.124')]
-[2023-07-08 10:20:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015408_7888896.pth...
-[2023-07-08 10:20:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015000_7680000.pth
-[2023-07-08 10:20:17,338][906414] Updated weights for policy 0, policy_version 15440 (0.0005)
-[2023-07-08 10:20:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 7921664. Throughput: 0: 6900.4. Samples: 7909656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:20,077][906159] Avg episode reward: [(0, '360.085')]
-[2023-07-08 10:20:23,330][906414] Updated weights for policy 0, policy_version 15520 (0.0005)
-[2023-07-08 10:20:25,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 7954432. Throughput: 0: 6897.1. Samples: 7950800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:25,077][906159] Avg episode reward: [(0, '368.258')]
-[2023-07-08 10:20:29,176][906414] Updated weights for policy 0, policy_version 15600 (0.0005)
-[2023-07-08 10:20:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 7991296. Throughput: 0: 6905.7. Samples: 7992944. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:20:30,077][906159] Avg episode reward: [(0, '360.845')]
-[2023-07-08 10:20:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015608_7991296.pth...
-[2023-07-08 10:20:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015200_7782400.pth
-[2023-07-08 10:20:35,036][906414] Updated weights for policy 0, policy_version 15680 (0.0005)
-[2023-07-08 10:20:35,077][906159] Fps is (10 sec: 7372.8, 60 sec: 6963.2, 300 sec: 6734.1). Total num frames: 8028160. Throughput: 0: 6913.2. Samples: 8014004. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:20:35,077][906159] Avg episode reward: [(0, '349.776')]
-[2023-07-08 10:20:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6894.9, 300 sec: 6734.1). Total num frames: 8060928. Throughput: 0: 6881.6. Samples: 8054280. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:40,077][906159] Avg episode reward: [(0, '333.313')]
-[2023-07-08 10:20:41,181][906414] Updated weights for policy 0, policy_version 15760 (0.0005)
-[2023-07-08 10:20:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6894.9, 300 sec: 6720.2). Total num frames: 8093696. Throughput: 0: 6868.5. Samples: 8094524. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:45,077][906159] Avg episode reward: [(0, '341.722')]
-[2023-07-08 10:20:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015808_8093696.pth...
-[2023-07-08 10:20:45,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015408_7888896.pth
-[2023-07-08 10:20:47,289][906414] Updated weights for policy 0, policy_version 15840 (0.0005)
-[2023-07-08 10:20:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6720.2). Total num frames: 8126464. Throughput: 0: 6884.6. Samples: 8114752. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:20:50,077][906159] Avg episode reward: [(0, '349.130')]
-[2023-07-08 10:20:53,476][906414] Updated weights for policy 0, policy_version 15920 (0.0004)
-[2023-07-08 10:20:55,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 8159232. Throughput: 0: 6851.3. Samples: 8154700. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:20:55,077][906159] Avg episode reward: [(0, '333.177')]
-[2023-07-08 10:20:59,618][906414] Updated weights for policy 0, policy_version 16000 (0.0005)
-[2023-07-08 10:21:00,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 8192000. Throughput: 0: 6794.8. Samples: 8194664. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:21:00,077][906159] Avg episode reward: [(0, '355.543')]
-[2023-07-08 10:21:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016000_8192000.pth...
-[2023-07-08 10:21:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015608_7991296.pth
-[2023-07-08 10:21:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8224768. Throughput: 0: 6775.6. Samples: 8214560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:05,077][906159] Avg episode reward: [(0, '366.258')]
-[2023-07-08 10:21:05,780][906414] Updated weights for policy 0, policy_version 16080 (0.0005)
-[2023-07-08 10:21:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 8257536. Throughput: 0: 6747.7. Samples: 8254448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:10,077][906159] Avg episode reward: [(0, '343.306')]
-[2023-07-08 10:21:11,948][906414] Updated weights for policy 0, policy_version 16160 (0.0005)
-[2023-07-08 10:21:15,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8294400. Throughput: 0: 6700.4. Samples: 8294464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:15,077][906159] Avg episode reward: [(0, '366.075')]
-[2023-07-08 10:21:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016200_8294400.pth...
-[2023-07-08 10:21:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015808_8093696.pth
-[2023-07-08 10:21:18,017][906414] Updated weights for policy 0, policy_version 16240 (0.0005)
-[2023-07-08 10:21:20,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 8327168. Throughput: 0: 6686.0. Samples: 8314872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:20,077][906159] Avg episode reward: [(0, '354.072')]
-[2023-07-08 10:21:24,051][906414] Updated weights for policy 0, policy_version 16320 (0.0005)
-[2023-07-08 10:21:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6692.4). Total num frames: 8359936. Throughput: 0: 6691.7. Samples: 8355408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:25,077][906159] Avg episode reward: [(0, '341.727')]
-[2023-07-08 10:21:29,995][906414] Updated weights for policy 0, policy_version 16400 (0.0005)
-[2023-07-08 10:21:30,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8396800. Throughput: 0: 6717.4. Samples: 8396808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:30,078][906159] Avg episode reward: [(0, '317.941')]
-[2023-07-08 10:21:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016400_8396800.pth...
-[2023-07-08 10:21:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016000_8192000.pth
-[2023-07-08 10:21:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6692.4). Total num frames: 8429568. Throughput: 0: 6700.7. Samples: 8416284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:35,077][906159] Avg episode reward: [(0, '335.412')]
-[2023-07-08 10:21:36,188][906414] Updated weights for policy 0, policy_version 16480 (0.0006)
-[2023-07-08 10:21:40,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6690.1, 300 sec: 6692.4). Total num frames: 8462336. Throughput: 0: 6721.4. Samples: 8457164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:40,077][906159] Avg episode reward: [(0, '325.828')]
-[2023-07-08 10:21:42,208][906414] Updated weights for policy 0, policy_version 16560 (0.0005)
-[2023-07-08 10:21:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6692.4). Total num frames: 8495104. Throughput: 0: 6742.1. Samples: 8498060. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:45,077][906159] Avg episode reward: [(0, '326.999')]
-[2023-07-08 10:21:45,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016592_8495104.pth...
-[2023-07-08 10:21:45,082][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016200_8294400.pth
-[2023-07-08 10:21:48,196][906414] Updated weights for policy 0, policy_version 16640 (0.0005)
-[2023-07-08 10:21:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8531968. Throughput: 0: 6755.4. Samples: 8518552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:21:50,077][906159] Avg episode reward: [(0, '314.408')]
-[2023-07-08 10:21:54,270][906414] Updated weights for policy 0, policy_version 16720 (0.0006)
-[2023-07-08 10:21:55,077][906159] Fps is (10 sec: 6963.3, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8564736. Throughput: 0: 6760.5. Samples: 8558672. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:21:55,077][906159] Avg episode reward: [(0, '345.402')]
-[2023-07-08 10:22:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8597504. Throughput: 0: 6777.5. Samples: 8599452. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:22:00,077][906159] Avg episode reward: [(0, '323.564')]
-[2023-07-08 10:22:00,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016792_8597504.pth...
-[2023-07-08 10:22:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016400_8396800.pth
-[2023-07-08 10:22:00,329][906414] Updated weights for policy 0, policy_version 16800 (0.0006)
-[2023-07-08 10:22:05,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8630272. Throughput: 0: 6775.2. Samples: 8619756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:05,077][906159] Avg episode reward: [(0, '333.112')]
-[2023-07-08 10:22:06,274][906414] Updated weights for policy 0, policy_version 16880 (0.0006)
-[2023-07-08 10:22:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6706.3). Total num frames: 8667136. Throughput: 0: 6793.7. Samples: 8661124. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:10,077][906159] Avg episode reward: [(0, '317.817')]
-[2023-07-08 10:22:12,276][906414] Updated weights for policy 0, policy_version 16960 (0.0005)
-[2023-07-08 10:22:15,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8699904. Throughput: 0: 6760.8. Samples: 8701044. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:22:15,078][906159] Avg episode reward: [(0, '315.047')]
-[2023-07-08 10:22:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016992_8699904.pth...
-[2023-07-08 10:22:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016592_8495104.pth
-[2023-07-08 10:22:18,524][906414] Updated weights for policy 0, policy_version 17040 (0.0005)
-[2023-07-08 10:22:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8732672. Throughput: 0: 6766.2. Samples: 8720764. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:22:20,077][906159] Avg episode reward: [(0, '320.067')]
-[2023-07-08 10:22:24,781][906414] Updated weights for policy 0, policy_version 17120 (0.0004)
-[2023-07-08 10:22:25,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6706.3). Total num frames: 8765440. Throughput: 0: 6742.4. Samples: 8760572. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:22:25,077][906159] Avg episode reward: [(0, '314.396')]
-[2023-07-08 10:22:30,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6706.3). Total num frames: 8798208. Throughput: 0: 6696.5. Samples: 8799404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:30,077][906159] Avg episode reward: [(0, '332.145')]
-[2023-07-08 10:22:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017184_8798208.pth...
-[2023-07-08 10:22:30,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016792_8597504.pth
-[2023-07-08 10:22:31,112][906414] Updated weights for policy 0, policy_version 17200 (0.0005)
-[2023-07-08 10:22:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6706.3). Total num frames: 8830976. Throughput: 0: 6674.0. Samples: 8818880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:35,077][906159] Avg episode reward: [(0, '308.189')]
-[2023-07-08 10:22:37,147][906414] Updated weights for policy 0, policy_version 17280 (0.0005)
-[2023-07-08 10:22:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6706.3). Total num frames: 8863744. Throughput: 0: 6690.0. Samples: 8859720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:40,077][906159] Avg episode reward: [(0, '322.140')]
-[2023-07-08 10:22:43,294][906414] Updated weights for policy 0, policy_version 17360 (0.0005)
-[2023-07-08 10:22:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6706.3). Total num frames: 8896512. Throughput: 0: 6674.9. Samples: 8899824. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:45,077][906159] Avg episode reward: [(0, '318.197')]
-[2023-07-08 10:22:45,132][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017384_8900608.pth...
-[2023-07-08 10:22:45,135][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016992_8699904.pth
-[2023-07-08 10:22:49,401][906414] Updated weights for policy 0, policy_version 17440 (0.0005)
-[2023-07-08 10:22:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6720.2). Total num frames: 8933376. Throughput: 0: 6664.4. Samples: 8919656. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:22:50,077][906159] Avg episode reward: [(0, '323.649')]
-[2023-07-08 10:22:55,077][906159] Fps is (10 sec: 6963.1, 60 sec: 6690.1, 300 sec: 6720.2). Total num frames: 8966144. Throughput: 0: 6670.1. Samples: 8961280. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:22:55,077][906159] Avg episode reward: [(0, '321.120')]
-[2023-07-08 10:22:55,320][906414] Updated weights for policy 0, policy_version 17520 (0.0005)
-[2023-07-08 10:23:00,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6720.2). Total num frames: 8998912. Throughput: 0: 6692.5. Samples: 9002204. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 10:23:00,077][906159] Avg episode reward: [(0, '330.140')]
-[2023-07-08 10:23:00,132][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017584_9003008.pth...
-[2023-07-08 10:23:00,134][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017184_8798208.pth
-[2023-07-08 10:23:01,320][906414] Updated weights for policy 0, policy_version 17600 (0.0004)
-[2023-07-08 10:23:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6734.1). Total num frames: 9035776. Throughput: 0: 6717.1. Samples: 9023036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:05,077][906159] Avg episode reward: [(0, '319.169')]
-[2023-07-08 10:23:07,479][906414] Updated weights for policy 0, policy_version 17680 (0.0005)
-[2023-07-08 10:23:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6690.1, 300 sec: 6734.1). Total num frames: 9068544. Throughput: 0: 6693.5. Samples: 9061780. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:10,077][906159] Avg episode reward: [(0, '358.785')]
-[2023-07-08 10:23:13,544][906414] Updated weights for policy 0, policy_version 17760 (0.0005)
-[2023-07-08 10:23:15,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6734.1). Total num frames: 9101312. Throughput: 0: 6748.1. Samples: 9103068. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:15,077][906159] Avg episode reward: [(0, '343.711')]
-[2023-07-08 10:23:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017776_9101312.pth...
-[2023-07-08 10:23:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017384_8900608.pth
-[2023-07-08 10:23:19,496][906414] Updated weights for policy 0, policy_version 17840 (0.0003)
-[2023-07-08 10:23:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6734.1). Total num frames: 9134080. Throughput: 0: 6775.1. Samples: 9123760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:20,077][906159] Avg episode reward: [(0, '330.636')]
-[2023-07-08 10:23:25,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6748.0). Total num frames: 9170944. Throughput: 0: 6781.5. Samples: 9164888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:25,078][906159] Avg episode reward: [(0, '327.243')]
-[2023-07-08 10:23:25,497][906414] Updated weights for policy 0, policy_version 17920 (0.0003)
-[2023-07-08 10:23:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6748.0). Total num frames: 9203712. Throughput: 0: 6807.3. Samples: 9206152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:30,078][906159] Avg episode reward: [(0, '338.101')]
-[2023-07-08 10:23:30,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017976_9203712.pth...
-[2023-07-08 10:23:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017584_9003008.pth
-[2023-07-08 10:23:31,413][906414] Updated weights for policy 0, policy_version 18000 (0.0003)
-[2023-07-08 10:23:35,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6761.9). Total num frames: 9240576. Throughput: 0: 6828.1. Samples: 9226920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:35,077][906159] Avg episode reward: [(0, '339.239')]
-[2023-07-08 10:23:37,410][906414] Updated weights for policy 0, policy_version 18080 (0.0003)
-[2023-07-08 10:23:40,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6761.9). Total num frames: 9273344. Throughput: 0: 6805.1. Samples: 9267508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:40,077][906159] Avg episode reward: [(0, '324.227')]
-[2023-07-08 10:23:43,411][906414] Updated weights for policy 0, policy_version 18160 (0.0003)
-[2023-07-08 10:23:45,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6761.9). Total num frames: 9306112. Throughput: 0: 6806.4. Samples: 9308492. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:45,077][906159] Avg episode reward: [(0, '316.343')]
-[2023-07-08 10:23:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018176_9306112.pth...
-[2023-07-08 10:23:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017776_9101312.pth
-[2023-07-08 10:23:49,637][906414] Updated weights for policy 0, policy_version 18240 (0.0005)
-[2023-07-08 10:23:50,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9338880. Throughput: 0: 6779.4. Samples: 9328108. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:50,077][906159] Avg episode reward: [(0, '304.617')]
-[2023-07-08 10:23:55,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9371648. Throughput: 0: 6796.5. Samples: 9367624. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 10:23:55,077][906159] Avg episode reward: [(0, '321.866')]
-[2023-07-08 10:23:55,726][906414] Updated weights for policy 0, policy_version 18320 (0.0005)
-[2023-07-08 10:24:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6775.8). Total num frames: 9408512. Throughput: 0: 6787.8. Samples: 9408520. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:24:00,077][906159] Avg episode reward: [(0, '314.208')]
-[2023-07-08 10:24:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018376_9408512.pth...
-[2023-07-08 10:24:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017976_9203712.pth
-[2023-07-08 10:24:01,721][906414] Updated weights for policy 0, policy_version 18400 (0.0006)
-[2023-07-08 10:24:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6775.8). Total num frames: 9441280. Throughput: 0: 6783.1. Samples: 9429000. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 10:24:05,077][906159] Avg episode reward: [(0, '325.440')]
-[2023-07-08 10:24:08,005][906414] Updated weights for policy 0, policy_version 18480 (0.0006)
-[2023-07-08 10:24:10,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6775.8). Total num frames: 9474048. Throughput: 0: 6745.2. Samples: 9468420. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:24:10,077][906159] Avg episode reward: [(0, '307.586')]
-[2023-07-08 10:24:14,266][906414] Updated weights for policy 0, policy_version 18560 (0.0006)
-[2023-07-08 10:24:15,077][906159] Fps is (10 sec: 6553.5, 60 sec: 6758.4, 300 sec: 6775.8). Total num frames: 9506816. Throughput: 0: 6690.7. Samples: 9507232. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:24:15,077][906159] Avg episode reward: [(0, '357.909')]
-[2023-07-08 10:24:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018568_9506816.pth...
-[2023-07-08 10:24:15,084][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018176_9306112.pth
-[2023-07-08 10:24:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9539584. Throughput: 0: 6691.2. Samples: 9528024. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:24:20,077][906159] Avg episode reward: [(0, '314.231')]
-[2023-07-08 10:24:20,219][906414] Updated weights for policy 0, policy_version 18640 (0.0006)
-[2023-07-08 10:24:25,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6775.8). Total num frames: 9576448. Throughput: 0: 6698.7. Samples: 9568948. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:24:25,077][906159] Avg episode reward: [(0, '322.376')]
-[2023-07-08 10:24:26,250][906414] Updated weights for policy 0, policy_version 18720 (0.0006)
-[2023-07-08 10:24:30,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6775.8). Total num frames: 9609216. Throughput: 0: 6700.2. Samples: 9610000. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:24:30,077][906159] Avg episode reward: [(0, '333.969')]
-[2023-07-08 10:24:30,080][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018768_9609216.pth...
-[2023-07-08 10:24:30,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018376_9408512.pth
-[2023-07-08 10:24:32,254][906414] Updated weights for policy 0, policy_version 18800 (0.0006)
-[2023-07-08 10:24:35,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6761.9). Total num frames: 9641984. Throughput: 0: 6715.8. Samples: 9630320. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:24:35,077][906159] Avg episode reward: [(0, '335.624')]
-[2023-07-08 10:24:38,365][906414] Updated weights for policy 0, policy_version 18880 (0.0006)
-[2023-07-08 10:24:40,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6690.1, 300 sec: 6761.9). Total num frames: 9674752. Throughput: 0: 6735.6. Samples: 9670728. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:24:40,077][906159] Avg episode reward: [(0, '305.504')]
-[2023-07-08 10:24:44,361][906414] Updated weights for policy 0, policy_version 18960 (0.0006)
-[2023-07-08 10:24:45,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9711616. Throughput: 0: 6740.3. Samples: 9711832. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:24:45,078][906159] Avg episode reward: [(0, '331.574')]
-[2023-07-08 10:24:45,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018968_9711616.pth...
-[2023-07-08 10:24:45,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018568_9506816.pth
-[2023-07-08 10:24:50,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9744384. Throughput: 0: 6745.3. Samples: 9732540. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:24:50,077][906159] Avg episode reward: [(0, '307.999')]
-[2023-07-08 10:24:50,257][906414] Updated weights for policy 0, policy_version 19040 (0.0006)
-[2023-07-08 10:24:55,077][906159] Fps is (10 sec: 6553.7, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9777152. Throughput: 0: 6778.9. Samples: 9773472. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:24:55,077][906159] Avg episode reward: [(0, '314.189')]
-[2023-07-08 10:24:56,256][906414] Updated weights for policy 0, policy_version 19120 (0.0006)
-[2023-07-08 10:25:00,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9814016. Throughput: 0: 6847.1. Samples: 9815352. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 10:25:00,077][906159] Avg episode reward: [(0, '310.829')]
-[2023-07-08 10:25:00,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019168_9814016.pth...
-[2023-07-08 10:25:00,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018768_9609216.pth
-[2023-07-08 10:25:02,192][906414] Updated weights for policy 0, policy_version 19200 (0.0006)
-[2023-07-08 10:25:05,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6758.4, 300 sec: 6761.9). Total num frames: 9846784. Throughput: 0: 6836.3. Samples: 9835656. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:25:05,077][906159] Avg episode reward: [(0, '326.106')]
-[2023-07-08 10:25:08,206][906414] Updated weights for policy 0, policy_version 19280 (0.0006)
-[2023-07-08 10:25:10,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6761.9). Total num frames: 9883648. Throughput: 0: 6838.0. Samples: 9876656. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 10:25:10,077][906159] Avg episode reward: [(0, '316.188')]
-[2023-07-08 10:25:14,366][906414] Updated weights for policy 0, policy_version 19360 (0.0005)
-[2023-07-08 10:25:15,077][906159] Fps is (10 sec: 6963.2, 60 sec: 6826.7, 300 sec: 6761.9). Total num frames: 9916416. Throughput: 0: 6810.7. Samples: 9916480. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:25:15,077][906159] Avg episode reward: [(0, '315.789')]
-[2023-07-08 10:25:15,081][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019368_9916416.pth...
-[2023-07-08 10:25:15,083][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018968_9711616.pth
-[2023-07-08 10:25:20,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6826.7, 300 sec: 6761.9). Total num frames: 9949184. Throughput: 0: 6814.4. Samples: 9936968. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:25:20,077][906159] Avg episode reward: [(0, '321.317')]
-[2023-07-08 10:25:20,476][906414] Updated weights for policy 0, policy_version 19440 (0.0005)
-[2023-07-08 10:25:25,077][906159] Fps is (10 sec: 6553.6, 60 sec: 6758.4, 300 sec: 6748.0). Total num frames: 9981952. Throughput: 0: 6783.9. Samples: 9976004. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 10:25:25,077][906159] Avg episode reward: [(0, '330.912')]
-[2023-07-08 10:25:26,756][906414] Updated weights for policy 0, policy_version 19520 (0.0005)
-[2023-07-08 10:25:28,544][906400] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000000
-[2023-07-08 10:25:28,545][906446] Stopping RolloutWorker_w2...
-[2023-07-08 10:25:28,545][906506] Stopping RolloutWorker_w5...
-[2023-07-08 10:25:28,545][906448] Stopping RolloutWorker_w3...
-[2023-07-08 10:25:28,545][906513] Stopping RolloutWorker_w6...
-[2023-07-08 10:25:28,545][906449] Stopping RolloutWorker_w4...
-[2023-07-08 10:25:28,545][906413] Stopping RolloutWorker_w0...
-[2023-07-08 10:25:28,545][906506] Loop rollout_proc5_evt_loop terminating...
-[2023-07-08 10:25:28,545][906448] Loop rollout_proc3_evt_loop terminating...
-[2023-07-08 10:25:28,545][906447] Stopping RolloutWorker_w1...
-[2023-07-08 10:25:28,545][906545] Stopping RolloutWorker_w7...
-[2023-07-08 10:25:28,545][906449] Loop rollout_proc4_evt_loop terminating...
-[2023-07-08 10:25:28,545][906513] Loop rollout_proc6_evt_loop terminating...
-[2023-07-08 10:25:28,545][906413] Loop rollout_proc0_evt_loop terminating...
-[2023-07-08 10:25:28,545][906446] Loop rollout_proc2_evt_loop terminating...
-[2023-07-08 10:25:28,545][906447] Loop rollout_proc1_evt_loop terminating...
-[2023-07-08 10:25:28,545][906545] Loop rollout_proc7_evt_loop terminating...
-[2023-07-08 10:25:28,545][906159] Component RolloutWorker_w2 stopped!
-[2023-07-08 10:25:28,545][906400] Stopping Batcher_0...
-[2023-07-08 10:25:28,546][906159] Component RolloutWorker_w5 stopped!
-[2023-07-08 10:25:28,546][906400] Loop batcher_evt_loop terminating...
-[2023-07-08 10:25:28,546][906159] Component RolloutWorker_w6 stopped!
-[2023-07-08 10:25:28,546][906159] Component RolloutWorker_w3 stopped!
-[2023-07-08 10:25:28,546][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
-[2023-07-08 10:25:28,547][906159] Component RolloutWorker_w4 stopped!
-[2023-07-08 10:25:28,547][906159] Component RolloutWorker_w0 stopped!
-[2023-07-08 10:25:28,547][906159] Component RolloutWorker_w7 stopped!
-[2023-07-08 10:25:28,547][906159] Component RolloutWorker_w1 stopped!
-[2023-07-08 10:25:28,548][906159] Component Batcher_0 stopped!
-[2023-07-08 10:25:28,549][906400] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019168_9814016.pth
-[2023-07-08 10:25:28,549][906400] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
-[2023-07-08 10:25:28,551][906400] Stopping LearnerWorker_p0...
-[2023-07-08 10:25:28,552][906400] Loop learner_proc0_evt_loop terminating...
-[2023-07-08 10:25:28,552][906159] Component LearnerWorker_p0 stopped!
-[2023-07-08 10:25:28,618][906414] Weights refcount: 2 0
-[2023-07-08 10:25:28,619][906414] Stopping InferenceWorker_p0-w0...
-[2023-07-08 10:25:28,620][906414] Loop inference_proc0-0_evt_loop terminating...
-[2023-07-08 10:25:28,620][906159] Component InferenceWorker_p0-w0 stopped!
-[2023-07-08 10:25:28,620][906159] Waiting for process learner_proc0 to stop...
-[2023-07-08 10:25:29,139][906159] Waiting for process inference_proc0-0 to join...
-[2023-07-08 10:25:29,166][906159] Waiting for process rollout_proc0 to join...
-[2023-07-08 10:25:29,167][906159] Waiting for process rollout_proc1 to join...
-[2023-07-08 10:25:29,167][906159] Waiting for process rollout_proc2 to join...
-[2023-07-08 10:25:29,167][906159] Waiting for process rollout_proc3 to join...
-[2023-07-08 10:25:29,167][906159] Waiting for process rollout_proc4 to join...
-[2023-07-08 10:25:29,168][906159] Waiting for process rollout_proc5 to join...
-[2023-07-08 10:25:29,168][906159] Waiting for process rollout_proc6 to join...
-[2023-07-08 10:25:29,168][906159] Waiting for process rollout_proc7 to join...
-[2023-07-08 10:25:29,168][906159] Batcher 0 profile tree view:
-batching: 1.8219, releasing_batches: 1.5964
-[2023-07-08 10:25:29,168][906159] InferenceWorker_p0-w0 profile tree view:
+[2023-07-09 02:26:08,164][1151586] Worker 5 uses CPU cores [20, 21, 22, 23]
+[2023-07-09 02:26:08,197][1151619] Worker 7 uses CPU cores [28, 29, 30, 31]
+[2023-07-09 02:26:08,266][1151474] Using optimizer <class 'torch.optim.adam.Adam'>
+[2023-07-09 02:26:08,267][1151474] No checkpoints found
+[2023-07-09 02:26:08,267][1151474] Did not load from checkpoint, starting from scratch!
+[2023-07-09 02:26:08,267][1151474] Initialized policy 0 weights for model version 0
+[2023-07-09 02:26:08,268][1151474] LearnerWorker_p0 finished initialization!
+[2023-07-09 02:26:08,270][1151487] RunningMeanStd input shape: (39,)
+[2023-07-09 02:26:08,271][1151487] RunningMeanStd input shape: (1,)
+[2023-07-09 02:26:08,344][1151554] Worker 4 uses CPU cores [16, 17, 18, 19]
+[2023-07-09 02:26:08,362][1151233] Inference worker 0-0 is ready!
+[2023-07-09 02:26:08,362][1151233] All inference workers are ready! Signal rollout workers to start!
+[2023-07-09 02:26:08,510][1151618] Worker 6 uses CPU cores [24, 25, 26, 27]
+[2023-07-09 02:26:12,295][1151233] Fps is (10 sec: nan, 60 sec: nan, 300 sec: nan). Total num frames: 0. Throughput: 0: nan. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-07-09 02:26:13,320][1151619] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,339][1151619] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,346][1151488] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,352][1151522] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,364][1151488] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,371][1151522] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,372][1151554] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,374][1151521] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,388][1151619] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,391][1151554] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,392][1151521] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,414][1151488] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,415][1151586] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,420][1151522] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,434][1151586] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,442][1151521] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,456][1151554] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,483][1151586] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,486][1151619] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,512][1151488] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,517][1151522] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,541][1151521] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,555][1151554] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,565][1151618] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,582][1151586] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,583][1151618] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,633][1151618] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:13,733][1151618] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:13,883][1151489] Decorrelating experience for 0 frames...
+[2023-07-09 02:26:13,908][1151489] Decorrelating experience for 64 frames...
+[2023-07-09 02:26:13,965][1151489] Decorrelating experience for 128 frames...
+[2023-07-09 02:26:14,075][1151489] Decorrelating experience for 192 frames...
+[2023-07-09 02:26:17,295][1151233] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 0.0. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-07-09 02:26:17,296][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000000_0.pth...
+[2023-07-09 02:26:18,464][1151522] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,466][1151619] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,485][1151488] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,497][1151521] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,518][1151554] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,562][1151586] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,641][1151522] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,643][1151619] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,663][1151488] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,676][1151521] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,698][1151554] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,740][1151586] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,744][1151618] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:18,865][1151522] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:18,868][1151619] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:18,887][1151488] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:18,903][1151521] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:18,920][1151618] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:18,922][1151554] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:18,966][1151586] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:19,119][1151522] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,123][1151619] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,143][1151488] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,144][1151618] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:19,160][1151521] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,178][1151554] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,224][1151586] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,401][1151618] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:19,749][1151489] Decorrelating experience for 256 frames...
+[2023-07-09 02:26:19,928][1151489] Decorrelating experience for 320 frames...
+[2023-07-09 02:26:20,155][1151489] Decorrelating experience for 384 frames...
+[2023-07-09 02:26:20,405][1151489] Decorrelating experience for 448 frames...
+[2023-07-09 02:26:22,295][1151233] Fps is (10 sec: 819.2, 60 sec: 819.2, 300 sec: 819.2). Total num frames: 8192. Throughput: 0: 358.4. Samples: 3584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:26:22,296][1151233] Avg episode reward: [(0, '2.113')]
+[2023-07-09 02:26:25,457][1151233] Heartbeat connected on Batcher_0
+[2023-07-09 02:26:25,460][1151233] Heartbeat connected on LearnerWorker_p0
+[2023-07-09 02:26:25,465][1151233] Heartbeat connected on InferenceWorker_p0-w0
+[2023-07-09 02:26:25,471][1151233] Heartbeat connected on RolloutWorker_w0
+[2023-07-09 02:26:25,475][1151233] Heartbeat connected on RolloutWorker_w1
+[2023-07-09 02:26:25,477][1151233] Heartbeat connected on RolloutWorker_w2
+[2023-07-09 02:26:25,479][1151233] Heartbeat connected on RolloutWorker_w3
+[2023-07-09 02:26:25,482][1151233] Heartbeat connected on RolloutWorker_w4
+[2023-07-09 02:26:25,484][1151233] Heartbeat connected on RolloutWorker_w5
+[2023-07-09 02:26:25,486][1151233] Heartbeat connected on RolloutWorker_w6
+[2023-07-09 02:26:25,488][1151233] Heartbeat connected on RolloutWorker_w7
+[2023-07-09 02:26:26,576][1151487] Updated weights for policy 0, policy_version 80 (0.0005)
+[2023-07-09 02:26:27,295][1151233] Fps is (10 sec: 4505.6, 60 sec: 3003.8, 300 sec: 3003.8). Total num frames: 45056. Throughput: 0: 2702.4. Samples: 40536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:26:27,295][1151233] Avg episode reward: [(0, '5.482')]
+[2023-07-09 02:26:31,884][1151487] Updated weights for policy 0, policy_version 160 (0.0005)
+[2023-07-09 02:26:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 4096.0, 300 sec: 4096.0). Total num frames: 81920. Throughput: 0: 3200.2. Samples: 64004. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:26:32,296][1151233] Avg episode reward: [(0, '6.335')]
+[2023-07-09 02:26:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000160_81920.pth...
+[2023-07-09 02:26:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 4751.4, 300 sec: 4751.4). Total num frames: 118784. Throughput: 0: 4329.9. Samples: 108248. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:26:37,296][1151233] Avg episode reward: [(0, '6.570')]
+[2023-07-09 02:26:37,296][1151474] Saving new best policy, reward=6.570!
+[2023-07-09 02:26:37,494][1151487] Updated weights for policy 0, policy_version 240 (0.0005)
+[2023-07-09 02:26:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 5188.3, 300 sec: 5188.3). Total num frames: 155648. Throughput: 0: 5053.9. Samples: 151616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:26:42,296][1151233] Avg episode reward: [(0, '6.609')]
+[2023-07-09 02:26:42,296][1151474] Saving new best policy, reward=6.609!
+[2023-07-09 02:26:43,016][1151487] Updated weights for policy 0, policy_version 320 (0.0005)
+[2023-07-09 02:26:47,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 5617.4, 300 sec: 5617.4). Total num frames: 196608. Throughput: 0: 4979.2. Samples: 174272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:26:47,295][1151233] Avg episode reward: [(0, '6.793')]
+[2023-07-09 02:26:47,297][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000384_196608.pth...
+[2023-07-09 02:26:47,360][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000000_0.pth
+[2023-07-09 02:26:47,360][1151474] Saving new best policy, reward=6.793!
+[2023-07-09 02:26:47,886][1151487] Updated weights for policy 0, policy_version 400 (0.0005)
+[2023-07-09 02:26:52,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 5939.2, 300 sec: 5939.2). Total num frames: 237568. Throughput: 0: 5626.1. Samples: 225044. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:26:52,295][1151233] Avg episode reward: [(0, '6.724')]
+[2023-07-09 02:26:52,938][1151487] Updated weights for policy 0, policy_version 480 (0.0005)
+[2023-07-09 02:26:57,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 6098.5, 300 sec: 6098.5). Total num frames: 274432. Throughput: 0: 6032.7. Samples: 271468. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:26:57,295][1151233] Avg episode reward: [(0, '6.632')]
+[2023-07-09 02:26:58,468][1151487] Updated weights for policy 0, policy_version 560 (0.0005)
+[2023-07-09 02:27:02,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 6307.8, 300 sec: 6307.8). Total num frames: 315392. Throughput: 0: 6555.2. Samples: 294984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:02,296][1151233] Avg episode reward: [(0, '6.767')]
+[2023-07-09 02:27:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000616_315392.pth...
+[2023-07-09 02:27:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000160_81920.pth
+[2023-07-09 02:27:03,949][1151487] Updated weights for policy 0, policy_version 640 (0.0005)
+[2023-07-09 02:27:07,295][1151233] Fps is (10 sec: 7782.2, 60 sec: 6404.7, 300 sec: 6404.7). Total num frames: 352256. Throughput: 0: 7449.5. Samples: 338812. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:07,296][1151233] Avg episode reward: [(0, '6.845')]
+[2023-07-09 02:27:07,297][1151474] Saving new best policy, reward=6.845!
+[2023-07-09 02:27:09,574][1151487] Updated weights for policy 0, policy_version 720 (0.0005)
+[2023-07-09 02:27:12,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 6417.1, 300 sec: 6417.1). Total num frames: 385024. Throughput: 0: 7593.3. Samples: 382236. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:27:12,295][1151233] Avg episode reward: [(0, '6.721')]
+[2023-07-09 02:27:14,808][1151487] Updated weights for policy 0, policy_version 800 (0.0005)
+[2023-07-09 02:27:17,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7099.7, 300 sec: 6553.6). Total num frames: 425984. Throughput: 0: 7616.1. Samples: 406728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:17,296][1151233] Avg episode reward: [(0, '6.918')]
+[2023-07-09 02:27:17,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000832_425984.pth...
+[2023-07-09 02:27:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000384_196608.pth
+[2023-07-09 02:27:17,302][1151474] Saving new best policy, reward=6.918!
+[2023-07-09 02:27:20,112][1151487] Updated weights for policy 0, policy_version 880 (0.0005)
+[2023-07-09 02:27:22,295][1151233] Fps is (10 sec: 8191.9, 60 sec: 7645.9, 300 sec: 6670.6). Total num frames: 466944. Throughput: 0: 7663.8. Samples: 453120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:22,296][1151233] Avg episode reward: [(0, '6.941')]
+[2023-07-09 02:27:22,297][1151474] Saving new best policy, reward=6.941!
+[2023-07-09 02:27:25,504][1151487] Updated weights for policy 0, policy_version 960 (0.0005)
+[2023-07-09 02:27:27,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 6717.5). Total num frames: 503808. Throughput: 0: 7719.0. Samples: 498972. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:27,296][1151233] Avg episode reward: [(0, '6.977')]
+[2023-07-09 02:27:27,296][1151474] Saving new best policy, reward=6.977!
+[2023-07-09 02:27:30,692][1151487] Updated weights for policy 0, policy_version 1040 (0.0005)
+[2023-07-09 02:27:32,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 6809.6). Total num frames: 544768. Throughput: 0: 7762.4. Samples: 523580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:32,296][1151233] Avg episode reward: [(0, '7.029')]
+[2023-07-09 02:27:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001064_544768.pth...
+[2023-07-09 02:27:32,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000616_315392.pth
+[2023-07-09 02:27:32,302][1151474] Saving new best policy, reward=7.029!
+[2023-07-09 02:27:36,000][1151487] Updated weights for policy 0, policy_version 1120 (0.0005)
+[2023-07-09 02:27:37,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 6842.7). Total num frames: 581632. Throughput: 0: 7652.7. Samples: 569416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:37,296][1151233] Avg episode reward: [(0, '7.095')]
+[2023-07-09 02:27:37,296][1151474] Saving new best policy, reward=7.095!
+[2023-07-09 02:27:41,080][1151487] Updated weights for policy 0, policy_version 1200 (0.0005)
+[2023-07-09 02:27:42,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7782.4, 300 sec: 6917.7). Total num frames: 622592. Throughput: 0: 7685.1. Samples: 617300. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:42,296][1151233] Avg episode reward: [(0, '7.151')]
+[2023-07-09 02:27:42,296][1151474] Saving new best policy, reward=7.151!
+[2023-07-09 02:27:46,795][1151487] Updated weights for policy 0, policy_version 1280 (0.0005)
+[2023-07-09 02:27:47,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7645.9, 300 sec: 6898.5). Total num frames: 655360. Throughput: 0: 7642.7. Samples: 638904. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:27:47,295][1151233] Avg episode reward: [(0, '7.151')]
+[2023-07-09 02:27:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001280_655360.pth...
+[2023-07-09 02:27:47,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000000832_425984.pth
+[2023-07-09 02:27:52,255][1151487] Updated weights for policy 0, policy_version 1360 (0.0005)
+[2023-07-09 02:27:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 6963.2). Total num frames: 696320. Throughput: 0: 7660.6. Samples: 683536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:52,296][1151233] Avg episode reward: [(0, '7.299')]
+[2023-07-09 02:27:52,296][1151474] Saving new best policy, reward=7.299!
+[2023-07-09 02:27:57,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 6982.7). Total num frames: 733184. Throughput: 0: 7670.5. Samples: 727408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:27:57,295][1151233] Avg episode reward: [(0, '7.189')]
+[2023-07-09 02:27:57,770][1151487] Updated weights for policy 0, policy_version 1440 (0.0005)
+[2023-07-09 02:28:02,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7000.4). Total num frames: 770048. Throughput: 0: 7645.0. Samples: 750752. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:28:02,295][1151233] Avg episode reward: [(0, '7.234')]
+[2023-07-09 02:28:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001504_770048.pth...
+[2023-07-09 02:28:02,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001064_544768.pth
+[2023-07-09 02:28:03,008][1151487] Updated weights for policy 0, policy_version 1520 (0.0006)
+[2023-07-09 02:28:07,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7577.6, 300 sec: 7016.6). Total num frames: 806912. Throughput: 0: 7628.0. Samples: 796380. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:28:07,296][1151233] Avg episode reward: [(0, '7.328')]
+[2023-07-09 02:28:07,296][1151474] Saving new best policy, reward=7.328!
+[2023-07-09 02:28:08,531][1151487] Updated weights for policy 0, policy_version 1600 (0.0005)
+[2023-07-09 02:28:12,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7065.6). Total num frames: 847872. Throughput: 0: 7612.1. Samples: 841516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:28:12,296][1151233] Avg episode reward: [(0, '7.257')]
+[2023-07-09 02:28:13,773][1151487] Updated weights for policy 0, policy_version 1680 (0.0005)
+[2023-07-09 02:28:17,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7077.9). Total num frames: 884736. Throughput: 0: 7577.0. Samples: 864544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:28:17,296][1151233] Avg episode reward: [(0, '7.216')]
+[2023-07-09 02:28:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001728_884736.pth...
+[2023-07-09 02:28:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001280_655360.pth
+[2023-07-09 02:28:19,288][1151487] Updated weights for policy 0, policy_version 1760 (0.0005)
+[2023-07-09 02:28:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7089.2). Total num frames: 921600. Throughput: 0: 7554.7. Samples: 909376. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:28:22,296][1151233] Avg episode reward: [(0, '7.169')]
+[2023-07-09 02:28:24,557][1151487] Updated weights for policy 0, policy_version 1840 (0.0005)
+[2023-07-09 02:28:27,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7645.9, 300 sec: 7130.1). Total num frames: 962560. Throughput: 0: 7553.1. Samples: 957188. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:28:27,296][1151233] Avg episode reward: [(0, '7.346')]
+[2023-07-09 02:28:27,296][1151474] Saving new best policy, reward=7.346!
+[2023-07-09 02:28:29,821][1151487] Updated weights for policy 0, policy_version 1920 (0.0005)
+[2023-07-09 02:28:32,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7577.6, 300 sec: 7138.7). Total num frames: 999424. Throughput: 0: 7574.7. Samples: 979764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:28:32,296][1151233] Avg episode reward: [(0, '7.475')]
+[2023-07-09 02:28:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001952_999424.pth...
+[2023-07-09 02:28:32,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001504_770048.pth
+[2023-07-09 02:28:32,817][1151474] Saving new best policy, reward=7.475!
+[2023-07-09 02:28:35,546][1151487] Updated weights for policy 0, policy_version 2000 (0.0005)
+[2023-07-09 02:28:37,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7577.6, 300 sec: 7146.8). Total num frames: 1036288. Throughput: 0: 7560.3. Samples: 1023748. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:28:37,296][1151233] Avg episode reward: [(0, '7.218')]
+[2023-07-09 02:28:40,881][1151487] Updated weights for policy 0, policy_version 2080 (0.0005)
+[2023-07-09 02:28:42,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7509.3, 300 sec: 7154.4). Total num frames: 1073152. Throughput: 0: 7592.0. Samples: 1069048. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:28:42,296][1151233] Avg episode reward: [(0, '7.373')]
+[2023-07-09 02:28:46,084][1151487] Updated weights for policy 0, policy_version 2160 (0.0005)
+[2023-07-09 02:28:47,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.8, 300 sec: 7187.8). Total num frames: 1114112. Throughput: 0: 7595.5. Samples: 1092552. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:28:47,296][1151233] Avg episode reward: [(0, '7.449')]
+[2023-07-09 02:28:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002176_1114112.pth...
+[2023-07-09 02:28:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001728_884736.pth
+[2023-07-09 02:28:51,356][1151487] Updated weights for policy 0, policy_version 2240 (0.0005)
+[2023-07-09 02:28:52,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7577.6, 300 sec: 7193.6). Total num frames: 1150976. Throughput: 0: 7633.3. Samples: 1139876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:28:52,296][1151233] Avg episode reward: [(0, '7.454')]
+[2023-07-09 02:28:56,855][1151487] Updated weights for policy 0, policy_version 2320 (0.0005)
+[2023-07-09 02:28:57,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7199.0). Total num frames: 1187840. Throughput: 0: 7625.1. Samples: 1184644. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:28:57,296][1151233] Avg episode reward: [(0, '7.477')]
+[2023-07-09 02:28:57,296][1151474] Saving new best policy, reward=7.477!
+[2023-07-09 02:29:02,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7204.1). Total num frames: 1224704. Throughput: 0: 7594.9. Samples: 1206316. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:29:02,296][1151233] Avg episode reward: [(0, '7.463')]
+[2023-07-09 02:29:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002392_1224704.pth...
+[2023-07-09 02:29:02,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000001952_999424.pth
+[2023-07-09 02:29:02,364][1151487] Updated weights for policy 0, policy_version 2400 (0.0005)
+[2023-07-09 02:29:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7209.0). Total num frames: 1261568. Throughput: 0: 7585.6. Samples: 1250728. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:29:07,296][1151233] Avg episode reward: [(0, '7.379')]
+[2023-07-09 02:29:07,853][1151487] Updated weights for policy 0, policy_version 2480 (0.0006)
+[2023-07-09 02:29:12,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7577.6, 300 sec: 7236.3). Total num frames: 1302528. Throughput: 0: 7584.8. Samples: 1298504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:29:12,296][1151233] Avg episode reward: [(0, '7.399')]
+[2023-07-09 02:29:12,996][1151487] Updated weights for policy 0, policy_version 2560 (0.0005)
+[2023-07-09 02:29:17,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7577.6, 300 sec: 7240.0). Total num frames: 1339392. Throughput: 0: 7608.0. Samples: 1322124. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:29:17,295][1151233] Avg episode reward: [(0, '7.474')]
+[2023-07-09 02:29:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002616_1339392.pth...
+[2023-07-09 02:29:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002176_1114112.pth
+[2023-07-09 02:29:18,532][1151487] Updated weights for policy 0, policy_version 2640 (0.0005)
+[2023-07-09 02:29:22,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7265.0). Total num frames: 1380352. Throughput: 0: 7627.5. Samples: 1366984. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:29:22,296][1151233] Avg episode reward: [(0, '7.437')]
+[2023-07-09 02:29:23,737][1151487] Updated weights for policy 0, policy_version 2720 (0.0005)
+[2023-07-09 02:29:27,295][1151233] Fps is (10 sec: 8192.1, 60 sec: 7645.9, 300 sec: 7288.8). Total num frames: 1421312. Throughput: 0: 7704.6. Samples: 1415756. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:29:27,295][1151233] Avg episode reward: [(0, '7.563')]
+[2023-07-09 02:29:27,296][1151474] Saving new best policy, reward=7.563!
+[2023-07-09 02:29:28,565][1151487] Updated weights for policy 0, policy_version 2800 (0.0005)
+[2023-07-09 02:29:32,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7645.9, 300 sec: 7290.9). Total num frames: 1458176. Throughput: 0: 7729.4. Samples: 1440372. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:29:32,295][1151233] Avg episode reward: [(0, '7.527')]
+[2023-07-09 02:29:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002848_1458176.pth...
+[2023-07-09 02:29:32,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002392_1224704.pth
+[2023-07-09 02:29:34,054][1151487] Updated weights for policy 0, policy_version 2880 (0.0005)
+[2023-07-09 02:29:37,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7645.9, 300 sec: 7292.9). Total num frames: 1495040. Throughput: 0: 7673.9. Samples: 1485200. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:29:37,296][1151233] Avg episode reward: [(0, '7.568')]
+[2023-07-09 02:29:37,296][1151474] Saving new best policy, reward=7.568!
+[2023-07-09 02:29:39,396][1151487] Updated weights for policy 0, policy_version 2960 (0.0005)
+[2023-07-09 02:29:42,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7314.3). Total num frames: 1536000. Throughput: 0: 7707.7. Samples: 1531492. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:29:42,295][1151233] Avg episode reward: [(0, '7.521')]
+[2023-07-09 02:29:44,784][1151487] Updated weights for policy 0, policy_version 3040 (0.0006)
+[2023-07-09 02:29:47,295][1151233] Fps is (10 sec: 8191.9, 60 sec: 7714.1, 300 sec: 7334.7). Total num frames: 1576960. Throughput: 0: 7702.7. Samples: 1552936. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:29:47,296][1151233] Avg episode reward: [(0, '7.580')]
+[2023-07-09 02:29:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003080_1576960.pth...
+[2023-07-09 02:29:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002616_1339392.pth
+[2023-07-09 02:29:47,302][1151474] Saving new best policy, reward=7.580!
+[2023-07-09 02:29:49,936][1151487] Updated weights for policy 0, policy_version 3120 (0.0005)
+[2023-07-09 02:29:52,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7714.1, 300 sec: 7335.6). Total num frames: 1613824. Throughput: 0: 7789.2. Samples: 1601244. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:29:52,296][1151233] Avg episode reward: [(0, '7.530')]
+[2023-07-09 02:29:55,593][1151487] Updated weights for policy 0, policy_version 3200 (0.0005)
+[2023-07-09 02:29:57,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7714.1, 300 sec: 7336.4). Total num frames: 1650688. Throughput: 0: 7691.5. Samples: 1644620. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:29:57,296][1151233] Avg episode reward: [(0, '7.547')]
+[2023-07-09 02:30:01,143][1151487] Updated weights for policy 0, policy_version 3280 (0.0005)
+[2023-07-09 02:30:02,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7714.1, 300 sec: 7337.2). Total num frames: 1687552. Throughput: 0: 7663.9. Samples: 1667000. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:30:02,296][1151233] Avg episode reward: [(0, '7.493')]
+[2023-07-09 02:30:02,300][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003296_1687552.pth...
+[2023-07-09 02:30:02,303][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000002848_1458176.pth
+[2023-07-09 02:30:06,437][1151487] Updated weights for policy 0, policy_version 3360 (0.0005)
+[2023-07-09 02:30:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7714.1, 300 sec: 7337.9). Total num frames: 1724416. Throughput: 0: 7672.1. Samples: 1712228. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:30:07,296][1151233] Avg episode reward: [(0, '7.541')]
+[2023-07-09 02:30:11,918][1151487] Updated weights for policy 0, policy_version 3440 (0.0005)
+[2023-07-09 02:30:12,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 7338.7). Total num frames: 1761280. Throughput: 0: 7595.4. Samples: 1757552. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:30:12,296][1151233] Avg episode reward: [(0, '7.470')]
+[2023-07-09 02:30:17,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 7339.4). Total num frames: 1798144. Throughput: 0: 7532.6. Samples: 1779340. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:30:17,296][1151233] Avg episode reward: [(0, '7.529')]
+[2023-07-09 02:30:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003512_1798144.pth...
+[2023-07-09 02:30:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003080_1576960.pth
+[2023-07-09 02:30:17,387][1151487] Updated weights for policy 0, policy_version 3520 (0.0004)
+[2023-07-09 02:30:22,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7645.9, 300 sec: 7356.4). Total num frames: 1839104. Throughput: 0: 7592.9. Samples: 1826880. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:30:22,296][1151233] Avg episode reward: [(0, '7.557')]
+[2023-07-09 02:30:22,515][1151487] Updated weights for policy 0, policy_version 3600 (0.0005)
+[2023-07-09 02:30:27,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7645.9, 300 sec: 7372.8). Total num frames: 1880064. Throughput: 0: 7640.6. Samples: 1875320. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:30:27,296][1151233] Avg episode reward: [(0, '7.459')]
+[2023-07-09 02:30:27,595][1151487] Updated weights for policy 0, policy_version 3680 (0.0005)
+[2023-07-09 02:30:32,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7372.8). Total num frames: 1916928. Throughput: 0: 7637.3. Samples: 1896612. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:30:32,295][1151233] Avg episode reward: [(0, '7.541')]
+[2023-07-09 02:30:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003744_1916928.pth...
+[2023-07-09 02:30:32,299][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003296_1687552.pth
+[2023-07-09 02:30:32,993][1151487] Updated weights for policy 0, policy_version 3760 (0.0005)
+[2023-07-09 02:30:37,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7645.9, 300 sec: 7372.8). Total num frames: 1953792. Throughput: 0: 7609.8. Samples: 1943684. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:30:37,295][1151233] Avg episode reward: [(0, '7.488')]
+[2023-07-09 02:30:38,453][1151487] Updated weights for policy 0, policy_version 3840 (0.0006)
+[2023-07-09 02:30:42,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7388.0). Total num frames: 1994752. Throughput: 0: 7668.6. Samples: 1989708. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:30:42,296][1151233] Avg episode reward: [(0, '7.487')]
+[2023-07-09 02:30:43,454][1151487] Updated weights for policy 0, policy_version 3920 (0.0005)
+[2023-07-09 02:30:47,295][1151233] Fps is (10 sec: 8191.9, 60 sec: 7645.9, 300 sec: 7402.6). Total num frames: 2035712. Throughput: 0: 7735.7. Samples: 2015108. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:30:47,296][1151233] Avg episode reward: [(0, '7.531')]
+[2023-07-09 02:30:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003976_2035712.pth...
+[2023-07-09 02:30:47,303][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003512_1798144.pth
+[2023-07-09 02:30:48,430][1151487] Updated weights for policy 0, policy_version 4000 (0.0005)
+[2023-07-09 02:30:52,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7714.1, 300 sec: 7416.7). Total num frames: 2076672. Throughput: 0: 7850.4. Samples: 2065496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:30:52,296][1151233] Avg episode reward: [(0, '7.444')]
+[2023-07-09 02:30:53,479][1151487] Updated weights for policy 0, policy_version 4080 (0.0005)
+[2023-07-09 02:30:57,295][1151233] Fps is (10 sec: 8192.1, 60 sec: 7782.4, 300 sec: 7430.3). Total num frames: 2117632. Throughput: 0: 7871.7. Samples: 2111776. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:30:57,296][1151233] Avg episode reward: [(0, '7.452')]
+[2023-07-09 02:30:58,622][1151487] Updated weights for policy 0, policy_version 4160 (0.0005)
+[2023-07-09 02:31:02,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7782.4, 300 sec: 7429.3). Total num frames: 2154496. Throughput: 0: 7921.4. Samples: 2135804. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:31:02,295][1151233] Avg episode reward: [(0, '7.507')]
+[2023-07-09 02:31:02,297][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004208_2154496.pth...
+[2023-07-09 02:31:02,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003744_1916928.pth
+[2023-07-09 02:31:03,957][1151487] Updated weights for policy 0, policy_version 4240 (0.0005)
+[2023-07-09 02:31:07,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7850.7, 300 sec: 7442.2). Total num frames: 2195456. Throughput: 0: 7914.6. Samples: 2183036. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:31:07,296][1151233] Avg episode reward: [(0, '7.549')]
+[2023-07-09 02:31:09,302][1151487] Updated weights for policy 0, policy_version 4320 (0.0006)
+[2023-07-09 02:31:12,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7918.9, 300 sec: 7581.1). Total num frames: 2236416. Throughput: 0: 7843.9. Samples: 2228296. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:12,296][1151233] Avg episode reward: [(0, '7.547')]
+[2023-07-09 02:31:14,425][1151487] Updated weights for policy 0, policy_version 4400 (0.0005)
+[2023-07-09 02:31:17,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7918.9, 300 sec: 7678.3). Total num frames: 2273280. Throughput: 0: 7915.4. Samples: 2252808. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:31:17,296][1151233] Avg episode reward: [(0, '7.407')]
+[2023-07-09 02:31:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004440_2273280.pth...
+[2023-07-09 02:31:17,303][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000003976_2035712.pth
+[2023-07-09 02:31:20,032][1151487] Updated weights for policy 0, policy_version 4480 (0.0005)
+[2023-07-09 02:31:22,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7782.4, 300 sec: 7664.4). Total num frames: 2306048. Throughput: 0: 7851.0. Samples: 2296980. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:22,296][1151233] Avg episode reward: [(0, '7.012')]
+[2023-07-09 02:31:25,748][1151487] Updated weights for policy 0, policy_version 4560 (0.0006)
+[2023-07-09 02:31:27,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7782.4, 300 sec: 7678.3). Total num frames: 2347008. Throughput: 0: 7804.4. Samples: 2340908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:27,296][1151233] Avg episode reward: [(0, '7.437')]
+[2023-07-09 02:31:30,559][1151487] Updated weights for policy 0, policy_version 4640 (0.0005)
+[2023-07-09 02:31:32,295][1151233] Fps is (10 sec: 8191.9, 60 sec: 7850.6, 300 sec: 7692.1). Total num frames: 2387968. Throughput: 0: 7829.0. Samples: 2367412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:32,296][1151233] Avg episode reward: [(0, '7.504')]
+[2023-07-09 02:31:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004664_2387968.pth...
+[2023-07-09 02:31:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004208_2154496.pth
+[2023-07-09 02:31:36,216][1151487] Updated weights for policy 0, policy_version 4720 (0.0006)
+[2023-07-09 02:31:37,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7850.7, 300 sec: 7692.1). Total num frames: 2424832. Throughput: 0: 7674.3. Samples: 2410840. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:31:37,296][1151233] Avg episode reward: [(0, '7.539')]
+[2023-07-09 02:31:41,586][1151487] Updated weights for policy 0, policy_version 4800 (0.0005)
+[2023-07-09 02:31:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7782.4, 300 sec: 7678.3). Total num frames: 2461696. Throughput: 0: 7653.7. Samples: 2456192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:42,296][1151233] Avg episode reward: [(0, '7.434')]
+[2023-07-09 02:31:46,809][1151487] Updated weights for policy 0, policy_version 4880 (0.0005)
+[2023-07-09 02:31:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7714.1, 300 sec: 7664.4). Total num frames: 2498560. Throughput: 0: 7652.1. Samples: 2480148. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:47,296][1151233] Avg episode reward: [(0, '7.466')]
+[2023-07-09 02:31:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004880_2498560.pth...
+[2023-07-09 02:31:47,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004440_2273280.pth
+[2023-07-09 02:31:52,082][1151487] Updated weights for policy 0, policy_version 4960 (0.0005)
+[2023-07-09 02:31:52,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7678.3). Total num frames: 2539520. Throughput: 0: 7643.8. Samples: 2527008. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:31:52,296][1151233] Avg episode reward: [(0, '7.517')]
+[2023-07-09 02:31:56,834][1151487] Updated weights for policy 0, policy_version 5040 (0.0005)
+[2023-07-09 02:31:57,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7714.1, 300 sec: 7678.3). Total num frames: 2580480. Throughput: 0: 7747.7. Samples: 2576944. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:31:57,296][1151233] Avg episode reward: [(0, '7.552')]
+[2023-07-09 02:32:01,890][1151487] Updated weights for policy 0, policy_version 5120 (0.0004)
+[2023-07-09 02:32:02,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7782.4, 300 sec: 7692.2). Total num frames: 2621440. Throughput: 0: 7696.7. Samples: 2599160. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:32:02,296][1151233] Avg episode reward: [(0, '7.485')]
+[2023-07-09 02:32:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005120_2621440.pth...
+[2023-07-09 02:32:02,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004664_2387968.pth
+[2023-07-09 02:32:07,155][1151487] Updated weights for policy 0, policy_version 5200 (0.0005)
+[2023-07-09 02:32:07,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7782.4, 300 sec: 7719.9). Total num frames: 2662400. Throughput: 0: 7798.3. Samples: 2647904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:32:07,296][1151233] Avg episode reward: [(0, '7.511')]
+[2023-07-09 02:32:12,012][1151487] Updated weights for policy 0, policy_version 5280 (0.0005)
+[2023-07-09 02:32:12,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7782.4, 300 sec: 7719.9). Total num frames: 2703360. Throughput: 0: 7932.8. Samples: 2697884. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:32:12,296][1151233] Avg episode reward: [(0, '7.477')]
+[2023-07-09 02:32:17,077][1151487] Updated weights for policy 0, policy_version 5360 (0.0005)
+[2023-07-09 02:32:17,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7850.7, 300 sec: 7719.9). Total num frames: 2744320. Throughput: 0: 7886.6. Samples: 2722308. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:32:17,296][1151233] Avg episode reward: [(0, '7.404')]
+[2023-07-09 02:32:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005360_2744320.pth...
+[2023-07-09 02:32:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000004880_2498560.pth
+[2023-07-09 02:32:22,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7918.9, 300 sec: 7719.9). Total num frames: 2781184. Throughput: 0: 7985.0. Samples: 2770164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:32:22,296][1151233] Avg episode reward: [(0, '7.508')]
+[2023-07-09 02:32:22,434][1151487] Updated weights for policy 0, policy_version 5440 (0.0005)
+[2023-07-09 02:32:27,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7918.9, 300 sec: 7719.9). Total num frames: 2822144. Throughput: 0: 7964.7. Samples: 2814604. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:32:27,296][1151233] Avg episode reward: [(0, '7.421')]
+[2023-07-09 02:32:27,778][1151487] Updated weights for policy 0, policy_version 5520 (0.0004)
+[2023-07-09 02:32:32,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7850.7, 300 sec: 7719.9). Total num frames: 2859008. Throughput: 0: 7962.0. Samples: 2838436. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:32:32,313][1151233] Avg episode reward: [(0, '7.558')]
+[2023-07-09 02:32:32,316][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005584_2859008.pth...
+[2023-07-09 02:32:32,319][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005120_2621440.pth
+[2023-07-09 02:32:33,375][1151487] Updated weights for policy 0, policy_version 5600 (0.0005)
+[2023-07-09 02:32:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7850.7, 300 sec: 7706.0). Total num frames: 2895872. Throughput: 0: 7940.6. Samples: 2884336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:32:37,296][1151233] Avg episode reward: [(0, '7.597')]
+[2023-07-09 02:32:37,297][1151474] Saving new best policy, reward=7.597!
+[2023-07-09 02:32:38,794][1151487] Updated weights for policy 0, policy_version 5680 (0.0005)
+[2023-07-09 02:32:42,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7850.7, 300 sec: 7719.9). Total num frames: 2932736. Throughput: 0: 7813.0. Samples: 2928532. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:32:42,297][1151233] Avg episode reward: [(0, '7.513')]
+[2023-07-09 02:32:44,227][1151487] Updated weights for policy 0, policy_version 5760 (0.0005)
+[2023-07-09 02:32:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7850.7, 300 sec: 7706.0). Total num frames: 2969600. Throughput: 0: 7807.0. Samples: 2950476. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:32:47,296][1151233] Avg episode reward: [(0, '7.602')]
+[2023-07-09 02:32:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005800_2969600.pth...
+[2023-07-09 02:32:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005360_2744320.pth
+[2023-07-09 02:32:47,302][1151474] Saving new best policy, reward=7.602!
+[2023-07-09 02:32:49,721][1151487] Updated weights for policy 0, policy_version 5840 (0.0005)
+[2023-07-09 02:32:52,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7850.7, 300 sec: 7719.9). Total num frames: 3010560. Throughput: 0: 7740.9. Samples: 2996244. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:32:52,296][1151233] Avg episode reward: [(0, '7.621')]
+[2023-07-09 02:32:52,297][1151474] Saving new best policy, reward=7.621!
+[2023-07-09 02:32:54,556][1151487] Updated weights for policy 0, policy_version 5920 (0.0006)
+[2023-07-09 02:32:57,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7850.7, 300 sec: 7733.8). Total num frames: 3051520. Throughput: 0: 7710.9. Samples: 3044876. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:32:57,296][1151233] Avg episode reward: [(0, '7.509')]
+[2023-07-09 02:32:59,631][1151487] Updated weights for policy 0, policy_version 6000 (0.0006)
+[2023-07-09 02:33:02,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7850.7, 300 sec: 7747.7). Total num frames: 3092480. Throughput: 0: 7744.3. Samples: 3070804. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:33:02,296][1151233] Avg episode reward: [(0, '7.465')]
+[2023-07-09 02:33:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006040_3092480.pth...
+[2023-07-09 02:33:02,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005584_2859008.pth
+[2023-07-09 02:33:04,936][1151487] Updated weights for policy 0, policy_version 6080 (0.0005)
+[2023-07-09 02:33:07,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7782.4, 300 sec: 7733.8). Total num frames: 3129344. Throughput: 0: 7706.6. Samples: 3116960. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:33:07,296][1151233] Avg episode reward: [(0, '7.482')]
+[2023-07-09 02:33:10,361][1151487] Updated weights for policy 0, policy_version 6160 (0.0005)
+[2023-07-09 02:33:12,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7714.1, 300 sec: 7733.8). Total num frames: 3166208. Throughput: 0: 7724.7. Samples: 3162216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:33:12,296][1151233] Avg episode reward: [(0, '7.352')]
+[2023-07-09 02:33:15,770][1151487] Updated weights for policy 0, policy_version 6240 (0.0006)
+[2023-07-09 02:33:17,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 7733.8). Total num frames: 3203072. Throughput: 0: 7713.6. Samples: 3185548. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:33:17,296][1151233] Avg episode reward: [(0, '7.440')]
+[2023-07-09 02:33:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006256_3203072.pth...
+[2023-07-09 02:33:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000005800_2969600.pth
+[2023-07-09 02:33:20,871][1151487] Updated weights for policy 0, policy_version 6320 (0.0005)
+[2023-07-09 02:33:22,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7733.8). Total num frames: 3244032. Throughput: 0: 7726.4. Samples: 3232024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:33:22,295][1151233] Avg episode reward: [(0, '7.484')]
+[2023-07-09 02:33:26,432][1151487] Updated weights for policy 0, policy_version 6400 (0.0005)
+[2023-07-09 02:33:27,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7733.8). Total num frames: 3280896. Throughput: 0: 7739.5. Samples: 3276808. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:33:27,296][1151233] Avg episode reward: [(0, '7.441')]
+[2023-07-09 02:33:31,561][1151487] Updated weights for policy 0, policy_version 6480 (0.0005)
+[2023-07-09 02:33:32,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7714.1, 300 sec: 7747.7). Total num frames: 3321856. Throughput: 0: 7792.8. Samples: 3301152. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:33:32,296][1151233] Avg episode reward: [(0, '7.496')]
+[2023-07-09 02:33:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006488_3321856.pth...
+[2023-07-09 02:33:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006040_3092480.pth
+[2023-07-09 02:33:37,195][1151487] Updated weights for policy 0, policy_version 6560 (0.0005)
+[2023-07-09 02:33:37,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7714.2, 300 sec: 7747.7). Total num frames: 3358720. Throughput: 0: 7796.1. Samples: 3347068. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:33:37,295][1151233] Avg episode reward: [(0, '7.417')]
+[2023-07-09 02:33:42,142][1151487] Updated weights for policy 0, policy_version 6640 (0.0005)
+[2023-07-09 02:33:42,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7782.4, 300 sec: 7747.7). Total num frames: 3399680. Throughput: 0: 7726.0. Samples: 3392544. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:33:42,296][1151233] Avg episode reward: [(0, '7.461')]
+[2023-07-09 02:33:47,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7782.4, 300 sec: 7747.7). Total num frames: 3436544. Throughput: 0: 7682.6. Samples: 3416520. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:33:47,296][1151233] Avg episode reward: [(0, '7.646')]
+[2023-07-09 02:33:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006712_3436544.pth...
+[2023-07-09 02:33:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006256_3203072.pth
+[2023-07-09 02:33:47,301][1151474] Saving new best policy, reward=7.646!
+[2023-07-09 02:33:47,748][1151487] Updated weights for policy 0, policy_version 6720 (0.0005)
+[2023-07-09 02:33:52,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7782.4, 300 sec: 7761.6). Total num frames: 3477504. Throughput: 0: 7672.7. Samples: 3462232. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:33:52,296][1151233] Avg episode reward: [(0, '7.559')]
+[2023-07-09 02:33:52,737][1151487] Updated weights for policy 0, policy_version 6800 (0.0005)
+[2023-07-09 02:33:57,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7761.6). Total num frames: 3514368. Throughput: 0: 7736.5. Samples: 3510360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:33:57,296][1151233] Avg episode reward: [(0, '7.662')]
+[2023-07-09 02:33:57,296][1151474] Saving new best policy, reward=7.662!
+[2023-07-09 02:33:57,963][1151487] Updated weights for policy 0, policy_version 6880 (0.0005)
+[2023-07-09 02:34:02,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7775.5). Total num frames: 3555328. Throughput: 0: 7742.2. Samples: 3533948. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:34:02,295][1151233] Avg episode reward: [(0, '7.595')]
+[2023-07-09 02:34:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006944_3555328.pth...
+[2023-07-09 02:34:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006488_3321856.pth
+[2023-07-09 02:34:03,000][1151487] Updated weights for policy 0, policy_version 6960 (0.0005)
+[2023-07-09 02:34:07,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7714.1, 300 sec: 7761.6). Total num frames: 3592192. Throughput: 0: 7762.5. Samples: 3581336. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:34:07,295][1151233] Avg episode reward: [(0, '7.675')]
+[2023-07-09 02:34:07,310][1151474] Saving new best policy, reward=7.675!
+[2023-07-09 02:34:08,445][1151487] Updated weights for policy 0, policy_version 7040 (0.0005)
+[2023-07-09 02:34:12,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7782.4, 300 sec: 7775.5). Total num frames: 3633152. Throughput: 0: 7791.8. Samples: 3627440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:34:12,296][1151233] Avg episode reward: [(0, '7.606')]
+[2023-07-09 02:34:13,942][1151487] Updated weights for policy 0, policy_version 7120 (0.0005)
+[2023-07-09 02:34:17,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7782.4, 300 sec: 7761.6). Total num frames: 3670016. Throughput: 0: 7738.8. Samples: 3649400. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:34:17,296][1151233] Avg episode reward: [(0, '7.591')]
+[2023-07-09 02:34:17,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007168_3670016.pth...
+[2023-07-09 02:34:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006712_3436544.pth
+[2023-07-09 02:34:19,256][1151487] Updated weights for policy 0, policy_version 7200 (0.0005)
+[2023-07-09 02:34:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7714.1, 300 sec: 7747.7). Total num frames: 3706880. Throughput: 0: 7755.3. Samples: 3696056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:34:22,296][1151233] Avg episode reward: [(0, '7.582')]
+[2023-07-09 02:34:24,733][1151487] Updated weights for policy 0, policy_version 7280 (0.0006)
+[2023-07-09 02:34:27,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7714.1, 300 sec: 7747.7). Total num frames: 3743744. Throughput: 0: 7723.7. Samples: 3740112. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:34:27,296][1151233] Avg episode reward: [(0, '7.604')]
+[2023-07-09 02:34:30,136][1151487] Updated weights for policy 0, policy_version 7360 (0.0005)
+[2023-07-09 02:34:32,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7645.9, 300 sec: 7747.7). Total num frames: 3780608. Throughput: 0: 7702.3. Samples: 3763124. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:34:32,295][1151233] Avg episode reward: [(0, '7.684')]
+[2023-07-09 02:34:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007384_3780608.pth...
+[2023-07-09 02:34:32,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000006944_3555328.pth
+[2023-07-09 02:34:32,300][1151474] Saving new best policy, reward=7.684!
+[2023-07-09 02:34:35,813][1151487] Updated weights for policy 0, policy_version 7440 (0.0006)
+[2023-07-09 02:34:37,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7645.9, 300 sec: 7733.8). Total num frames: 3817472. Throughput: 0: 7653.3. Samples: 3806628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:34:37,295][1151233] Avg episode reward: [(0, '7.649')]
+[2023-07-09 02:34:40,976][1151487] Updated weights for policy 0, policy_version 7520 (0.0005)
+[2023-07-09 02:34:42,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7733.8). Total num frames: 3858432. Throughput: 0: 7638.8. Samples: 3854104. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:34:42,296][1151233] Avg episode reward: [(0, '7.714')]
+[2023-07-09 02:34:42,296][1151474] Saving new best policy, reward=7.714!
+[2023-07-09 02:34:46,156][1151487] Updated weights for policy 0, policy_version 7600 (0.0006)
+[2023-07-09 02:34:47,295][1151233] Fps is (10 sec: 8191.9, 60 sec: 7714.1, 300 sec: 7747.7). Total num frames: 3899392. Throughput: 0: 7638.8. Samples: 3877696. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:34:47,296][1151233] Avg episode reward: [(0, '7.596')]
+[2023-07-09 02:34:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007616_3899392.pth...
+[2023-07-09 02:34:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007168_3670016.pth
+[2023-07-09 02:34:51,657][1151487] Updated weights for policy 0, policy_version 7680 (0.0006)
+[2023-07-09 02:34:52,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7645.9, 300 sec: 7747.7). Total num frames: 3936256. Throughput: 0: 7588.2. Samples: 3922808. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:34:52,296][1151233] Avg episode reward: [(0, '7.671')]
+[2023-07-09 02:34:57,279][1151487] Updated weights for policy 0, policy_version 7760 (0.0005)
+[2023-07-09 02:34:57,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 7747.7). Total num frames: 3973120. Throughput: 0: 7549.5. Samples: 3967168. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:34:57,296][1151233] Avg episode reward: [(0, '7.599')]
+[2023-07-09 02:35:02,190][1151487] Updated weights for policy 0, policy_version 7840 (0.0005)
+[2023-07-09 02:35:02,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7761.6). Total num frames: 4014080. Throughput: 0: 7574.7. Samples: 3990260. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:35:02,296][1151233] Avg episode reward: [(0, '7.594')]
+[2023-07-09 02:35:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007840_4014080.pth...
+[2023-07-09 02:35:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007384_3780608.pth
+[2023-07-09 02:35:07,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7645.8, 300 sec: 7761.6). Total num frames: 4050944. Throughput: 0: 7605.7. Samples: 4038312. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:35:07,296][1151233] Avg episode reward: [(0, '7.653')]
+[2023-07-09 02:35:07,661][1151487] Updated weights for policy 0, policy_version 7920 (0.0006)
+[2023-07-09 02:35:12,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7577.6, 300 sec: 7761.6). Total num frames: 4087808. Throughput: 0: 7627.7. Samples: 4083360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:12,296][1151233] Avg episode reward: [(0, '7.689')]
+[2023-07-09 02:35:13,247][1151487] Updated weights for policy 0, policy_version 8000 (0.0004)
+[2023-07-09 02:35:17,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7577.6, 300 sec: 7747.7). Total num frames: 4124672. Throughput: 0: 7621.2. Samples: 4106080. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:17,296][1151233] Avg episode reward: [(0, '7.667')]
+[2023-07-09 02:35:17,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008056_4124672.pth...
+[2023-07-09 02:35:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007616_3899392.pth
+[2023-07-09 02:35:18,741][1151487] Updated weights for policy 0, policy_version 8080 (0.0004)
+[2023-07-09 02:35:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7733.8). Total num frames: 4161536. Throughput: 0: 7615.2. Samples: 4149312. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:22,295][1151233] Avg episode reward: [(0, '7.617')]
+[2023-07-09 02:35:24,467][1151487] Updated weights for policy 0, policy_version 8160 (0.0005)
+[2023-07-09 02:35:27,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7733.8). Total num frames: 4198400. Throughput: 0: 7527.6. Samples: 4192848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:27,296][1151233] Avg episode reward: [(0, '7.727')]
+[2023-07-09 02:35:27,296][1151474] Saving new best policy, reward=7.727!
+[2023-07-09 02:35:30,088][1151487] Updated weights for policy 0, policy_version 8240 (0.0005)
+[2023-07-09 02:35:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7577.6, 300 sec: 7733.8). Total num frames: 4235264. Throughput: 0: 7489.9. Samples: 4214740. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:35:32,295][1151233] Avg episode reward: [(0, '7.687')]
+[2023-07-09 02:35:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008272_4235264.pth...
+[2023-07-09 02:35:32,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000007840_4014080.pth
+[2023-07-09 02:35:35,024][1151487] Updated weights for policy 0, policy_version 8320 (0.0005)
+[2023-07-09 02:35:37,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7733.8). Total num frames: 4276224. Throughput: 0: 7565.2. Samples: 4263240. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:35:37,296][1151233] Avg episode reward: [(0, '7.629')]
+[2023-07-09 02:35:40,776][1151487] Updated weights for policy 0, policy_version 8400 (0.0005)
+[2023-07-09 02:35:42,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7509.3, 300 sec: 7706.0). Total num frames: 4308992. Throughput: 0: 7534.1. Samples: 4306200. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:35:42,296][1151233] Avg episode reward: [(0, '7.669')]
+[2023-07-09 02:35:46,327][1151487] Updated weights for policy 0, policy_version 8480 (0.0005)
+[2023-07-09 02:35:47,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7441.1, 300 sec: 7692.1). Total num frames: 4345856. Throughput: 0: 7505.5. Samples: 4328008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:47,296][1151233] Avg episode reward: [(0, '7.707')]
+[2023-07-09 02:35:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008488_4345856.pth...
+[2023-07-09 02:35:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008056_4124672.pth
+[2023-07-09 02:35:51,338][1151487] Updated weights for policy 0, policy_version 8560 (0.0005)
+[2023-07-09 02:35:52,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7509.3, 300 sec: 7692.2). Total num frames: 4386816. Throughput: 0: 7471.5. Samples: 4374528. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:52,295][1151233] Avg episode reward: [(0, '7.721')]
+[2023-07-09 02:35:56,631][1151487] Updated weights for policy 0, policy_version 8640 (0.0004)
+[2023-07-09 02:35:57,295][1151233] Fps is (10 sec: 8192.0, 60 sec: 7577.6, 300 sec: 7706.0). Total num frames: 4427776. Throughput: 0: 7535.5. Samples: 4422460. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:35:57,296][1151233] Avg episode reward: [(0, '7.773')]
+[2023-07-09 02:35:57,296][1151474] Saving new best policy, reward=7.773!
+[2023-07-09 02:36:02,132][1151487] Updated weights for policy 0, policy_version 8720 (0.0005)
+[2023-07-09 02:36:02,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7509.3, 300 sec: 7692.2). Total num frames: 4464640. Throughput: 0: 7483.6. Samples: 4442840. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:36:02,296][1151233] Avg episode reward: [(0, '7.661')]
+[2023-07-09 02:36:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008720_4464640.pth...
+[2023-07-09 02:36:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008272_4235264.pth
+[2023-07-09 02:36:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7509.4, 300 sec: 7678.3). Total num frames: 4501504. Throughput: 0: 7565.0. Samples: 4489740. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:36:07,296][1151233] Avg episode reward: [(0, '7.617')]
+[2023-07-09 02:36:07,494][1151487] Updated weights for policy 0, policy_version 8800 (0.0005)
+[2023-07-09 02:36:12,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7577.6, 300 sec: 7692.2). Total num frames: 4542464. Throughput: 0: 7630.9. Samples: 4536236. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:36:12,295][1151233] Avg episode reward: [(0, '7.642')]
+[2023-07-09 02:36:12,666][1151487] Updated weights for policy 0, policy_version 8880 (0.0005)
+[2023-07-09 02:36:17,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7577.6, 300 sec: 7706.0). Total num frames: 4579328. Throughput: 0: 7646.9. Samples: 4558848. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:36:17,295][1151233] Avg episode reward: [(0, '7.756')]
+[2023-07-09 02:36:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008944_4579328.pth...
+[2023-07-09 02:36:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008488_4345856.pth
+[2023-07-09 02:36:18,240][1151487] Updated weights for policy 0, policy_version 8960 (0.0005)
+[2023-07-09 02:36:22,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7577.6, 300 sec: 7692.1). Total num frames: 4616192. Throughput: 0: 7594.4. Samples: 4604988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:36:22,296][1151233] Avg episode reward: [(0, '7.725')]
+[2023-07-09 02:36:23,546][1151487] Updated weights for policy 0, policy_version 9040 (0.0005)
+[2023-07-09 02:36:27,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7692.2). Total num frames: 4657152. Throughput: 0: 7644.5. Samples: 4650204. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:36:27,296][1151233] Avg episode reward: [(0, '7.833')]
+[2023-07-09 02:36:27,296][1151474] Saving new best policy, reward=7.833!
+[2023-07-09 02:36:28,648][1151487] Updated weights for policy 0, policy_version 9120 (0.0005)
+[2023-07-09 02:36:32,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7645.9, 300 sec: 7692.1). Total num frames: 4694016. Throughput: 0: 7732.9. Samples: 4675988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:36:32,296][1151233] Avg episode reward: [(0, '7.802')]
+[2023-07-09 02:36:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009168_4694016.pth...
+[2023-07-09 02:36:32,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008720_4464640.pth
+[2023-07-09 02:36:34,122][1151487] Updated weights for policy 0, policy_version 9200 (0.0005)
+[2023-07-09 02:36:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7692.1). Total num frames: 4730880. Throughput: 0: 7667.2. Samples: 4719552. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:36:37,296][1151233] Avg episode reward: [(0, '7.863')]
+[2023-07-09 02:36:37,296][1151474] Saving new best policy, reward=7.863!
+[2023-07-09 02:36:39,636][1151487] Updated weights for policy 0, policy_version 9280 (0.0005)
+[2023-07-09 02:36:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 7692.1). Total num frames: 4767744. Throughput: 0: 7582.0. Samples: 4763648. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:36:42,296][1151233] Avg episode reward: [(0, '7.682')]
+[2023-07-09 02:36:45,460][1151487] Updated weights for policy 0, policy_version 9360 (0.0005)
+[2023-07-09 02:36:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7645.9, 300 sec: 7678.3). Total num frames: 4804608. Throughput: 0: 7584.3. Samples: 4784136. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:36:47,296][1151233] Avg episode reward: [(0, '7.785')]
+[2023-07-09 02:36:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009384_4804608.pth...
+[2023-07-09 02:36:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000008944_4579328.pth
+[2023-07-09 02:36:50,735][1151487] Updated weights for policy 0, policy_version 9440 (0.0005)
+[2023-07-09 02:36:52,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7645.9, 300 sec: 7678.3). Total num frames: 4845568. Throughput: 0: 7572.3. Samples: 4830492. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:36:52,296][1151233] Avg episode reward: [(0, '7.931')]
+[2023-07-09 02:36:52,296][1151474] Saving new best policy, reward=7.931!
+[2023-07-09 02:36:55,943][1151487] Updated weights for policy 0, policy_version 9520 (0.0005)
+[2023-07-09 02:36:57,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7577.6, 300 sec: 7664.4). Total num frames: 4882432. Throughput: 0: 7601.2. Samples: 4878292. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:36:57,296][1151233] Avg episode reward: [(0, '7.691')]
+[2023-07-09 02:37:01,563][1151487] Updated weights for policy 0, policy_version 9600 (0.0005)
+[2023-07-09 02:37:02,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7577.6, 300 sec: 7650.5). Total num frames: 4919296. Throughput: 0: 7556.4. Samples: 4898888. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:37:02,296][1151233] Avg episode reward: [(0, '7.653')]
+[2023-07-09 02:37:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009608_4919296.pth...
+[2023-07-09 02:37:02,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009168_4694016.pth
+[2023-07-09 02:37:07,074][1151487] Updated weights for policy 0, policy_version 9680 (0.0005)
+[2023-07-09 02:37:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7577.6, 300 sec: 7636.6). Total num frames: 4956160. Throughput: 0: 7532.2. Samples: 4943936. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:37:07,296][1151233] Avg episode reward: [(0, '7.741')]
+[2023-07-09 02:37:12,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7622.7). Total num frames: 4993024. Throughput: 0: 7498.5. Samples: 4987636. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:37:12,296][1151233] Avg episode reward: [(0, '7.711')]
+[2023-07-09 02:37:12,816][1151487] Updated weights for policy 0, policy_version 9760 (0.0005)
+[2023-07-09 02:37:17,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7622.7). Total num frames: 5029888. Throughput: 0: 7422.4. Samples: 5009996. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:37:17,296][1151233] Avg episode reward: [(0, '7.763')]
+[2023-07-09 02:37:17,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009824_5029888.pth...
+[2023-07-09 02:37:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009384_4804608.pth
+[2023-07-09 02:37:18,156][1151487] Updated weights for policy 0, policy_version 9840 (0.0005)
+[2023-07-09 02:37:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7608.8). Total num frames: 5066752. Throughput: 0: 7444.1. Samples: 5054536. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:37:22,296][1151233] Avg episode reward: [(0, '7.698')]
+[2023-07-09 02:37:23,686][1151487] Updated weights for policy 0, policy_version 9920 (0.0005)
+[2023-07-09 02:37:27,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7608.8). Total num frames: 5103616. Throughput: 0: 7442.7. Samples: 5098568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:37:27,296][1151233] Avg episode reward: [(0, '7.749')]
+[2023-07-09 02:37:29,244][1151487] Updated weights for policy 0, policy_version 10000 (0.0005)
+[2023-07-09 02:37:32,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7608.8). Total num frames: 5140480. Throughput: 0: 7488.5. Samples: 5121120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:37:32,296][1151233] Avg episode reward: [(0, '7.747')]
+[2023-07-09 02:37:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010040_5140480.pth...
+[2023-07-09 02:37:32,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009608_4919296.pth
+[2023-07-09 02:37:34,985][1151487] Updated weights for policy 0, policy_version 10080 (0.0005)
+[2023-07-09 02:37:37,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7441.1, 300 sec: 7608.8). Total num frames: 5177344. Throughput: 0: 7433.3. Samples: 5164992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:37:37,295][1151233] Avg episode reward: [(0, '7.904')]
+[2023-07-09 02:37:40,801][1151487] Updated weights for policy 0, policy_version 10160 (0.0005)
+[2023-07-09 02:37:42,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7372.8, 300 sec: 7595.0). Total num frames: 5210112. Throughput: 0: 7295.8. Samples: 5206604. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:37:42,296][1151233] Avg episode reward: [(0, '8.030')]
+[2023-07-09 02:37:42,296][1151474] Saving new best policy, reward=8.030!
+[2023-07-09 02:37:46,135][1151487] Updated weights for policy 0, policy_version 10240 (0.0005)
+[2023-07-09 02:37:47,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7441.1, 300 sec: 7595.0). Total num frames: 5251072. Throughput: 0: 7365.9. Samples: 5230356. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:37:47,296][1151233] Avg episode reward: [(0, '7.923')]
+[2023-07-09 02:37:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010256_5251072.pth...
+[2023-07-09 02:37:47,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000009824_5029888.pth
+[2023-07-09 02:37:51,742][1151487] Updated weights for policy 0, policy_version 10320 (0.0004)
+[2023-07-09 02:37:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7567.2). Total num frames: 5283840. Throughput: 0: 7336.1. Samples: 5274060. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:37:52,295][1151233] Avg episode reward: [(0, '7.893')]
+[2023-07-09 02:37:57,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7304.5, 300 sec: 7553.3). Total num frames: 5320704. Throughput: 0: 7346.6. Samples: 5318232. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:37:57,296][1151233] Avg episode reward: [(0, '7.981')]
+[2023-07-09 02:37:57,364][1151487] Updated weights for policy 0, policy_version 10400 (0.0005)
+[2023-07-09 02:38:02,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7553.3). Total num frames: 5357568. Throughput: 0: 7324.5. Samples: 5339596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:38:02,295][1151233] Avg episode reward: [(0, '7.933')]
+[2023-07-09 02:38:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010464_5357568.pth...
+[2023-07-09 02:38:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010040_5140480.pth
+[2023-07-09 02:38:03,047][1151487] Updated weights for policy 0, policy_version 10480 (0.0005)
+[2023-07-09 02:38:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7553.3). Total num frames: 5394432. Throughput: 0: 7281.8. Samples: 5382216. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:38:07,296][1151233] Avg episode reward: [(0, '8.005')]
+[2023-07-09 02:38:08,797][1151487] Updated weights for policy 0, policy_version 10560 (0.0005)
+[2023-07-09 02:38:12,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7553.3). Total num frames: 5431296. Throughput: 0: 7302.9. Samples: 5427200. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:38:12,296][1151233] Avg episode reward: [(0, '8.098')]
+[2023-07-09 02:38:12,297][1151474] Saving new best policy, reward=8.098!
+[2023-07-09 02:38:14,278][1151487] Updated weights for policy 0, policy_version 10640 (0.0006)
+[2023-07-09 02:38:17,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7539.4). Total num frames: 5468160. Throughput: 0: 7276.8. Samples: 5448576. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:38:17,297][1151233] Avg episode reward: [(0, '8.009')]
+[2023-07-09 02:38:17,300][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010680_5468160.pth...
+[2023-07-09 02:38:17,303][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010256_5251072.pth
+[2023-07-09 02:38:19,864][1151487] Updated weights for policy 0, policy_version 10720 (0.0005)
+[2023-07-09 02:38:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7539.4). Total num frames: 5505024. Throughput: 0: 7283.4. Samples: 5492744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:38:22,296][1151233] Avg episode reward: [(0, '8.053')]
+[2023-07-09 02:38:25,565][1151487] Updated weights for policy 0, policy_version 10800 (0.0005)
+[2023-07-09 02:38:27,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7511.7). Total num frames: 5537792. Throughput: 0: 7309.2. Samples: 5535516. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:38:27,295][1151233] Avg episode reward: [(0, '8.069')]
+[2023-07-09 02:38:31,430][1151487] Updated weights for policy 0, policy_version 10880 (0.0005)
+[2023-07-09 02:38:32,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7511.6). Total num frames: 5574656. Throughput: 0: 7252.3. Samples: 5556708. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:38:32,296][1151233] Avg episode reward: [(0, '8.077')]
+[2023-07-09 02:38:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010888_5574656.pth...
+[2023-07-09 02:38:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010464_5357568.pth
+[2023-07-09 02:38:36,859][1151487] Updated weights for policy 0, policy_version 10960 (0.0005)
+[2023-07-09 02:38:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7497.8). Total num frames: 5611520. Throughput: 0: 7226.2. Samples: 5599240. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:38:37,296][1151233] Avg episode reward: [(0, '8.098')]
+[2023-07-09 02:38:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7497.8). Total num frames: 5648384. Throughput: 0: 7242.9. Samples: 5644164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:38:42,296][1151233] Avg episode reward: [(0, '8.134')]
+[2023-07-09 02:38:42,297][1151474] Saving new best policy, reward=8.134!
+[2023-07-09 02:38:42,715][1151487] Updated weights for policy 0, policy_version 11040 (0.0005)
+[2023-07-09 02:38:47,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7483.9). Total num frames: 5685248. Throughput: 0: 7226.0. Samples: 5664768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:38:47,402][1151233] Avg episode reward: [(0, '8.055')]
+[2023-07-09 02:38:47,405][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011104_5685248.pth...
+[2023-07-09 02:38:47,408][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010680_5468160.pth
+[2023-07-09 02:38:48,355][1151487] Updated weights for policy 0, policy_version 11120 (0.0005)
+[2023-07-09 02:38:52,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7470.0). Total num frames: 5718016. Throughput: 0: 7230.1. Samples: 5707568. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:38:52,296][1151233] Avg episode reward: [(0, '8.128')]
+[2023-07-09 02:38:54,017][1151487] Updated weights for policy 0, policy_version 11200 (0.0005)
+[2023-07-09 02:38:57,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7456.1). Total num frames: 5754880. Throughput: 0: 7217.3. Samples: 5751976. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:38:57,296][1151233] Avg episode reward: [(0, '8.002')]
+[2023-07-09 02:38:59,350][1151487] Updated weights for policy 0, policy_version 11280 (0.0005)
+[2023-07-09 02:39:02,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7456.1). Total num frames: 5791744. Throughput: 0: 7265.2. Samples: 5775508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:39:02,296][1151233] Avg episode reward: [(0, '8.132')]
+[2023-07-09 02:39:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011312_5791744.pth...
+[2023-07-09 02:39:02,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000010888_5574656.pth
+[2023-07-09 02:39:04,767][1151487] Updated weights for policy 0, policy_version 11360 (0.0005)
+[2023-07-09 02:39:07,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7456.1). Total num frames: 5832704. Throughput: 0: 7283.7. Samples: 5820512. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:39:07,296][1151233] Avg episode reward: [(0, '8.062')]
+[2023-07-09 02:39:10,357][1151487] Updated weights for policy 0, policy_version 11440 (0.0006)
+[2023-07-09 02:39:12,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7456.1). Total num frames: 5869568. Throughput: 0: 7337.9. Samples: 5865720. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:39:12,318][1151233] Avg episode reward: [(0, '8.069')]
+[2023-07-09 02:39:15,633][1151487] Updated weights for policy 0, policy_version 11520 (0.0005)
+[2023-07-09 02:39:17,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7456.1). Total num frames: 5906432. Throughput: 0: 7409.6. Samples: 5890140. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:39:17,296][1151233] Avg episode reward: [(0, '8.071')]
+[2023-07-09 02:39:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011536_5906432.pth...
+[2023-07-09 02:39:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011104_5685248.pth
+[2023-07-09 02:39:21,391][1151487] Updated weights for policy 0, policy_version 11600 (0.0005)
+[2023-07-09 02:39:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7456.1). Total num frames: 5943296. Throughput: 0: 7388.5. Samples: 5931724. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:39:22,295][1151233] Avg episode reward: [(0, '8.069')]
+[2023-07-09 02:39:27,054][1151487] Updated weights for policy 0, policy_version 11680 (0.0005)
+[2023-07-09 02:39:27,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7372.8, 300 sec: 7456.1). Total num frames: 5980160. Throughput: 0: 7369.1. Samples: 5975772. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:39:27,296][1151233] Avg episode reward: [(0, '8.189')]
+[2023-07-09 02:39:27,296][1151474] Saving new best policy, reward=8.189!
+[2023-07-09 02:39:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7456.1). Total num frames: 6017024. Throughput: 0: 7380.7. Samples: 5996900. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:39:32,296][1151233] Avg episode reward: [(0, '8.045')]
+[2023-07-09 02:39:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011752_6017024.pth...
+[2023-07-09 02:39:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011312_5791744.pth
+[2023-07-09 02:39:32,760][1151487] Updated weights for policy 0, policy_version 11760 (0.0005)
+[2023-07-09 02:39:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7442.2). Total num frames: 6053888. Throughput: 0: 7424.9. Samples: 6041688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:39:37,295][1151233] Avg episode reward: [(0, '8.169')]
+[2023-07-09 02:39:38,098][1151487] Updated weights for policy 0, policy_version 11840 (0.0006)
+[2023-07-09 02:39:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7428.3). Total num frames: 6090752. Throughput: 0: 7431.4. Samples: 6086388. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:39:42,296][1151233] Avg episode reward: [(0, '8.102')]
+[2023-07-09 02:39:43,692][1151487] Updated weights for policy 0, policy_version 11920 (0.0005)
+[2023-07-09 02:39:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7428.3). Total num frames: 6127616. Throughput: 0: 7374.3. Samples: 6107352. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:39:47,296][1151233] Avg episode reward: [(0, '8.102')]
+[2023-07-09 02:39:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011968_6127616.pth...
+[2023-07-09 02:39:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011536_5906432.pth
+[2023-07-09 02:39:48,894][1151487] Updated weights for policy 0, policy_version 12000 (0.0005)
+[2023-07-09 02:39:52,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7441.1, 300 sec: 7428.3). Total num frames: 6164480. Throughput: 0: 7449.0. Samples: 6155716. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:39:52,295][1151233] Avg episode reward: [(0, '8.182')]
+[2023-07-09 02:39:54,624][1151487] Updated weights for policy 0, policy_version 12080 (0.0005)
+[2023-07-09 02:39:57,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7441.0, 300 sec: 7414.5). Total num frames: 6201344. Throughput: 0: 7371.8. Samples: 6197452. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:39:57,296][1151233] Avg episode reward: [(0, '8.201')]
+[2023-07-09 02:39:57,296][1151474] Saving new best policy, reward=8.201!
+[2023-07-09 02:40:00,653][1151487] Updated weights for policy 0, policy_version 12160 (0.0004)
+[2023-07-09 02:40:02,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7372.8, 300 sec: 7400.6). Total num frames: 6234112. Throughput: 0: 7279.9. Samples: 6217736. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:40:02,295][1151233] Avg episode reward: [(0, '8.201')]
+[2023-07-09 02:40:02,297][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012184_6238208.pth...
+[2023-07-09 02:40:02,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011752_6017024.pth
+[2023-07-09 02:40:06,268][1151487] Updated weights for policy 0, policy_version 12240 (0.0006)
+[2023-07-09 02:40:07,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7400.6). Total num frames: 6270976. Throughput: 0: 7322.6. Samples: 6261240. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:40:07,296][1151233] Avg episode reward: [(0, '8.160')]
+[2023-07-09 02:40:12,020][1151487] Updated weights for policy 0, policy_version 12320 (0.0005)
+[2023-07-09 02:40:12,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7400.6). Total num frames: 6307840. Throughput: 0: 7288.4. Samples: 6303752. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:12,296][1151233] Avg episode reward: [(0, '8.166')]
+[2023-07-09 02:40:17,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7386.7). Total num frames: 6340608. Throughput: 0: 7273.0. Samples: 6324184. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:17,295][1151233] Avg episode reward: [(0, '8.159')]
+[2023-07-09 02:40:17,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012384_6340608.pth...
+[2023-07-09 02:40:17,299][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000011968_6127616.pth
+[2023-07-09 02:40:17,949][1151487] Updated weights for policy 0, policy_version 12400 (0.0005)
+[2023-07-09 02:40:22,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7386.7). Total num frames: 6377472. Throughput: 0: 7221.3. Samples: 6366648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:22,296][1151233] Avg episode reward: [(0, '8.124')]
+[2023-07-09 02:40:23,463][1151487] Updated weights for policy 0, policy_version 12480 (0.0005)
+[2023-07-09 02:40:27,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7386.7). Total num frames: 6414336. Throughput: 0: 7199.6. Samples: 6410368. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:27,296][1151233] Avg episode reward: [(0, '8.225')]
+[2023-07-09 02:40:27,296][1151474] Saving new best policy, reward=8.225!
+[2023-07-09 02:40:29,208][1151487] Updated weights for policy 0, policy_version 12560 (0.0005)
+[2023-07-09 02:40:32,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7372.8). Total num frames: 6451200. Throughput: 0: 7223.7. Samples: 6432420. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:40:32,296][1151233] Avg episode reward: [(0, '8.243')]
+[2023-07-09 02:40:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012600_6451200.pth...
+[2023-07-09 02:40:32,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012184_6238208.pth
+[2023-07-09 02:40:32,302][1151474] Saving new best policy, reward=8.243!
+[2023-07-09 02:40:34,926][1151487] Updated weights for policy 0, policy_version 12640 (0.0005)
+[2023-07-09 02:40:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7386.7). Total num frames: 6488064. Throughput: 0: 7110.8. Samples: 6475704. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:40:37,296][1151233] Avg episode reward: [(0, '8.212')]
+[2023-07-09 02:40:40,642][1151487] Updated weights for policy 0, policy_version 12720 (0.0005)
+[2023-07-09 02:40:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7386.7). Total num frames: 6524928. Throughput: 0: 7118.1. Samples: 6517768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:42,296][1151233] Avg episode reward: [(0, '8.163')]
+[2023-07-09 02:40:46,143][1151487] Updated weights for policy 0, policy_version 12800 (0.0006)
+[2023-07-09 02:40:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7372.8). Total num frames: 6561792. Throughput: 0: 7174.6. Samples: 6540596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:47,296][1151233] Avg episode reward: [(0, '8.207')]
+[2023-07-09 02:40:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012816_6561792.pth...
+[2023-07-09 02:40:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012384_6340608.pth
+[2023-07-09 02:40:51,726][1151487] Updated weights for policy 0, policy_version 12880 (0.0005)
+[2023-07-09 02:40:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7358.9). Total num frames: 6598656. Throughput: 0: 7200.8. Samples: 6585276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:52,296][1151233] Avg episode reward: [(0, '8.208')]
+[2023-07-09 02:40:57,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 7345.0). Total num frames: 6631424. Throughput: 0: 7198.1. Samples: 6627664. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:40:57,295][1151233] Avg episode reward: [(0, '8.191')]
+[2023-07-09 02:40:57,401][1151487] Updated weights for policy 0, policy_version 12960 (0.0005)
+[2023-07-09 02:41:02,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7345.0). Total num frames: 6668288. Throughput: 0: 7241.9. Samples: 6650068. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:41:02,295][1151233] Avg episode reward: [(0, '8.150')]
+[2023-07-09 02:41:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013024_6668288.pth...
+[2023-07-09 02:41:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012600_6451200.pth
+[2023-07-09 02:41:03,076][1151487] Updated weights for policy 0, policy_version 13040 (0.0005)
+[2023-07-09 02:41:07,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 6705152. Throughput: 0: 7250.7. Samples: 6692928. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:41:07,296][1151233] Avg episode reward: [(0, '8.217')]
+[2023-07-09 02:41:08,688][1151487] Updated weights for policy 0, policy_version 13120 (0.0005)
+[2023-07-09 02:41:12,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 6742016. Throughput: 0: 7272.3. Samples: 6737620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:41:12,296][1151233] Avg episode reward: [(0, '8.212')]
+[2023-07-09 02:41:14,276][1151487] Updated weights for policy 0, policy_version 13200 (0.0005)
+[2023-07-09 02:41:17,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7331.1). Total num frames: 6778880. Throughput: 0: 7259.6. Samples: 6759104. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:41:17,296][1151233] Avg episode reward: [(0, '8.157')]
+[2023-07-09 02:41:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013240_6778880.pth...
+[2023-07-09 02:41:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000012816_6561792.pth
+[2023-07-09 02:41:19,978][1151487] Updated weights for policy 0, policy_version 13280 (0.0005)
+[2023-07-09 02:41:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 6815744. Throughput: 0: 7275.2. Samples: 6803088. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:41:22,296][1151233] Avg episode reward: [(0, '8.240')]
+[2023-07-09 02:41:25,529][1151487] Updated weights for policy 0, policy_version 13360 (0.0005)
+[2023-07-09 02:41:27,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 6852608. Throughput: 0: 7327.8. Samples: 6847520. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:41:27,296][1151233] Avg episode reward: [(0, '8.076')]
+[2023-07-09 02:41:31,191][1151487] Updated weights for policy 0, policy_version 13440 (0.0005)
+[2023-07-09 02:41:32,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7303.4). Total num frames: 6885376. Throughput: 0: 7296.4. Samples: 6868932. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:41:32,296][1151233] Avg episode reward: [(0, '8.024')]
+[2023-07-09 02:41:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013448_6885376.pth...
+[2023-07-09 02:41:32,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013024_6668288.pth
+[2023-07-09 02:41:37,037][1151487] Updated weights for policy 0, policy_version 13520 (0.0005)
+[2023-07-09 02:41:37,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7303.4). Total num frames: 6922240. Throughput: 0: 7253.8. Samples: 6911696. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:41:37,296][1151233] Avg episode reward: [(0, '8.086')]
+[2023-07-09 02:41:42,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7289.5). Total num frames: 6955008. Throughput: 0: 7195.2. Samples: 6951448. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:41:42,295][1151233] Avg episode reward: [(0, '8.105')]
+[2023-07-09 02:41:42,972][1151487] Updated weights for policy 0, policy_version 13600 (0.0005)
+[2023-07-09 02:41:47,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7275.6). Total num frames: 6991872. Throughput: 0: 7181.1. Samples: 6973216. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:41:47,296][1151233] Avg episode reward: [(0, '8.053')]
+[2023-07-09 02:41:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013656_6991872.pth...
+[2023-07-09 02:41:47,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013240_6778880.pth
+[2023-07-09 02:41:48,751][1151487] Updated weights for policy 0, policy_version 13680 (0.0005)
+[2023-07-09 02:41:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7275.6). Total num frames: 7028736. Throughput: 0: 7180.8. Samples: 7016064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:41:52,296][1151233] Avg episode reward: [(0, '8.209')]
+[2023-07-09 02:41:54,384][1151487] Updated weights for policy 0, policy_version 13760 (0.0005)
+[2023-07-09 02:41:57,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 7065600. Throughput: 0: 7147.8. Samples: 7059268. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:41:57,295][1151233] Avg episode reward: [(0, '8.189')]
+[2023-07-09 02:42:00,066][1151487] Updated weights for policy 0, policy_version 13840 (0.0005)
+[2023-07-09 02:42:02,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 7098368. Throughput: 0: 7169.5. Samples: 7081728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:02,295][1151233] Avg episode reward: [(0, '8.083')]
+[2023-07-09 02:42:02,336][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013872_7102464.pth...
+[2023-07-09 02:42:02,337][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013448_6885376.pth
+[2023-07-09 02:42:06,065][1151487] Updated weights for policy 0, policy_version 13920 (0.0004)
+[2023-07-09 02:42:07,295][1151233] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 7135232. Throughput: 0: 7106.0. Samples: 7122856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:07,296][1151233] Avg episode reward: [(0, '8.072')]
+[2023-07-09 02:42:11,597][1151487] Updated weights for policy 0, policy_version 14000 (0.0005)
+[2023-07-09 02:42:12,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 7172096. Throughput: 0: 7094.2. Samples: 7166760. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:42:12,296][1151233] Avg episode reward: [(0, '8.170')]
+[2023-07-09 02:42:17,075][1151487] Updated weights for policy 0, policy_version 14080 (0.0005)
+[2023-07-09 02:42:17,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 7208960. Throughput: 0: 7098.3. Samples: 7188356. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:42:17,296][1151233] Avg episode reward: [(0, '8.084')]
+[2023-07-09 02:42:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014080_7208960.pth...
+[2023-07-09 02:42:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013656_6991872.pth
+[2023-07-09 02:42:22,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 7245824. Throughput: 0: 7145.9. Samples: 7233260. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:42:22,296][1151233] Avg episode reward: [(0, '8.127')]
+[2023-07-09 02:42:22,760][1151487] Updated weights for policy 0, policy_version 14160 (0.0005)
+[2023-07-09 02:42:27,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7099.7, 300 sec: 7247.8). Total num frames: 7278592. Throughput: 0: 7191.0. Samples: 7275044. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:42:27,300][1151233] Avg episode reward: [(0, '8.094')]
+[2023-07-09 02:42:28,599][1151487] Updated weights for policy 0, policy_version 14240 (0.0005)
+[2023-07-09 02:42:32,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 7315456. Throughput: 0: 7223.8. Samples: 7298288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:32,296][1151233] Avg episode reward: [(0, '8.147')]
+[2023-07-09 02:42:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014288_7315456.pth...
+[2023-07-09 02:42:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000013872_7102464.pth
+[2023-07-09 02:42:34,364][1151487] Updated weights for policy 0, policy_version 14320 (0.0005)
+[2023-07-09 02:42:37,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 7352320. Throughput: 0: 7195.8. Samples: 7339876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:37,296][1151233] Avg episode reward: [(0, '8.116')]
+[2023-07-09 02:42:40,062][1151487] Updated weights for policy 0, policy_version 14400 (0.0006)
+[2023-07-09 02:42:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 7389184. Throughput: 0: 7190.7. Samples: 7382852. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:42,296][1151233] Avg episode reward: [(0, '8.011')]
+[2023-07-09 02:42:45,650][1151487] Updated weights for policy 0, policy_version 14480 (0.0005)
+[2023-07-09 02:42:47,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.2, 300 sec: 7261.7). Total num frames: 7426048. Throughput: 0: 7196.4. Samples: 7405568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:47,297][1151233] Avg episode reward: [(0, '8.111')]
+[2023-07-09 02:42:47,302][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014504_7426048.pth...
+[2023-07-09 02:42:47,306][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014080_7208960.pth
+[2023-07-09 02:42:51,362][1151487] Updated weights for policy 0, policy_version 14560 (0.0005)
+[2023-07-09 02:42:52,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 7458816. Throughput: 0: 7221.9. Samples: 7447840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:42:52,296][1151233] Avg episode reward: [(0, '8.173')]
+[2023-07-09 02:42:57,187][1151487] Updated weights for policy 0, policy_version 14640 (0.0005)
+[2023-07-09 02:42:57,295][1151233] Fps is (10 sec: 6963.4, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 7495680. Throughput: 0: 7204.0. Samples: 7490940. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:42:57,295][1151233] Avg episode reward: [(0, '8.047')]
+[2023-07-09 02:43:02,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 7532544. Throughput: 0: 7193.3. Samples: 7512056. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-09 02:43:02,296][1151233] Avg episode reward: [(0, '8.171')]
+[2023-07-09 02:43:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014712_7532544.pth...
+[2023-07-09 02:43:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014288_7315456.pth
+[2023-07-09 02:43:02,712][1151487] Updated weights for policy 0, policy_version 14720 (0.0005)
+[2023-07-09 02:43:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 7569408. Throughput: 0: 7190.4. Samples: 7556828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:07,296][1151233] Avg episode reward: [(0, '8.073')]
+[2023-07-09 02:43:08,305][1151487] Updated weights for policy 0, policy_version 14800 (0.0005)
+[2023-07-09 02:43:12,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 7606272. Throughput: 0: 7261.2. Samples: 7601800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:12,296][1151233] Avg episode reward: [(0, '8.118')]
+[2023-07-09 02:43:13,901][1151487] Updated weights for policy 0, policy_version 14880 (0.0005)
+[2023-07-09 02:43:17,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 7643136. Throughput: 0: 7209.6. Samples: 7622720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:17,296][1151233] Avg episode reward: [(0, '8.107')]
+[2023-07-09 02:43:17,300][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014928_7643136.pth...
+[2023-07-09 02:43:17,303][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014504_7426048.pth
+[2023-07-09 02:43:19,386][1151487] Updated weights for policy 0, policy_version 14960 (0.0005)
+[2023-07-09 02:43:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 7680000. Throughput: 0: 7286.7. Samples: 7667776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:22,296][1151233] Avg episode reward: [(0, '7.983')]
+[2023-07-09 02:43:24,663][1151487] Updated weights for policy 0, policy_version 15040 (0.0005)
+[2023-07-09 02:43:27,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7275.6). Total num frames: 7720960. Throughput: 0: 7396.6. Samples: 7715700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:27,296][1151233] Avg episode reward: [(0, '7.993')]
+[2023-07-09 02:43:30,015][1151487] Updated weights for policy 0, policy_version 15120 (0.0005)
+[2023-07-09 02:43:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 7753728. Throughput: 0: 7374.4. Samples: 7737416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:32,296][1151233] Avg episode reward: [(0, '7.993')]
+[2023-07-09 02:43:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015144_7753728.pth...
+[2023-07-09 02:43:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014712_7532544.pth
+[2023-07-09 02:43:35,699][1151487] Updated weights for policy 0, policy_version 15200 (0.0006)
+[2023-07-09 02:43:37,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7304.6, 300 sec: 7261.7). Total num frames: 7790592. Throughput: 0: 7367.9. Samples: 7779396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:37,296][1151233] Avg episode reward: [(0, '7.999')]
+[2023-07-09 02:43:41,372][1151487] Updated weights for policy 0, policy_version 15280 (0.0005)
+[2023-07-09 02:43:42,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 7827456. Throughput: 0: 7388.5. Samples: 7823424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:42,296][1151233] Avg episode reward: [(0, '7.849')]
+[2023-07-09 02:43:47,172][1151487] Updated weights for policy 0, policy_version 15360 (0.0005)
+[2023-07-09 02:43:47,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.6, 300 sec: 7275.6). Total num frames: 7864320. Throughput: 0: 7405.2. Samples: 7845288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:43:47,296][1151233] Avg episode reward: [(0, '8.029')]
+[2023-07-09 02:43:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015360_7864320.pth...
+[2023-07-09 02:43:47,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000014928_7643136.pth
+[2023-07-09 02:43:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7275.6). Total num frames: 7901184. Throughput: 0: 7377.7. Samples: 7888824. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:43:52,296][1151233] Avg episode reward: [(0, '8.072')]
+[2023-07-09 02:43:52,754][1151487] Updated weights for policy 0, policy_version 15440 (0.0005)
+[2023-07-09 02:43:57,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 7933952. Throughput: 0: 7289.9. Samples: 7929844. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-09 02:43:57,296][1151233] Avg episode reward: [(0, '8.032')]
+[2023-07-09 02:43:58,590][1151487] Updated weights for policy 0, policy_version 15520 (0.0005)
+[2023-07-09 02:44:02,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 7970816. Throughput: 0: 7349.9. Samples: 7953464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:02,295][1151233] Avg episode reward: [(0, '7.873')]
+[2023-07-09 02:44:02,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015568_7970816.pth...
+[2023-07-09 02:44:02,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015144_7753728.pth
+[2023-07-09 02:44:04,063][1151487] Updated weights for policy 0, policy_version 15600 (0.0005)
+[2023-07-09 02:44:07,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8007680. Throughput: 0: 7303.6. Samples: 7996436. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:07,296][1151233] Avg episode reward: [(0, '7.888')]
+[2023-07-09 02:44:09,809][1151487] Updated weights for policy 0, policy_version 15680 (0.0005)
+[2023-07-09 02:44:12,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8044544. Throughput: 0: 7216.5. Samples: 8040444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:12,296][1151233] Avg episode reward: [(0, '8.029')]
+[2023-07-09 02:44:15,260][1151487] Updated weights for policy 0, policy_version 15760 (0.0005)
+[2023-07-09 02:44:17,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7261.7). Total num frames: 8085504. Throughput: 0: 7210.2. Samples: 8061876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:17,295][1151233] Avg episode reward: [(0, '7.993')]
+[2023-07-09 02:44:17,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015792_8085504.pth...
+[2023-07-09 02:44:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015360_7864320.pth
+[2023-07-09 02:44:20,369][1151487] Updated weights for policy 0, policy_version 15840 (0.0006)
+[2023-07-09 02:44:22,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7261.7). Total num frames: 8122368. Throughput: 0: 7350.1. Samples: 8110152. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:22,296][1151233] Avg episode reward: [(0, '7.979')]
+[2023-07-09 02:44:26,214][1151487] Updated weights for policy 0, policy_version 15920 (0.0005)
+[2023-07-09 02:44:27,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 8155136. Throughput: 0: 7310.3. Samples: 8152388. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:44:27,296][1151233] Avg episode reward: [(0, '8.098')]
+[2023-07-09 02:44:31,873][1151487] Updated weights for policy 0, policy_version 16000 (0.0006)
+[2023-07-09 02:44:32,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8192000. Throughput: 0: 7339.6. Samples: 8175572. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:44:32,296][1151233] Avg episode reward: [(0, '8.064')]
+[2023-07-09 02:44:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016000_8192000.pth...
+[2023-07-09 02:44:32,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015568_7970816.pth
+[2023-07-09 02:44:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8228864. Throughput: 0: 7311.9. Samples: 8217860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:37,296][1151233] Avg episode reward: [(0, '8.151')]
+[2023-07-09 02:44:37,567][1151487] Updated weights for policy 0, policy_version 16080 (0.0005)
+[2023-07-09 02:44:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8265728. Throughput: 0: 7359.5. Samples: 8261020. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:42,296][1151233] Avg episode reward: [(0, '8.125')]
+[2023-07-09 02:44:42,973][1151487] Updated weights for policy 0, policy_version 16160 (0.0005)
+[2023-07-09 02:44:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8302592. Throughput: 0: 7392.8. Samples: 8286140. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:47,295][1151233] Avg episode reward: [(0, '8.058')]
+[2023-07-09 02:44:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016216_8302592.pth...
+[2023-07-09 02:44:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000015792_8085504.pth
+[2023-07-09 02:44:48,585][1151487] Updated weights for policy 0, policy_version 16240 (0.0005)
+[2023-07-09 02:44:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8339456. Throughput: 0: 7355.9. Samples: 8327452. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:52,296][1151233] Avg episode reward: [(0, '8.110')]
+[2023-07-09 02:44:54,488][1151487] Updated weights for policy 0, policy_version 16320 (0.0005)
+[2023-07-09 02:44:57,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7372.8, 300 sec: 7261.7). Total num frames: 8376320. Throughput: 0: 7297.0. Samples: 8368808. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:44:57,295][1151233] Avg episode reward: [(0, '8.132')]
+[2023-07-09 02:44:59,931][1151487] Updated weights for policy 0, policy_version 16400 (0.0005)
+[2023-07-09 02:45:02,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7247.8). Total num frames: 8409088. Throughput: 0: 7351.4. Samples: 8392688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:02,296][1151233] Avg episode reward: [(0, '8.131')]
+[2023-07-09 02:45:02,317][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016432_8413184.pth...
+[2023-07-09 02:45:02,319][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016000_8192000.pth
+[2023-07-09 02:45:05,421][1151487] Updated weights for policy 0, policy_version 16480 (0.0005)
+[2023-07-09 02:45:07,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7261.7). Total num frames: 8450048. Throughput: 0: 7280.4. Samples: 8437768. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:07,296][1151233] Avg episode reward: [(0, '8.143')]
+[2023-07-09 02:45:10,883][1151487] Updated weights for policy 0, policy_version 16560 (0.0005)
+[2023-07-09 02:45:12,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7275.6). Total num frames: 8486912. Throughput: 0: 7344.3. Samples: 8482880. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:45:12,296][1151233] Avg episode reward: [(0, '8.176')]
+[2023-07-09 02:45:16,633][1151487] Updated weights for policy 0, policy_version 16640 (0.0005)
+[2023-07-09 02:45:17,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 8523776. Throughput: 0: 7307.0. Samples: 8504388. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:45:17,296][1151233] Avg episode reward: [(0, '8.086')]
+[2023-07-09 02:45:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016648_8523776.pth...
+[2023-07-09 02:45:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016216_8302592.pth
+[2023-07-09 02:45:22,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 8556544. Throughput: 0: 7320.7. Samples: 8547292. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-09 02:45:22,296][1151233] Avg episode reward: [(0, '8.210')]
+[2023-07-09 02:45:22,329][1151487] Updated weights for policy 0, policy_version 16720 (0.0005)
+[2023-07-09 02:45:27,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 8593408. Throughput: 0: 7296.8. Samples: 8589376. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:27,296][1151233] Avg episode reward: [(0, '8.184')]
+[2023-07-09 02:45:28,002][1151487] Updated weights for policy 0, policy_version 16800 (0.0005)
+[2023-07-09 02:45:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 8630272. Throughput: 0: 7231.4. Samples: 8611552. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:32,296][1151233] Avg episode reward: [(0, '8.211')]
+[2023-07-09 02:45:32,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016856_8630272.pth...
+[2023-07-09 02:45:32,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016432_8413184.pth
+[2023-07-09 02:45:33,737][1151487] Updated weights for policy 0, policy_version 16880 (0.0005)
+[2023-07-09 02:45:37,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 8667136. Throughput: 0: 7276.9. Samples: 8654912. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:45:37,296][1151233] Avg episode reward: [(0, '8.179')]
+[2023-07-09 02:45:39,353][1151487] Updated weights for policy 0, policy_version 16960 (0.0005)
+[2023-07-09 02:45:42,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 8704000. Throughput: 0: 7333.9. Samples: 8698836. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-09 02:45:42,296][1151233] Avg episode reward: [(0, '8.135')]
+[2023-07-09 02:45:45,128][1151487] Updated weights for policy 0, policy_version 17040 (0.0005)
+[2023-07-09 02:45:47,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 8736768. Throughput: 0: 7280.6. Samples: 8720316. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:47,295][1151233] Avg episode reward: [(0, '8.198')]
+[2023-07-09 02:45:47,297][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017064_8736768.pth...
+[2023-07-09 02:45:47,299][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016648_8523776.pth
+[2023-07-09 02:45:50,975][1151487] Updated weights for policy 0, policy_version 17120 (0.0006)
+[2023-07-09 02:45:52,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 8773632. Throughput: 0: 7192.2. Samples: 8761416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:52,296][1151233] Avg episode reward: [(0, '8.182')]
+[2023-07-09 02:45:56,586][1151487] Updated weights for policy 0, policy_version 17200 (0.0005)
+[2023-07-09 02:45:57,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 8810496. Throughput: 0: 7176.6. Samples: 8805828. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:45:57,296][1151233] Avg episode reward: [(0, '8.231')]
+[2023-07-09 02:46:02,127][1151487] Updated weights for policy 0, policy_version 17280 (0.0005)
+[2023-07-09 02:46:02,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 8847360. Throughput: 0: 7173.7. Samples: 8827204. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:46:02,296][1151233] Avg episode reward: [(0, '8.282')]
+[2023-07-09 02:46:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017280_8847360.pth...
+[2023-07-09 02:46:02,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000016856_8630272.pth
+[2023-07-09 02:46:02,302][1151474] Saving new best policy, reward=8.282!
+[2023-07-09 02:46:07,180][1151487] Updated weights for policy 0, policy_version 17360 (0.0005)
+[2023-07-09 02:46:07,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 8888320. Throughput: 0: 7246.8. Samples: 8873400. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:46:07,296][1151233] Avg episode reward: [(0, '8.181')]
+[2023-07-09 02:46:12,295][1151233] Fps is (10 sec: 7782.5, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 8925184. Throughput: 0: 7361.4. Samples: 8920636. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:46:12,295][1151233] Avg episode reward: [(0, '8.137')]
+[2023-07-09 02:46:12,661][1151487] Updated weights for policy 0, policy_version 17440 (0.0005)
+[2023-07-09 02:46:17,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 8962048. Throughput: 0: 7373.8. Samples: 8943372. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:46:17,296][1151233] Avg episode reward: [(0, '8.246')]
+[2023-07-09 02:46:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017504_8962048.pth...
+[2023-07-09 02:46:17,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017064_8736768.pth
+[2023-07-09 02:46:18,160][1151487] Updated weights for policy 0, policy_version 17520 (0.0005)
+[2023-07-09 02:46:22,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 8994816. Throughput: 0: 7365.4. Samples: 8986356. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:46:22,296][1151233] Avg episode reward: [(0, '8.228')]
+[2023-07-09 02:46:24,163][1151487] Updated weights for policy 0, policy_version 17600 (0.0004)
+[2023-07-09 02:46:27,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 9031680. Throughput: 0: 7326.4. Samples: 9028524. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:46:27,296][1151233] Avg episode reward: [(0, '8.210')]
+[2023-07-09 02:46:29,802][1151487] Updated weights for policy 0, policy_version 17680 (0.0005)
+[2023-07-09 02:46:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 9068544. Throughput: 0: 7315.8. Samples: 9049528. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:46:32,296][1151233] Avg episode reward: [(0, '8.254')]
+[2023-07-09 02:46:32,300][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017712_9068544.pth...
+[2023-07-09 02:46:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017280_8847360.pth
+[2023-07-09 02:46:35,677][1151487] Updated weights for policy 0, policy_version 17760 (0.0005)
+[2023-07-09 02:46:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7289.5). Total num frames: 9105408. Throughput: 0: 7335.5. Samples: 9091512. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:46:37,296][1151233] Avg episode reward: [(0, '8.205')]
+[2023-07-09 02:46:41,007][1151487] Updated weights for policy 0, policy_version 17840 (0.0005)
+[2023-07-09 02:46:42,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7289.5). Total num frames: 9142272. Throughput: 0: 7369.6. Samples: 9137460. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:46:42,296][1151233] Avg episode reward: [(0, '8.182')]
+[2023-07-09 02:46:46,374][1151487] Updated weights for policy 0, policy_version 17920 (0.0005)
+[2023-07-09 02:46:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 9179136. Throughput: 0: 7368.5. Samples: 9158784. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:46:47,296][1151233] Avg episode reward: [(0, '8.188')]
+[2023-07-09 02:46:47,298][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017928_9179136.pth...
+[2023-07-09 02:46:47,300][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017504_8962048.pth
+[2023-07-09 02:46:51,981][1151487] Updated weights for policy 0, policy_version 18000 (0.0005)
+[2023-07-09 02:46:52,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 9216000. Throughput: 0: 7341.7. Samples: 9203776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:46:52,296][1151233] Avg episode reward: [(0, '8.226')]
+[2023-07-09 02:46:57,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7303.4). Total num frames: 9252864. Throughput: 0: 7291.1. Samples: 9248736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:46:57,296][1151233] Avg episode reward: [(0, '8.270')]
+[2023-07-09 02:46:57,634][1151487] Updated weights for policy 0, policy_version 18080 (0.0005)
+[2023-07-09 02:47:02,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7303.4). Total num frames: 9289728. Throughput: 0: 7260.0. Samples: 9270072. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:47:02,296][1151233] Avg episode reward: [(0, '8.190')]
+[2023-07-09 02:47:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018144_9289728.pth...
+[2023-07-09 02:47:02,303][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017712_9068544.pth
+[2023-07-09 02:47:03,187][1151487] Updated weights for policy 0, policy_version 18160 (0.0005)
+[2023-07-09 02:47:07,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7303.4). Total num frames: 9326592. Throughput: 0: 7328.0. Samples: 9316116. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:47:07,296][1151233] Avg episode reward: [(0, '8.173')]
+[2023-07-09 02:47:08,529][1151487] Updated weights for policy 0, policy_version 18240 (0.0005)
+[2023-07-09 02:47:12,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7317.3). Total num frames: 9367552. Throughput: 0: 7430.8. Samples: 9362912. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:47:12,296][1151233] Avg episode reward: [(0, '8.208')]
+[2023-07-09 02:47:13,493][1151487] Updated weights for policy 0, policy_version 18320 (0.0006)
+[2023-07-09 02:47:17,295][1151233] Fps is (10 sec: 7782.3, 60 sec: 7372.8, 300 sec: 7317.3). Total num frames: 9404416. Throughput: 0: 7486.1. Samples: 9386404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:47:17,296][1151233] Avg episode reward: [(0, '8.253')]
+[2023-07-09 02:47:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018368_9404416.pth...
+[2023-07-09 02:47:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000017928_9179136.pth
+[2023-07-09 02:47:19,228][1151487] Updated weights for policy 0, policy_version 18400 (0.0005)
+[2023-07-09 02:47:22,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 9441280. Throughput: 0: 7501.0. Samples: 9429056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:47:22,296][1151233] Avg episode reward: [(0, '8.186')]
+[2023-07-09 02:47:24,831][1151487] Updated weights for policy 0, policy_version 18480 (0.0005)
+[2023-07-09 02:47:27,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 9478144. Throughput: 0: 7479.9. Samples: 9474056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:47:27,296][1151233] Avg episode reward: [(0, '8.175')]
+[2023-07-09 02:47:30,334][1151487] Updated weights for policy 0, policy_version 18560 (0.0005)
+[2023-07-09 02:47:32,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 9515008. Throughput: 0: 7488.9. Samples: 9495784. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:47:32,296][1151233] Avg episode reward: [(0, '8.263')]
+[2023-07-09 02:47:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018584_9515008.pth...
+[2023-07-09 02:47:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018144_9289728.pth
+[2023-07-09 02:47:35,964][1151487] Updated weights for policy 0, policy_version 18640 (0.0005)
+[2023-07-09 02:47:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 9551872. Throughput: 0: 7464.0. Samples: 9539656. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-09 02:47:37,296][1151233] Avg episode reward: [(0, '8.186')]
+[2023-07-09 02:47:41,682][1151487] Updated weights for policy 0, policy_version 18720 (0.0005)
+[2023-07-09 02:47:42,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 9588736. Throughput: 0: 7424.3. Samples: 9582832. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:47:42,296][1151233] Avg episode reward: [(0, '8.140')]
+[2023-07-09 02:47:47,139][1151487] Updated weights for policy 0, policy_version 18800 (0.0005)
+[2023-07-09 02:47:47,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7345.0). Total num frames: 9625600. Throughput: 0: 7429.9. Samples: 9604416. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:47:47,296][1151233] Avg episode reward: [(0, '8.207')]
+[2023-07-09 02:47:47,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018800_9625600.pth...
+[2023-07-09 02:47:47,301][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018368_9404416.pth
+[2023-07-09 02:47:52,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7441.1, 300 sec: 7345.0). Total num frames: 9662464. Throughput: 0: 7461.5. Samples: 9651884. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-09 02:47:52,295][1151233] Avg episode reward: [(0, '8.170')]
+[2023-07-09 02:47:52,419][1151487] Updated weights for policy 0, policy_version 18880 (0.0005)
+[2023-07-09 02:47:57,295][1151233] Fps is (10 sec: 7372.9, 60 sec: 7441.1, 300 sec: 7345.0). Total num frames: 9699328. Throughput: 0: 7384.0. Samples: 9695192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:47:57,296][1151233] Avg episode reward: [(0, '8.253')]
+[2023-07-09 02:47:58,263][1151487] Updated weights for policy 0, policy_version 18960 (0.0005)
+[2023-07-09 02:48:02,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7441.1, 300 sec: 7345.0). Total num frames: 9736192. Throughput: 0: 7319.6. Samples: 9715784. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:48:02,296][1151233] Avg episode reward: [(0, '8.206')]
+[2023-07-09 02:48:02,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019016_9736192.pth...
+[2023-07-09 02:48:02,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018584_9515008.pth
+[2023-07-09 02:48:04,004][1151487] Updated weights for policy 0, policy_version 19040 (0.0005)
+[2023-07-09 02:48:07,295][1151233] Fps is (10 sec: 6963.2, 60 sec: 7372.8, 300 sec: 7331.1). Total num frames: 9768960. Throughput: 0: 7329.7. Samples: 9758892. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:48:07,296][1151233] Avg episode reward: [(0, '8.145')]
+[2023-07-09 02:48:09,620][1151487] Updated weights for policy 0, policy_version 19120 (0.0005)
+[2023-07-09 02:48:12,295][1151233] Fps is (10 sec: 6963.3, 60 sec: 7304.5, 300 sec: 7331.1). Total num frames: 9805824. Throughput: 0: 7284.6. Samples: 9801860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:48:12,296][1151233] Avg episode reward: [(0, '8.227')]
+[2023-07-09 02:48:15,085][1151487] Updated weights for policy 0, policy_version 19200 (0.0005)
+[2023-07-09 02:48:17,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7345.0). Total num frames: 9846784. Throughput: 0: 7337.9. Samples: 9825988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:48:17,296][1151233] Avg episode reward: [(0, '8.284')]
+[2023-07-09 02:48:17,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019232_9846784.pth...
+[2023-07-09 02:48:17,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000018800_9625600.pth
+[2023-07-09 02:48:17,302][1151474] Saving new best policy, reward=8.284!
+[2023-07-09 02:48:20,498][1151487] Updated weights for policy 0, policy_version 19280 (0.0005)
+[2023-07-09 02:48:22,295][1151233] Fps is (10 sec: 7782.4, 60 sec: 7372.8, 300 sec: 7331.1). Total num frames: 9883648. Throughput: 0: 7368.7. Samples: 9871248. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:48:22,296][1151233] Avg episode reward: [(0, '8.157')]
+[2023-07-09 02:48:25,914][1151487] Updated weights for policy 0, policy_version 19360 (0.0005)
+[2023-07-09 02:48:27,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7345.0). Total num frames: 9920512. Throughput: 0: 7414.6. Samples: 9916488. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:48:27,296][1151233] Avg episode reward: [(0, '8.163')]
+[2023-07-09 02:48:31,458][1151487] Updated weights for policy 0, policy_version 19440 (0.0006)
+[2023-07-09 02:48:32,295][1151233] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7345.0). Total num frames: 9957376. Throughput: 0: 7460.8. Samples: 9940152. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-09 02:48:32,296][1151233] Avg episode reward: [(0, '8.117')]
+[2023-07-09 02:48:32,299][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019448_9957376.pth...
+[2023-07-09 02:48:32,302][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019016_9736192.pth
+[2023-07-09 02:48:37,169][1151487] Updated weights for policy 0, policy_version 19520 (0.0005)
+[2023-07-09 02:48:37,295][1151233] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7345.0). Total num frames: 9994240. Throughput: 0: 7336.3. Samples: 9982016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-09 02:48:37,296][1151233] Avg episode reward: [(0, '8.143')]
+[2023-07-09 02:48:38,919][1151474] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000000
+[2023-07-09 02:48:38,920][1151586] Stopping RolloutWorker_w5...
+[2023-07-09 02:48:38,920][1151618] Stopping RolloutWorker_w6...
+[2023-07-09 02:48:38,920][1151521] Stopping RolloutWorker_w2...
+[2023-07-09 02:48:38,920][1151522] Stopping RolloutWorker_w3...
+[2023-07-09 02:48:38,920][1151489] Stopping RolloutWorker_w1...
+[2023-07-09 02:48:38,920][1151586] Loop rollout_proc5_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151619] Stopping RolloutWorker_w7...
+[2023-07-09 02:48:38,920][1151618] Loop rollout_proc6_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151489] Loop rollout_proc1_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151522] Loop rollout_proc3_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151488] Stopping RolloutWorker_w0...
+[2023-07-09 02:48:38,920][1151521] Loop rollout_proc2_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151619] Loop rollout_proc7_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151554] Stopping RolloutWorker_w4...
+[2023-07-09 02:48:38,920][1151233] Component RolloutWorker_w5 stopped!
+[2023-07-09 02:48:38,920][1151488] Loop rollout_proc0_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151554] Loop rollout_proc4_evt_loop terminating...
+[2023-07-09 02:48:38,920][1151233] Component RolloutWorker_w2 stopped!
+[2023-07-09 02:48:38,920][1151474] Stopping Batcher_0...
+[2023-07-09 02:48:38,921][1151474] Loop batcher_evt_loop terminating...
+[2023-07-09 02:48:38,921][1151233] Component RolloutWorker_w3 stopped!
+[2023-07-09 02:48:38,921][1151233] Component RolloutWorker_w6 stopped!
+[2023-07-09 02:48:38,921][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
+[2023-07-09 02:48:38,921][1151233] Component RolloutWorker_w1 stopped!
+[2023-07-09 02:48:38,922][1151233] Component RolloutWorker_w7 stopped!
+[2023-07-09 02:48:38,922][1151233] Component RolloutWorker_w4 stopped!
+[2023-07-09 02:48:38,922][1151233] Component RolloutWorker_w0 stopped!
+[2023-07-09 02:48:38,922][1151233] Component Batcher_0 stopped!
+[2023-07-09 02:48:38,925][1151474] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019232_9846784.pth
+[2023-07-09 02:48:38,926][1151474] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/stick-pull-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
+[2023-07-09 02:48:38,929][1151474] Stopping LearnerWorker_p0...
+[2023-07-09 02:48:38,930][1151474] Loop learner_proc0_evt_loop terminating...
+[2023-07-09 02:48:38,929][1151233] Component LearnerWorker_p0 stopped!
+[2023-07-09 02:48:39,003][1151487] Weights refcount: 2 0
+[2023-07-09 02:48:39,004][1151487] Stopping InferenceWorker_p0-w0...
+[2023-07-09 02:48:39,004][1151487] Loop inference_proc0-0_evt_loop terminating...
+[2023-07-09 02:48:39,004][1151233] Component InferenceWorker_p0-w0 stopped!
+[2023-07-09 02:48:39,005][1151233] Waiting for process learner_proc0 to stop...
+[2023-07-09 02:48:39,643][1151233] Waiting for process inference_proc0-0 to join...
+[2023-07-09 02:48:39,676][1151233] Waiting for process rollout_proc0 to join...
+[2023-07-09 02:48:39,677][1151233] Waiting for process rollout_proc1 to join...
+[2023-07-09 02:48:39,677][1151233] Waiting for process rollout_proc2 to join...
+[2023-07-09 02:48:39,677][1151233] Waiting for process rollout_proc3 to join...
+[2023-07-09 02:48:39,678][1151233] Waiting for process rollout_proc4 to join...
+[2023-07-09 02:48:39,678][1151233] Waiting for process rollout_proc5 to join...
+[2023-07-09 02:48:39,678][1151233] Waiting for process rollout_proc6 to join...
+[2023-07-09 02:48:39,678][1151233] Waiting for process rollout_proc7 to join...
+[2023-07-09 02:48:39,679][1151233] Batcher 0 profile tree view:
+batching: 1.8617, releasing_batches: 1.5519
+[2023-07-09 02:48:39,679][1151233] InferenceWorker_p0-w0 profile tree view:
 wait_policy: 0.0051
-  wait_policy_total: 725.8645
-update_model: 14.7716
+  wait_policy_total: 577.9705
+update_model: 14.9789
   weight_update: 0.0005
-one_step: 0.0006
-  handle_policy_step: 654.4743
-    deserialize: 27.0630, stack: 7.0909, obs_to_device_normalize: 120.0569, forward: 325.6194, send_messages: 42.8066
-    prepare_outputs: 74.9644
-      to_cpu: 11.7421
-[2023-07-08 10:25:29,169][906159] Learner 0 profile tree view:
-misc: 0.0093, prepare_batch: 9.6127
-train: 99.0514
-  epoch_init: 0.0373, minibatch_init: 1.3390, losses_postprocess: 1.3258, kl_divergence: 0.4562, after_optimizer: 0.7072
-  calculate_losses: 42.2538
-    losses_init: 0.0303, forward_head: 16.5764, bptt_initial: 0.1415, bptt: 0.1361, tail: 11.9206, advantages_returns: 0.8933, losses: 11.0975
-  update: 51.2870
-    clip: 6.0721
-[2023-07-08 10:25:29,169][906159] RolloutWorker_w0 profile tree view:
-wait_for_trajectories: 0.3055, enqueue_policy_requests: 13.2558, env_step: 1153.4336, overhead: 19.9571, complete_rollouts: 0.3315
-save_policy_outputs: 39.1503
-  split_output_tensors: 13.3164
-[2023-07-08 10:25:29,169][906159] RolloutWorker_w7 profile tree view:
-wait_for_trajectories: 0.3134, enqueue_policy_requests: 13.6545, env_step: 1157.8266, overhead: 20.3714, complete_rollouts: 0.3378
-save_policy_outputs: 38.7547
-  split_output_tensors: 13.1330
-[2023-07-08 10:25:29,169][906159] Loop Runner_EvtLoop terminating...
-[2023-07-08 10:25:29,170][906159] Runner profile tree view:
-main_loop: 1481.1155
-[2023-07-08 10:25:29,170][906159] Collected {0: 10006528}, FPS: 6756.1
+one_step: 0.0007
+  handle_policy_step: 674.4182
+    deserialize: 27.8633, stack: 7.1654, obs_to_device_normalize: 122.0588, forward: 336.2834, send_messages: 47.1613
+    prepare_outputs: 75.2655
+      to_cpu: 11.4953
+[2023-07-09 02:48:39,679][1151233] Learner 0 profile tree view:
+misc: 0.0100, prepare_batch: 8.4511
+train: 87.4974
+  epoch_init: 0.0360, minibatch_init: 1.2159, losses_postprocess: 1.2830, kl_divergence: 0.4188, after_optimizer: 0.6567
+  calculate_losses: 36.9716
+    losses_init: 0.0298, forward_head: 14.0879, bptt_initial: 0.1297, bptt: 0.1289, tail: 10.7713, advantages_returns: 0.8421, losses: 9.6857
+  update: 45.4571
+    clip: 5.4794
+[2023-07-09 02:48:39,680][1151233] RolloutWorker_w0 profile tree view:
+wait_for_trajectories: 0.4627, enqueue_policy_requests: 16.1620, env_step: 911.3463, overhead: 22.2602, complete_rollouts: 0.3987
+save_policy_outputs: 44.2959
+  split_output_tensors: 15.0601
+[2023-07-09 02:48:39,680][1151233] RolloutWorker_w7 profile tree view:
+wait_for_trajectories: 0.4412, enqueue_policy_requests: 15.3036, env_step: 889.4111, overhead: 21.8602, complete_rollouts: 0.3938
+save_policy_outputs: 42.5737
+  split_output_tensors: 14.5879
+[2023-07-09 02:48:39,680][1151233] Loop Runner_EvtLoop terminating...
+[2023-07-09 02:48:39,680][1151233] Runner profile tree view:
+main_loop: 1354.1947
+[2023-07-09 02:48:39,681][1151233] Collected {0: 10006528}, FPS: 7389.3