diff --git "a/sf_log.txt" "b/sf_log.txt"
--- "a/sf_log.txt"
+++ "b/sf_log.txt"
@@ -1,32 +1,35 @@
-[2023-07-08 19:02:11,113][1047911] Saving configuration to /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/config.json...
-[2023-07-08 19:02:11,131][1047911] Rollout worker 0 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 1 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 2 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 3 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 4 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 5 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 6 uses device cpu
-[2023-07-08 19:02:11,132][1047911] Rollout worker 7 uses device cpu
-[2023-07-08 19:02:11,132][1047911] In synchronous mode, we only accumulate one batch. Setting num_batches_to_accumulate to 1
-[2023-07-08 19:02:11,145][1047911] InferenceWorker_p0-w0: min num requests: 2
-[2023-07-08 19:02:11,165][1047911] Starting all processes...
-[2023-07-08 19:02:11,165][1047911] Starting process learner_proc0
-[2023-07-08 19:02:11,174][1047911] Starting all processes...
-[2023-07-08 19:02:11,177][1047911] Starting process inference_proc0-0
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc0
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc1
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc2
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc3
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc4
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc5
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc6
-[2023-07-08 19:02:11,178][1047911] Starting process rollout_proc7
-[2023-07-08 19:02:13,337][1048155] Starting seed is not provided
-[2023-07-08 19:02:13,338][1048155] Initializing actor-critic model on device cpu
-[2023-07-08 19:02:13,338][1048155] RunningMeanStd input shape: (39,)
-[2023-07-08 19:02:13,338][1048155] RunningMeanStd input shape: (1,)
-[2023-07-08 19:02:13,406][1048155] Created Actor Critic model with architecture:
-[2023-07-08 19:02:13,406][1048155] ActorCriticSharedWeights(
+[2023-07-17 12:20:51,674][434969] Saving configuration to /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/config.json...
+[2023-07-17 12:20:51,692][434969] Rollout worker 0 uses device cpu
+[2023-07-17 12:20:51,692][434969] Rollout worker 1 uses device cpu
+[2023-07-17 12:20:51,692][434969] Rollout worker 2 uses device cpu
+[2023-07-17 12:20:51,692][434969] Rollout worker 3 uses device cpu
+[2023-07-17 12:20:51,693][434969] Rollout worker 4 uses device cpu
+[2023-07-17 12:20:51,693][434969] Rollout worker 5 uses device cpu
+[2023-07-17 12:20:51,693][434969] Rollout worker 6 uses device cpu
+[2023-07-17 12:20:51,693][434969] Rollout worker 7 uses device cpu
+[2023-07-17 12:20:51,693][434969] In synchronous mode, we only accumulate one batch. Setting num_batches_to_accumulate to 1
+[2023-07-17 12:20:51,705][434969] InferenceWorker_p0-w0: min num requests: 2
+[2023-07-17 12:20:51,724][434969] Starting all processes...
+[2023-07-17 12:20:51,724][434969] Starting process learner_proc0
+[2023-07-17 12:20:51,774][434969] Starting all processes...
+[2023-07-17 12:20:51,819][434969] Starting process inference_proc0-0
+[2023-07-17 12:20:51,819][434969] Starting process rollout_proc0
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc1
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc2
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc3
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc4
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc5
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc6
+[2023-07-17 12:20:51,820][434969] Starting process rollout_proc7
+[2023-07-17 12:20:53,673][435286] Worker 2 uses CPU cores [8, 9, 10, 11]
+[2023-07-17 12:20:53,684][435285] Worker 1 uses CPU cores [4, 5, 6, 7]
+[2023-07-17 12:20:53,875][435240] Starting seed is not provided
+[2023-07-17 12:20:53,875][435240] Initializing actor-critic model on device cpu
+[2023-07-17 12:20:53,876][435240] RunningMeanStd input shape: (39,)
+[2023-07-17 12:20:53,876][435240] RunningMeanStd input shape: (1,)
+[2023-07-17 12:20:53,909][435385] Worker 7 uses CPU cores [28, 29, 30, 31]
+[2023-07-17 12:20:53,938][435240] Created Actor Critic model with architecture:
+[2023-07-17 12:20:53,939][435240] ActorCriticSharedWeights(
   (obs_normalizer): ObservationNormalizer(
     (running_mean_std): RunningMeanStdDictInPlace(
       (running_mean_std): ModuleDict(
@@ -57,1240 +60,1007 @@
     (distribution_linear): Linear(in_features=64, out_features=4, bias=True)
   )
 )
-[2023-07-08 19:02:13,449][1048202] Worker 2 uses CPU cores [8, 9, 10, 11]
-[2023-07-08 19:02:13,681][1048235] Worker 4 uses CPU cores [16, 17, 18, 19]
-[2023-07-08 19:02:13,717][1048233] Worker 3 uses CPU cores [12, 13, 14, 15]
-[2023-07-08 19:02:13,722][1048155] Using optimizer <class 'torch.optim.adam.Adam'>
-[2023-07-08 19:02:13,723][1048155] No checkpoints found
-[2023-07-08 19:02:13,723][1048155] Did not load from checkpoint, starting from scratch!
-[2023-07-08 19:02:13,723][1048155] Initialized policy 0 weights for model version 0
-[2023-07-08 19:02:13,724][1048155] LearnerWorker_p0 finished initialization!
-[2023-07-08 19:02:13,726][1048168] RunningMeanStd input shape: (39,)
-[2023-07-08 19:02:13,727][1048168] RunningMeanStd input shape: (1,)
-[2023-07-08 19:02:13,766][1048269] Worker 7 uses CPU cores [28, 29, 30, 31]
-[2023-07-08 19:02:13,767][1048267] Worker 5 uses CPU cores [20, 21, 22, 23]
-[2023-07-08 19:02:13,817][1047911] Inference worker 0-0 is ready!
-[2023-07-08 19:02:13,818][1047911] All inference workers are ready! Signal rollout workers to start!
-[2023-07-08 19:02:14,023][1048169] Worker 0 uses CPU cores [0, 1, 2, 3]
-[2023-07-08 19:02:14,060][1048268] Worker 6 uses CPU cores [24, 25, 26, 27]
-[2023-07-08 19:02:14,077][1048170] Worker 1 uses CPU cores [4, 5, 6, 7]
-[2023-07-08 19:02:17,599][1047911] Fps is (10 sec: nan, 60 sec: nan, 300 sec: nan). Total num frames: 0. Throughput: 0: nan. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
-[2023-07-08 19:02:20,691][1048235] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:20,710][1048202] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:20,712][1048235] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:20,713][1048233] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:20,731][1048202] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:20,734][1048233] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:20,742][1048269] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:20,761][1048235] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:20,762][1048269] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:20,780][1048202] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:20,783][1048233] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:20,812][1048269] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:20,860][1048235] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:20,878][1048202] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:20,881][1048233] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:20,911][1048269] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:20,964][1048169] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:20,984][1048169] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:21,034][1048169] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:21,046][1048170] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:21,067][1048170] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:21,102][1048267] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:21,117][1048170] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:21,123][1048267] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:21,131][1048169] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:21,172][1048267] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:21,217][1048170] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:21,270][1048267] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:21,443][1048268] Decorrelating experience for 0 frames...
-[2023-07-08 19:02:21,464][1048268] Decorrelating experience for 64 frames...
-[2023-07-08 19:02:21,514][1048268] Decorrelating experience for 128 frames...
-[2023-07-08 19:02:21,613][1048268] Decorrelating experience for 192 frames...
-[2023-07-08 19:02:22,599][1047911] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 0.0. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
-[2023-07-08 19:02:22,600][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000000_0.pth...
-[2023-07-08 19:02:27,599][1047911] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 0.0. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
-[2023-07-08 19:02:27,761][1048233] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:27,763][1048235] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:27,764][1048269] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:27,774][1048202] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:27,935][1048233] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:27,936][1048235] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:27,940][1048269] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:27,948][1048202] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:28,071][1048170] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:28,079][1048169] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:28,147][1048267] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:28,159][1048233] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,162][1048235] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,165][1048269] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,175][1048202] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,248][1048170] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:28,256][1048169] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:28,323][1048267] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:28,412][1048233] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,417][1048235] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,420][1048269] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,428][1048202] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,476][1048170] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,481][1048169] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,495][1048268] Decorrelating experience for 256 frames...
-[2023-07-08 19:02:28,550][1048267] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:28,670][1048268] Decorrelating experience for 320 frames...
-[2023-07-08 19:02:28,727][1048170] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,733][1048169] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,804][1048267] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:28,895][1048268] Decorrelating experience for 384 frames...
-[2023-07-08 19:02:29,150][1048268] Decorrelating experience for 448 frames...
-[2023-07-08 19:02:31,140][1047911] Heartbeat connected on Batcher_0
-[2023-07-08 19:02:31,142][1047911] Heartbeat connected on LearnerWorker_p0
-[2023-07-08 19:02:31,146][1047911] Heartbeat connected on InferenceWorker_p0-w0
-[2023-07-08 19:02:31,154][1047911] Heartbeat connected on RolloutWorker_w0
-[2023-07-08 19:02:31,154][1047911] Heartbeat connected on RolloutWorker_w1
-[2023-07-08 19:02:31,155][1047911] Heartbeat connected on RolloutWorker_w2
-[2023-07-08 19:02:31,158][1047911] Heartbeat connected on RolloutWorker_w3
-[2023-07-08 19:02:31,160][1047911] Heartbeat connected on RolloutWorker_w4
-[2023-07-08 19:02:31,161][1047911] Heartbeat connected on RolloutWorker_w6
-[2023-07-08 19:02:31,164][1047911] Heartbeat connected on RolloutWorker_w5
-[2023-07-08 19:02:31,169][1047911] Heartbeat connected on RolloutWorker_w7
-[2023-07-08 19:02:32,599][1047911] Fps is (10 sec: 2048.0, 60 sec: 1365.3, 300 sec: 1365.3). Total num frames: 20480. Throughput: 0: 1083.2. Samples: 16248. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:02:32,600][1047911] Avg episode reward: [(0, '94.738')]
-[2023-07-08 19:02:35,301][1048168] Updated weights for policy 0, policy_version 80 (0.0005)
-[2023-07-08 19:02:37,599][1047911] Fps is (10 sec: 5734.4, 60 sec: 2867.2, 300 sec: 2867.2). Total num frames: 57344. Throughput: 0: 1881.4. Samples: 37628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:02:37,600][1047911] Avg episode reward: [(0, '94.631')]
-[2023-07-08 19:02:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000112_57344.pth...
-[2023-07-08 19:02:40,848][1048168] Updated weights for policy 0, policy_version 160 (0.0005)
-[2023-07-08 19:02:42,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 3768.3, 300 sec: 3768.3). Total num frames: 94208. Throughput: 0: 3279.4. Samples: 81984. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:02:42,600][1047911] Avg episode reward: [(0, '96.307')]
-[2023-07-08 19:02:45,964][1048168] Updated weights for policy 0, policy_version 240 (0.0005)
-[2023-07-08 19:02:47,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 4505.6, 300 sec: 4505.6). Total num frames: 135168. Throughput: 0: 4344.7. Samples: 130340. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:02:47,600][1047911] Avg episode reward: [(0, '96.700')]
-[2023-07-08 19:02:47,601][1048155] Saving new best policy, reward=96.700!
-[2023-07-08 19:02:51,323][1048168] Updated weights for policy 0, policy_version 320 (0.0005)
-[2023-07-08 19:02:52,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 4915.2, 300 sec: 4915.2). Total num frames: 172032. Throughput: 0: 4365.8. Samples: 152804. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:02:52,600][1047911] Avg episode reward: [(0, '97.453')]
-[2023-07-08 19:02:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000336_172032.pth...
-[2023-07-08 19:02:52,680][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000000_0.pth
-[2023-07-08 19:02:52,681][1048155] Saving new best policy, reward=97.453!
-[2023-07-08 19:02:56,655][1048168] Updated weights for policy 0, policy_version 400 (0.0005)
-[2023-07-08 19:02:57,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 5222.4, 300 sec: 5222.4). Total num frames: 208896. Throughput: 0: 4982.2. Samples: 199288. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:02:57,600][1047911] Avg episode reward: [(0, '98.272')]
-[2023-07-08 19:02:57,600][1048155] Saving new best policy, reward=98.272!
-[2023-07-08 19:03:01,911][1048168] Updated weights for policy 0, policy_version 480 (0.0005)
-[2023-07-08 19:03:02,599][1047911] Fps is (10 sec: 7782.5, 60 sec: 5552.4, 300 sec: 5552.4). Total num frames: 249856. Throughput: 0: 5460.8. Samples: 245736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:02,600][1047911] Avg episode reward: [(0, '100.002')]
-[2023-07-08 19:03:02,600][1048155] Saving new best policy, reward=100.002!
-[2023-07-08 19:03:07,584][1048168] Updated weights for policy 0, policy_version 560 (0.0005)
-[2023-07-08 19:03:07,599][1047911] Fps is (10 sec: 7782.3, 60 sec: 5734.4, 300 sec: 5734.4). Total num frames: 286720. Throughput: 0: 5938.7. Samples: 267240. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:07,600][1047911] Avg episode reward: [(0, '105.233')]
-[2023-07-08 19:03:07,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000560_286720.pth...
-[2023-07-08 19:03:07,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000112_57344.pth
-[2023-07-08 19:03:07,606][1048155] Saving new best policy, reward=105.233!
-[2023-07-08 19:03:12,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 5883.3, 300 sec: 5883.3). Total num frames: 323584. Throughput: 0: 6919.1. Samples: 311360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:12,600][1047911] Avg episode reward: [(0, '109.737')]
-[2023-07-08 19:03:12,600][1048155] Saving new best policy, reward=109.737!
-[2023-07-08 19:03:13,018][1048168] Updated weights for policy 0, policy_version 640 (0.0005)
-[2023-07-08 19:03:17,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 6007.5, 300 sec: 6007.5). Total num frames: 360448. Throughput: 0: 7556.1. Samples: 356272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:17,600][1047911] Avg episode reward: [(0, '112.300')]
-[2023-07-08 19:03:17,600][1048155] Saving new best policy, reward=112.300!
-[2023-07-08 19:03:18,483][1048168] Updated weights for policy 0, policy_version 720 (0.0004)
-[2023-07-08 19:03:22,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 6621.9, 300 sec: 6112.5). Total num frames: 397312. Throughput: 0: 7576.9. Samples: 378588. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:03:22,599][1047911] Avg episode reward: [(0, '113.594')]
-[2023-07-08 19:03:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000776_397312.pth...
-[2023-07-08 19:03:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000336_172032.pth
-[2023-07-08 19:03:22,605][1048155] Saving new best policy, reward=113.594!
-[2023-07-08 19:03:23,956][1048168] Updated weights for policy 0, policy_version 800 (0.0005)
-[2023-07-08 19:03:27,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 6202.5). Total num frames: 434176. Throughput: 0: 7632.5. Samples: 425448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:27,600][1047911] Avg episode reward: [(0, '115.905')]
-[2023-07-08 19:03:27,601][1048155] Saving new best policy, reward=115.905!
-[2023-07-08 19:03:29,640][1048168] Updated weights for policy 0, policy_version 880 (0.0005)
-[2023-07-08 19:03:32,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 6280.5). Total num frames: 471040. Throughput: 0: 7481.7. Samples: 467016. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:32,600][1047911] Avg episode reward: [(0, '124.240')]
-[2023-07-08 19:03:32,601][1048155] Saving new best policy, reward=124.240!
-[2023-07-08 19:03:35,233][1048168] Updated weights for policy 0, policy_version 960 (0.0005)
-[2023-07-08 19:03:37,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7509.3, 300 sec: 6348.8). Total num frames: 507904. Throughput: 0: 7463.2. Samples: 488648. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:03:37,600][1047911] Avg episode reward: [(0, '130.722')]
-[2023-07-08 19:03:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000992_507904.pth...
-[2023-07-08 19:03:37,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000560_286720.pth
-[2023-07-08 19:03:37,606][1048155] Saving new best policy, reward=130.722!
-[2023-07-08 19:03:40,850][1048168] Updated weights for policy 0, policy_version 1040 (0.0005)
-[2023-07-08 19:03:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 6409.0). Total num frames: 544768. Throughput: 0: 7405.7. Samples: 532544. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:03:42,600][1047911] Avg episode reward: [(0, '143.027')]
-[2023-07-08 19:03:42,601][1048155] Saving new best policy, reward=143.027!
-[2023-07-08 19:03:46,554][1048168] Updated weights for policy 0, policy_version 1120 (0.0005)
-[2023-07-08 19:03:47,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7441.1, 300 sec: 6462.6). Total num frames: 581632. Throughput: 0: 7339.7. Samples: 576024. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:47,600][1047911] Avg episode reward: [(0, '147.801')]
-[2023-07-08 19:03:47,601][1048155] Saving new best policy, reward=147.801!
-[2023-07-08 19:03:52,104][1048168] Updated weights for policy 0, policy_version 1200 (0.0005)
-[2023-07-08 19:03:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7372.8, 300 sec: 6467.4). Total num frames: 614400. Throughput: 0: 7351.0. Samples: 598036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:52,599][1047911] Avg episode reward: [(0, '163.955')]
-[2023-07-08 19:03:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001200_614400.pth...
-[2023-07-08 19:03:52,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000776_397312.pth
-[2023-07-08 19:03:52,604][1048155] Saving new best policy, reward=163.955!
-[2023-07-08 19:03:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7372.8, 300 sec: 6512.6). Total num frames: 651264. Throughput: 0: 7323.0. Samples: 640896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:03:57,599][1047911] Avg episode reward: [(0, '160.794')]
-[2023-07-08 19:03:57,857][1048168] Updated weights for policy 0, policy_version 1280 (0.0005)
-[2023-07-08 19:04:02,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 6553.6). Total num frames: 688128. Throughput: 0: 7285.0. Samples: 684096. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:02,599][1047911] Avg episode reward: [(0, '177.770')]
-[2023-07-08 19:04:02,600][1048155] Saving new best policy, reward=177.770!
-[2023-07-08 19:04:03,646][1048168] Updated weights for policy 0, policy_version 1360 (0.0004)
-[2023-07-08 19:04:07,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 6590.8). Total num frames: 724992. Throughput: 0: 7265.7. Samples: 705544. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:07,600][1047911] Avg episode reward: [(0, '186.273')]
-[2023-07-08 19:04:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001416_724992.pth...
-[2023-07-08 19:04:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000992_507904.pth
-[2023-07-08 19:04:07,606][1048155] Saving new best policy, reward=186.273!
-[2023-07-08 19:04:09,362][1048168] Updated weights for policy 0, policy_version 1440 (0.0005)
-[2023-07-08 19:04:12,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 6624.8). Total num frames: 761856. Throughput: 0: 7186.8. Samples: 748856. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:12,600][1047911] Avg episode reward: [(0, '191.592')]
-[2023-07-08 19:04:12,600][1048155] Saving new best policy, reward=191.592!
-[2023-07-08 19:04:14,829][1048168] Updated weights for policy 0, policy_version 1520 (0.0005)
-[2023-07-08 19:04:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 6656.0). Total num frames: 798720. Throughput: 0: 7272.4. Samples: 794272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:17,600][1047911] Avg episode reward: [(0, '193.889')]
-[2023-07-08 19:04:17,600][1048155] Saving new best policy, reward=193.889!
-[2023-07-08 19:04:20,470][1048168] Updated weights for policy 0, policy_version 1600 (0.0005)
-[2023-07-08 19:04:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 6651.9). Total num frames: 831488. Throughput: 0: 7254.6. Samples: 815104. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:04:22,600][1047911] Avg episode reward: [(0, '196.054')]
-[2023-07-08 19:04:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001624_831488.pth...
-[2023-07-08 19:04:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001200_614400.pth
-[2023-07-08 19:04:22,605][1048155] Saving new best policy, reward=196.054!
-[2023-07-08 19:04:26,232][1048168] Updated weights for policy 0, policy_version 1680 (0.0005)
-[2023-07-08 19:04:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 6679.6). Total num frames: 868352. Throughput: 0: 7233.3. Samples: 858044. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:27,599][1047911] Avg episode reward: [(0, '197.128')]
-[2023-07-08 19:04:27,600][1048155] Saving new best policy, reward=197.128!
-[2023-07-08 19:04:32,175][1048168] Updated weights for policy 0, policy_version 1760 (0.0005)
-[2023-07-08 19:04:32,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 6675.0). Total num frames: 901120. Throughput: 0: 7181.2. Samples: 899176. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:04:32,599][1047911] Avg episode reward: [(0, '198.293')]
-[2023-07-08 19:04:32,600][1048155] Saving new best policy, reward=198.293!
-[2023-07-08 19:04:37,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6699.9). Total num frames: 937984. Throughput: 0: 7189.1. Samples: 921544. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:04:37,600][1047911] Avg episode reward: [(0, '201.624')]
-[2023-07-08 19:04:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001832_937984.pth...
-[2023-07-08 19:04:37,603][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001416_724992.pth
-[2023-07-08 19:04:37,604][1048155] Saving new best policy, reward=201.624!
-[2023-07-08 19:04:37,838][1048168] Updated weights for policy 0, policy_version 1840 (0.0005)
-[2023-07-08 19:04:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 6723.1). Total num frames: 974848. Throughput: 0: 7154.9. Samples: 962868. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:42,600][1047911] Avg episode reward: [(0, '202.699')]
-[2023-07-08 19:04:42,600][1048155] Saving new best policy, reward=202.699!
-[2023-07-08 19:04:43,788][1048168] Updated weights for policy 0, policy_version 1920 (0.0005)
-[2023-07-08 19:04:47,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7099.7, 300 sec: 6717.4). Total num frames: 1007616. Throughput: 0: 7152.9. Samples: 1005976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:47,599][1047911] Avg episode reward: [(0, '205.446')]
-[2023-07-08 19:04:47,600][1048155] Saving new best policy, reward=205.446!
-[2023-07-08 19:04:49,412][1048168] Updated weights for policy 0, policy_version 2000 (0.0006)
-[2023-07-08 19:04:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6738.6). Total num frames: 1044480. Throughput: 0: 7165.4. Samples: 1027988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:52,599][1047911] Avg episode reward: [(0, '205.589')]
-[2023-07-08 19:04:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002040_1044480.pth...
-[2023-07-08 19:04:52,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001624_831488.pth
-[2023-07-08 19:04:52,604][1048155] Saving new best policy, reward=205.589!
-[2023-07-08 19:04:54,945][1048168] Updated weights for policy 0, policy_version 2080 (0.0005)
-[2023-07-08 19:04:57,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 6758.4). Total num frames: 1081344. Throughput: 0: 7182.6. Samples: 1072072. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:04:57,600][1047911] Avg episode reward: [(0, '207.014')]
-[2023-07-08 19:04:57,600][1048155] Saving new best policy, reward=207.014!
-[2023-07-08 19:05:00,874][1048168] Updated weights for policy 0, policy_version 2160 (0.0005)
-[2023-07-08 19:05:02,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7168.0, 300 sec: 6777.0). Total num frames: 1118208. Throughput: 0: 7110.5. Samples: 1114244. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:02,599][1047911] Avg episode reward: [(0, '200.432')]
-[2023-07-08 19:05:06,270][1048168] Updated weights for policy 0, policy_version 2240 (0.0005)
-[2023-07-08 19:05:07,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 6794.5). Total num frames: 1155072. Throughput: 0: 7173.3. Samples: 1137904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:07,600][1047911] Avg episode reward: [(0, '205.084')]
-[2023-07-08 19:05:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002256_1155072.pth...
-[2023-07-08 19:05:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001832_937984.pth
-[2023-07-08 19:05:12,110][1048168] Updated weights for policy 0, policy_version 2320 (0.0006)
-[2023-07-08 19:05:12,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 6787.7). Total num frames: 1187840. Throughput: 0: 7146.5. Samples: 1179636. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:12,599][1047911] Avg episode reward: [(0, '205.967')]
-[2023-07-08 19:05:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 6803.9). Total num frames: 1224704. Throughput: 0: 7137.5. Samples: 1220364. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:17,600][1047911] Avg episode reward: [(0, '210.238')]
-[2023-07-08 19:05:17,600][1048155] Saving new best policy, reward=210.238!
-[2023-07-08 19:05:18,075][1048168] Updated weights for policy 0, policy_version 2400 (0.0005)
-[2023-07-08 19:05:22,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7099.7, 300 sec: 6797.1). Total num frames: 1257472. Throughput: 0: 7120.9. Samples: 1241984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:22,600][1047911] Avg episode reward: [(0, '204.272')]
-[2023-07-08 19:05:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002456_1257472.pth...
-[2023-07-08 19:05:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002040_1044480.pth
-[2023-07-08 19:05:23,862][1048168] Updated weights for policy 0, policy_version 2480 (0.0005)
-[2023-07-08 19:05:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 6812.3). Total num frames: 1294336. Throughput: 0: 7111.1. Samples: 1282868. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:05:27,600][1047911] Avg episode reward: [(0, '200.523')]
-[2023-07-08 19:05:29,446][1048168] Updated weights for policy 0, policy_version 2560 (0.0005)
-[2023-07-08 19:05:32,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7168.0, 300 sec: 6826.7). Total num frames: 1331200. Throughput: 0: 7192.7. Samples: 1329648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:32,599][1047911] Avg episode reward: [(0, '204.208')]
-[2023-07-08 19:05:34,885][1048168] Updated weights for policy 0, policy_version 2640 (0.0005)
-[2023-07-08 19:05:37,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7236.3, 300 sec: 6860.8). Total num frames: 1372160. Throughput: 0: 7193.0. Samples: 1351672. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:37,600][1047911] Avg episode reward: [(0, '204.845')]
-[2023-07-08 19:05:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002680_1372160.pth...
-[2023-07-08 19:05:37,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002256_1155072.pth
-[2023-07-08 19:05:40,287][1048168] Updated weights for policy 0, policy_version 2720 (0.0005)
-[2023-07-08 19:05:42,599][1047911] Fps is (10 sec: 7782.3, 60 sec: 7236.3, 300 sec: 6873.3). Total num frames: 1409024. Throughput: 0: 7214.5. Samples: 1396724. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:42,600][1047911] Avg episode reward: [(0, '204.521')]
-[2023-07-08 19:05:46,013][1048168] Updated weights for policy 0, policy_version 2800 (0.0005)
-[2023-07-08 19:05:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 6865.7). Total num frames: 1441792. Throughput: 0: 7219.0. Samples: 1439100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:47,599][1047911] Avg episode reward: [(0, '205.579')]
-[2023-07-08 19:05:51,507][1048168] Updated weights for policy 0, policy_version 2880 (0.0006)
-[2023-07-08 19:05:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 6877.5). Total num frames: 1478656. Throughput: 0: 7203.7. Samples: 1462072. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:05:52,599][1047911] Avg episode reward: [(0, '211.707')]
-[2023-07-08 19:05:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002896_1482752.pth...
-[2023-07-08 19:05:52,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002456_1257472.pth
-[2023-07-08 19:05:52,604][1048155] Saving new best policy, reward=211.707!
-[2023-07-08 19:05:57,338][1048168] Updated weights for policy 0, policy_version 2960 (0.0005)
-[2023-07-08 19:05:57,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 6888.7). Total num frames: 1515520. Throughput: 0: 7228.2. Samples: 1504904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:05:57,600][1047911] Avg episode reward: [(0, '208.306')]
-[2023-07-08 19:06:02,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6881.3). Total num frames: 1548288. Throughput: 0: 7278.7. Samples: 1547904. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:06:02,600][1047911] Avg episode reward: [(0, '208.421')]
-[2023-07-08 19:06:03,297][1048168] Updated weights for policy 0, policy_version 3040 (0.0005)
-[2023-07-08 19:06:07,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6892.0). Total num frames: 1585152. Throughput: 0: 7260.6. Samples: 1568712. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:06:07,600][1047911] Avg episode reward: [(0, '211.227')]
-[2023-07-08 19:06:07,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003096_1585152.pth...
-[2023-07-08 19:06:07,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002680_1372160.pth
-[2023-07-08 19:06:09,113][1048168] Updated weights for policy 0, policy_version 3120 (0.0005)
-[2023-07-08 19:06:12,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 6902.2). Total num frames: 1622016. Throughput: 0: 7291.7. Samples: 1610996. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:06:12,600][1047911] Avg episode reward: [(0, '209.341')]
-[2023-07-08 19:06:14,643][1048168] Updated weights for policy 0, policy_version 3200 (0.0005)
-[2023-07-08 19:06:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 6912.0). Total num frames: 1658880. Throughput: 0: 7224.6. Samples: 1654756. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:06:17,600][1047911] Avg episode reward: [(0, '210.687')]
-[2023-07-08 19:06:20,268][1048168] Updated weights for policy 0, policy_version 3280 (0.0005)
-[2023-07-08 19:06:22,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 6921.4). Total num frames: 1695744. Throughput: 0: 7198.0. Samples: 1675584. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:06:22,599][1047911] Avg episode reward: [(0, '207.986')]
-[2023-07-08 19:06:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003312_1695744.pth...
-[2023-07-08 19:06:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002896_1482752.pth
-[2023-07-08 19:06:25,823][1048168] Updated weights for policy 0, policy_version 3360 (0.0005)
-[2023-07-08 19:06:27,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 6930.4). Total num frames: 1732608. Throughput: 0: 7192.6. Samples: 1720392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:06:27,600][1047911] Avg episode reward: [(0, '205.317')]
-[2023-07-08 19:06:31,751][1048168] Updated weights for policy 0, policy_version 3440 (0.0005)
-[2023-07-08 19:06:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 6923.0). Total num frames: 1765376. Throughput: 0: 7177.2. Samples: 1762076. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:06:32,599][1047911] Avg episode reward: [(0, '211.363')]
-[2023-07-08 19:06:37,386][1048168] Updated weights for policy 0, policy_version 3520 (0.0005)
-[2023-07-08 19:06:37,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6931.7). Total num frames: 1802240. Throughput: 0: 7123.2. Samples: 1782616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:06:37,600][1047911] Avg episode reward: [(0, '208.100')]
-[2023-07-08 19:06:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003520_1802240.pth...
-[2023-07-08 19:06:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003096_1585152.pth
-[2023-07-08 19:06:42,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 6940.0). Total num frames: 1839104. Throughput: 0: 7152.7. Samples: 1826776. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:06:42,600][1047911] Avg episode reward: [(0, '208.227')]
-[2023-07-08 19:06:42,950][1048168] Updated weights for policy 0, policy_version 3600 (0.0005)
-[2023-07-08 19:06:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6932.9). Total num frames: 1871872. Throughput: 0: 7149.3. Samples: 1869624. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:06:47,599][1047911] Avg episode reward: [(0, '213.548')]
-[2023-07-08 19:06:47,600][1048155] Saving new best policy, reward=213.548!
-[2023-07-08 19:06:48,852][1048168] Updated weights for policy 0, policy_version 3680 (0.0005)
-[2023-07-08 19:06:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6940.9). Total num frames: 1908736. Throughput: 0: 7183.2. Samples: 1891956. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:06:52,599][1047911] Avg episode reward: [(0, '211.157')]
-[2023-07-08 19:06:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003728_1908736.pth...
-[2023-07-08 19:06:52,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003312_1695744.pth
-[2023-07-08 19:06:54,526][1048168] Updated weights for policy 0, policy_version 3760 (0.0006)
-[2023-07-08 19:06:57,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 6948.6). Total num frames: 1945600. Throughput: 0: 7213.9. Samples: 1935620. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:06:57,679][1047911] Avg episode reward: [(0, '210.532')]
-[2023-07-08 19:07:00,049][1048168] Updated weights for policy 0, policy_version 3840 (0.0006)
-[2023-07-08 19:07:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 6956.0). Total num frames: 1982464. Throughput: 0: 7198.3. Samples: 1978680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:07:02,600][1047911] Avg episode reward: [(0, '213.632')]
-[2023-07-08 19:07:02,600][1048155] Saving new best policy, reward=213.632!
-[2023-07-08 19:07:05,851][1048168] Updated weights for policy 0, policy_version 3920 (0.0005)
-[2023-07-08 19:07:07,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 6949.1). Total num frames: 2015232. Throughput: 0: 7226.9. Samples: 2000792. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:07:07,599][1047911] Avg episode reward: [(0, '210.014')]
-[2023-07-08 19:07:07,630][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003944_2019328.pth...
-[2023-07-08 19:07:07,632][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003520_1802240.pth
-[2023-07-08 19:07:11,597][1048168] Updated weights for policy 0, policy_version 4000 (0.0005)
-[2023-07-08 19:07:12,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 6956.3). Total num frames: 2052096. Throughput: 0: 7138.2. Samples: 2041612. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:07:12,600][1047911] Avg episode reward: [(0, '205.658')]
-[2023-07-08 19:07:17,256][1048168] Updated weights for policy 0, policy_version 4080 (0.0005)
-[2023-07-08 19:07:17,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7081.2). Total num frames: 2088960. Throughput: 0: 7217.1. Samples: 2086848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:07:17,600][1047911] Avg episode reward: [(0, '214.655')]
-[2023-07-08 19:07:17,600][1048155] Saving new best policy, reward=214.655!
-[2023-07-08 19:07:22,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7206.2). Total num frames: 2125824. Throughput: 0: 7196.5. Samples: 2106460. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:07:22,600][1047911] Avg episode reward: [(0, '212.858')]
-[2023-07-08 19:07:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004152_2125824.pth...
-[2023-07-08 19:07:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003728_1908736.pth
-[2023-07-08 19:07:23,102][1048168] Updated weights for policy 0, policy_version 4160 (0.0005)
-[2023-07-08 19:07:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7247.8). Total num frames: 2158592. Throughput: 0: 7190.4. Samples: 2150344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:07:27,599][1047911] Avg episode reward: [(0, '212.611')]
-[2023-07-08 19:07:28,816][1048168] Updated weights for policy 0, policy_version 4240 (0.0005)
-[2023-07-08 19:07:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 2195456. Throughput: 0: 7205.9. Samples: 2193888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:07:32,600][1047911] Avg episode reward: [(0, '207.222')]
-[2023-07-08 19:07:34,525][1048168] Updated weights for policy 0, policy_version 4320 (0.0005)
-[2023-07-08 19:07:37,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 2232320. Throughput: 0: 7170.4. Samples: 2214624. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:07:37,600][1047911] Avg episode reward: [(0, '210.234')]
-[2023-07-08 19:07:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004360_2232320.pth...
-[2023-07-08 19:07:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003944_2019328.pth
-[2023-07-08 19:07:40,058][1048168] Updated weights for policy 0, policy_version 4400 (0.0005)
-[2023-07-08 19:07:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7234.0). Total num frames: 2269184. Throughput: 0: 7179.3. Samples: 2258688. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:07:42,599][1047911] Avg episode reward: [(0, '213.224')]
-[2023-07-08 19:07:45,418][1048168] Updated weights for policy 0, policy_version 4480 (0.0006)
-[2023-07-08 19:07:47,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7234.0). Total num frames: 2306048. Throughput: 0: 7239.1. Samples: 2304440. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:07:47,599][1047911] Avg episode reward: [(0, '212.757')]
-[2023-07-08 19:07:51,149][1048168] Updated weights for policy 0, policy_version 4560 (0.0005)
-[2023-07-08 19:07:52,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7234.0). Total num frames: 2342912. Throughput: 0: 7236.0. Samples: 2326412. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:07:52,599][1047911] Avg episode reward: [(0, '213.560')]
-[2023-07-08 19:07:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004576_2342912.pth...
-[2023-07-08 19:07:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004152_2125824.pth
-[2023-07-08 19:07:56,618][1048168] Updated weights for policy 0, policy_version 4640 (0.0005)
-[2023-07-08 19:07:57,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7220.1). Total num frames: 2379776. Throughput: 0: 7295.8. Samples: 2369924. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:07:57,600][1047911] Avg episode reward: [(0, '215.992')]
-[2023-07-08 19:07:57,601][1048155] Saving new best policy, reward=215.992!
-[2023-07-08 19:08:02,280][1048168] Updated weights for policy 0, policy_version 4720 (0.0005)
-[2023-07-08 19:08:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.2, 300 sec: 7220.1). Total num frames: 2416640. Throughput: 0: 7266.3. Samples: 2413832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:02,600][1047911] Avg episode reward: [(0, '215.263')]
-[2023-07-08 19:08:07,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7220.1). Total num frames: 2453504. Throughput: 0: 7282.4. Samples: 2434168. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:07,599][1047911] Avg episode reward: [(0, '217.276')]
-[2023-07-08 19:08:07,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004792_2453504.pth...
-[2023-07-08 19:08:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004360_2232320.pth
-[2023-07-08 19:08:07,606][1048155] Saving new best policy, reward=217.276!
-[2023-07-08 19:08:08,075][1048168] Updated weights for policy 0, policy_version 4800 (0.0005)
-[2023-07-08 19:08:12,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7206.2). Total num frames: 2486272. Throughput: 0: 7260.4. Samples: 2477064. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:12,600][1047911] Avg episode reward: [(0, '216.792')]
-[2023-07-08 19:08:13,999][1048168] Updated weights for policy 0, policy_version 4880 (0.0005)
-[2023-07-08 19:08:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7206.2). Total num frames: 2523136. Throughput: 0: 7222.4. Samples: 2518896. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:08:17,600][1047911] Avg episode reward: [(0, '216.469')]
-[2023-07-08 19:08:19,836][1048168] Updated weights for policy 0, policy_version 4960 (0.0005)
-[2023-07-08 19:08:22,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7206.2). Total num frames: 2560000. Throughput: 0: 7221.3. Samples: 2539584. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:08:22,600][1047911] Avg episode reward: [(0, '217.508')]
-[2023-07-08 19:08:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005000_2560000.pth...
-[2023-07-08 19:08:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004576_2342912.pth
-[2023-07-08 19:08:22,605][1048155] Saving new best policy, reward=217.508!
-[2023-07-08 19:08:25,439][1048168] Updated weights for policy 0, policy_version 5040 (0.0005)
-[2023-07-08 19:08:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7192.3). Total num frames: 2592768. Throughput: 0: 7231.1. Samples: 2584088. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:08:27,599][1047911] Avg episode reward: [(0, '215.426')]
-[2023-07-08 19:08:31,225][1048168] Updated weights for policy 0, policy_version 5120 (0.0005)
-[2023-07-08 19:08:32,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7192.3). Total num frames: 2629632. Throughput: 0: 7137.1. Samples: 2625608. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:08:32,600][1047911] Avg episode reward: [(0, '219.298')]
-[2023-07-08 19:08:32,600][1048155] Saving new best policy, reward=219.298!
-[2023-07-08 19:08:36,546][1048168] Updated weights for policy 0, policy_version 5200 (0.0005)
-[2023-07-08 19:08:37,599][1047911] Fps is (10 sec: 7782.3, 60 sec: 7304.5, 300 sec: 7206.2). Total num frames: 2670592. Throughput: 0: 7177.8. Samples: 2649412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:37,600][1047911] Avg episode reward: [(0, '217.814')]
-[2023-07-08 19:08:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005216_2670592.pth...
-[2023-07-08 19:08:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004792_2453504.pth
-[2023-07-08 19:08:42,068][1048168] Updated weights for policy 0, policy_version 5280 (0.0005)
-[2023-07-08 19:08:42,599][1047911] Fps is (10 sec: 7782.3, 60 sec: 7304.5, 300 sec: 7206.2). Total num frames: 2707456. Throughput: 0: 7226.2. Samples: 2695104. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:42,600][1047911] Avg episode reward: [(0, '218.920')]
-[2023-07-08 19:08:47,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7206.2). Total num frames: 2740224. Throughput: 0: 7233.0. Samples: 2739316. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:08:47,599][1047911] Avg episode reward: [(0, '214.880')]
-[2023-07-08 19:08:47,681][1048168] Updated weights for policy 0, policy_version 5360 (0.0005)
-[2023-07-08 19:08:52,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7220.1). Total num frames: 2781184. Throughput: 0: 7268.8. Samples: 2761264. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:52,600][1047911] Avg episode reward: [(0, '215.906')]
-[2023-07-08 19:08:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005432_2781184.pth...
-[2023-07-08 19:08:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005000_2560000.pth
-[2023-07-08 19:08:52,890][1048168] Updated weights for policy 0, policy_version 5440 (0.0006)
-[2023-07-08 19:08:57,599][1047911] Fps is (10 sec: 8192.0, 60 sec: 7372.8, 300 sec: 7234.0). Total num frames: 2822144. Throughput: 0: 7439.6. Samples: 2811844. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:08:57,600][1047911] Avg episode reward: [(0, '218.486')]
-[2023-07-08 19:08:57,770][1048168] Updated weights for policy 0, policy_version 5520 (0.0005)
-[2023-07-08 19:09:02,599][1047911] Fps is (10 sec: 8191.9, 60 sec: 7441.1, 300 sec: 7247.8). Total num frames: 2863104. Throughput: 0: 7515.3. Samples: 2857084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:02,600][1047911] Avg episode reward: [(0, '219.098')]
-[2023-07-08 19:09:03,062][1048168] Updated weights for policy 0, policy_version 5600 (0.0005)
-[2023-07-08 19:09:07,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7441.1, 300 sec: 7247.8). Total num frames: 2899968. Throughput: 0: 7609.0. Samples: 2881988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:07,600][1047911] Avg episode reward: [(0, '218.875')]
-[2023-07-08 19:09:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005664_2899968.pth...
-[2023-07-08 19:09:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005216_2670592.pth
-[2023-07-08 19:09:08,656][1048168] Updated weights for policy 0, policy_version 5680 (0.0005)
-[2023-07-08 19:09:12,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7509.3, 300 sec: 7247.8). Total num frames: 2936832. Throughput: 0: 7563.4. Samples: 2924440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:12,600][1047911] Avg episode reward: [(0, '220.990')]
-[2023-07-08 19:09:12,600][1048155] Saving new best policy, reward=220.990!
-[2023-07-08 19:09:14,083][1048168] Updated weights for policy 0, policy_version 5760 (0.0005)
-[2023-07-08 19:09:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7261.7). Total num frames: 2973696. Throughput: 0: 7640.0. Samples: 2969408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:17,600][1047911] Avg episode reward: [(0, '220.701')]
-[2023-07-08 19:09:19,862][1048168] Updated weights for policy 0, policy_version 5840 (0.0005)
-[2023-07-08 19:09:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7441.1, 300 sec: 7247.8). Total num frames: 3006464. Throughput: 0: 7570.6. Samples: 2990088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:22,599][1047911] Avg episode reward: [(0, '220.256')]
-[2023-07-08 19:09:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005872_3006464.pth...
-[2023-07-08 19:09:22,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005432_2781184.pth
-[2023-07-08 19:09:25,656][1048168] Updated weights for policy 0, policy_version 5920 (0.0005)
-[2023-07-08 19:09:27,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7509.3, 300 sec: 7261.7). Total num frames: 3043328. Throughput: 0: 7495.9. Samples: 3032416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:27,599][1047911] Avg episode reward: [(0, '219.979')]
-[2023-07-08 19:09:31,538][1048168] Updated weights for policy 0, policy_version 6000 (0.0005)
-[2023-07-08 19:09:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7441.1, 300 sec: 7247.8). Total num frames: 3076096. Throughput: 0: 7450.0. Samples: 3074564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:32,599][1047911] Avg episode reward: [(0, '219.030')]
-[2023-07-08 19:09:37,290][1048168] Updated weights for policy 0, policy_version 6080 (0.0005)
-[2023-07-08 19:09:37,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7372.8, 300 sec: 7247.8). Total num frames: 3112960. Throughput: 0: 7422.1. Samples: 3095260. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:37,600][1047911] Avg episode reward: [(0, '218.308')]
-[2023-07-08 19:09:37,604][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006080_3112960.pth...
-[2023-07-08 19:09:37,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005664_2899968.pth
-[2023-07-08 19:09:42,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7261.7). Total num frames: 3149824. Throughput: 0: 7293.5. Samples: 3140052. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:42,600][1047911] Avg episode reward: [(0, '219.654')]
-[2023-07-08 19:09:42,913][1048168] Updated weights for policy 0, policy_version 6160 (0.0005)
-[2023-07-08 19:09:47,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7509.3, 300 sec: 7275.6). Total num frames: 3190784. Throughput: 0: 7324.3. Samples: 3186676. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:09:47,600][1047911] Avg episode reward: [(0, '220.896')]
-[2023-07-08 19:09:47,925][1048168] Updated weights for policy 0, policy_version 6240 (0.0005)
-[2023-07-08 19:09:52,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7441.1, 300 sec: 7275.6). Total num frames: 3227648. Throughput: 0: 7314.2. Samples: 3211128. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:09:52,600][1047911] Avg episode reward: [(0, '219.937')]
-[2023-07-08 19:09:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006304_3227648.pth...
-[2023-07-08 19:09:52,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005872_3006464.pth
-[2023-07-08 19:09:53,332][1048168] Updated weights for policy 0, policy_version 6320 (0.0005)
-[2023-07-08 19:09:57,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7372.8, 300 sec: 7275.6). Total num frames: 3264512. Throughput: 0: 7340.9. Samples: 3254780. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:09:57,599][1047911] Avg episode reward: [(0, '218.965')]
-[2023-07-08 19:09:59,142][1048168] Updated weights for policy 0, policy_version 6400 (0.0004)
-[2023-07-08 19:10:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 3301376. Throughput: 0: 7262.8. Samples: 3296232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:02,600][1047911] Avg episode reward: [(0, '220.365')]
-[2023-07-08 19:10:04,682][1048168] Updated weights for policy 0, policy_version 6480 (0.0005)
-[2023-07-08 19:10:07,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 3334144. Throughput: 0: 7307.8. Samples: 3318940. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:07,599][1047911] Avg episode reward: [(0, '219.453')]
-[2023-07-08 19:10:07,634][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006520_3338240.pth...
-[2023-07-08 19:10:07,636][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006080_3112960.pth
-[2023-07-08 19:10:10,685][1048168] Updated weights for policy 0, policy_version 6560 (0.0005)
-[2023-07-08 19:10:12,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 3371008. Throughput: 0: 7281.2. Samples: 3360072. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:12,600][1047911] Avg episode reward: [(0, '221.545')]
-[2023-07-08 19:10:12,600][1048155] Saving new best policy, reward=221.545!
-[2023-07-08 19:10:16,955][1048168] Updated weights for policy 0, policy_version 6640 (0.0005)
-[2023-07-08 19:10:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7275.6). Total num frames: 3403776. Throughput: 0: 7222.0. Samples: 3399556. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:17,600][1047911] Avg episode reward: [(0, '223.629')]
-[2023-07-08 19:10:17,600][1048155] Saving new best policy, reward=223.629!
-[2023-07-08 19:10:22,582][1048168] Updated weights for policy 0, policy_version 6720 (0.0005)
-[2023-07-08 19:10:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 3440640. Throughput: 0: 7237.5. Samples: 3420948. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:22,600][1047911] Avg episode reward: [(0, '223.525')]
-[2023-07-08 19:10:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006720_3440640.pth...
-[2023-07-08 19:10:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006304_3227648.pth
-[2023-07-08 19:10:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7261.7). Total num frames: 3473408. Throughput: 0: 7179.6. Samples: 3463132. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:10:27,599][1047911] Avg episode reward: [(0, '223.575')]
-[2023-07-08 19:10:28,201][1048168] Updated weights for policy 0, policy_version 6800 (0.0006)
-[2023-07-08 19:10:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 3510272. Throughput: 0: 7144.9. Samples: 3508196. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:32,600][1047911] Avg episode reward: [(0, '221.309')]
-[2023-07-08 19:10:33,769][1048168] Updated weights for policy 0, policy_version 6880 (0.0005)
-[2023-07-08 19:10:37,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7304.6, 300 sec: 7261.7). Total num frames: 3551232. Throughput: 0: 7120.9. Samples: 3531568. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:37,599][1047911] Avg episode reward: [(0, '221.827')]
-[2023-07-08 19:10:37,601][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006936_3551232.pth...
-[2023-07-08 19:10:37,603][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006520_3338240.pth
-[2023-07-08 19:10:38,834][1048168] Updated weights for policy 0, policy_version 6960 (0.0005)
-[2023-07-08 19:10:42,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 3588096. Throughput: 0: 7184.2. Samples: 3578068. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:42,599][1047911] Avg episode reward: [(0, '222.617')]
-[2023-07-08 19:10:44,359][1048168] Updated weights for policy 0, policy_version 7040 (0.0005)
-[2023-07-08 19:10:47,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 3624960. Throughput: 0: 7221.0. Samples: 3621176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:47,600][1047911] Avg episode reward: [(0, '220.314')]
-[2023-07-08 19:10:50,353][1048168] Updated weights for policy 0, policy_version 7120 (0.0005)
-[2023-07-08 19:10:52,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 3661824. Throughput: 0: 7165.9. Samples: 3641408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:10:52,600][1047911] Avg episode reward: [(0, '223.645')]
-[2023-07-08 19:10:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007152_3661824.pth...
-[2023-07-08 19:10:52,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006720_3440640.pth
-[2023-07-08 19:10:52,606][1048155] Saving new best policy, reward=223.645!
-[2023-07-08 19:10:55,957][1048168] Updated weights for policy 0, policy_version 7200 (0.0005)
-[2023-07-08 19:10:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7275.6). Total num frames: 3694592. Throughput: 0: 7238.9. Samples: 3685824. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:10:57,599][1047911] Avg episode reward: [(0, '223.703')]
-[2023-07-08 19:10:57,600][1048155] Saving new best policy, reward=223.703!
-[2023-07-08 19:11:01,629][1048168] Updated weights for policy 0, policy_version 7280 (0.0004)
-[2023-07-08 19:11:02,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 7275.6). Total num frames: 3731456. Throughput: 0: 7324.1. Samples: 3729140. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:11:02,599][1047911] Avg episode reward: [(0, '223.343')]
-[2023-07-08 19:11:07,273][1048168] Updated weights for policy 0, policy_version 7360 (0.0006)
-[2023-07-08 19:11:07,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 3768320. Throughput: 0: 7328.2. Samples: 3750716. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:07,600][1047911] Avg episode reward: [(0, '223.123')]
-[2023-07-08 19:11:07,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007360_3768320.pth...
-[2023-07-08 19:11:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006936_3551232.pth
-[2023-07-08 19:11:12,183][1048168] Updated weights for policy 0, policy_version 7440 (0.0005)
-[2023-07-08 19:11:12,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7289.5). Total num frames: 3809280. Throughput: 0: 7481.7. Samples: 3799808. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:11:12,600][1047911] Avg episode reward: [(0, '221.852')]
-[2023-07-08 19:11:17,599][1047911] Fps is (10 sec: 7782.5, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 3846144. Throughput: 0: 7437.3. Samples: 3842872. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:17,599][1047911] Avg episode reward: [(0, '222.868')]
-[2023-07-08 19:11:17,665][1048168] Updated weights for policy 0, policy_version 7520 (0.0005)
-[2023-07-08 19:11:22,560][1048168] Updated weights for policy 0, policy_version 7600 (0.0005)
-[2023-07-08 19:11:22,599][1047911] Fps is (10 sec: 8192.0, 60 sec: 7509.3, 300 sec: 7317.3). Total num frames: 3891200. Throughput: 0: 7498.0. Samples: 3868980. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:22,600][1047911] Avg episode reward: [(0, '221.118')]
-[2023-07-08 19:11:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007600_3891200.pth...
-[2023-07-08 19:11:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007152_3661824.pth
-[2023-07-08 19:11:27,599][1047911] Fps is (10 sec: 8191.9, 60 sec: 7577.6, 300 sec: 7331.1). Total num frames: 3928064. Throughput: 0: 7508.3. Samples: 3915944. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:11:27,600][1047911] Avg episode reward: [(0, '223.642')]
-[2023-07-08 19:11:27,944][1048168] Updated weights for policy 0, policy_version 7680 (0.0005)
-[2023-07-08 19:11:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7509.3, 300 sec: 7317.3). Total num frames: 3960832. Throughput: 0: 7532.5. Samples: 3960140. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:32,600][1047911] Avg episode reward: [(0, '224.770')]
-[2023-07-08 19:11:32,602][1048155] Saving new best policy, reward=224.770!
-[2023-07-08 19:11:33,776][1048168] Updated weights for policy 0, policy_version 7760 (0.0005)
-[2023-07-08 19:11:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7331.1). Total num frames: 4001792. Throughput: 0: 7552.6. Samples: 3981276. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:37,599][1047911] Avg episode reward: [(0, '223.311')]
-[2023-07-08 19:11:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007816_4001792.pth...
-[2023-07-08 19:11:37,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007360_3768320.pth
-[2023-07-08 19:11:39,411][1048168] Updated weights for policy 0, policy_version 7840 (0.0005)
-[2023-07-08 19:11:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 4034560. Throughput: 0: 7567.5. Samples: 4026360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:42,600][1047911] Avg episode reward: [(0, '225.597')]
-[2023-07-08 19:11:42,600][1048155] Saving new best policy, reward=225.597!
-[2023-07-08 19:11:45,156][1048168] Updated weights for policy 0, policy_version 7920 (0.0005)
-[2023-07-08 19:11:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 4071424. Throughput: 0: 7514.5. Samples: 4067292. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:47,600][1047911] Avg episode reward: [(0, '223.021')]
-[2023-07-08 19:11:50,755][1048168] Updated weights for policy 0, policy_version 8000 (0.0004)
-[2023-07-08 19:11:52,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7331.1). Total num frames: 4108288. Throughput: 0: 7515.0. Samples: 4088892. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:52,600][1047911] Avg episode reward: [(0, '223.014')]
-[2023-07-08 19:11:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008024_4108288.pth...
-[2023-07-08 19:11:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007600_3891200.pth
-[2023-07-08 19:11:56,227][1048168] Updated weights for policy 0, policy_version 8080 (0.0005)
-[2023-07-08 19:11:57,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7331.1). Total num frames: 4145152. Throughput: 0: 7424.4. Samples: 4133908. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:11:57,600][1047911] Avg episode reward: [(0, '224.953')]
-[2023-07-08 19:12:01,695][1048168] Updated weights for policy 0, policy_version 8160 (0.0005)
-[2023-07-08 19:12:02,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7509.3, 300 sec: 7345.0). Total num frames: 4182016. Throughput: 0: 7477.6. Samples: 4179364. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:12:02,599][1047911] Avg episode reward: [(0, '222.546')]
-[2023-07-08 19:12:07,117][1048168] Updated weights for policy 0, policy_version 8240 (0.0006)
-[2023-07-08 19:12:07,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7509.3, 300 sec: 7345.0). Total num frames: 4218880. Throughput: 0: 7423.5. Samples: 4203036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:12:07,599][1047911] Avg episode reward: [(0, '225.112')]
-[2023-07-08 19:12:07,601][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008240_4218880.pth...
-[2023-07-08 19:12:07,603][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007816_4001792.pth
-[2023-07-08 19:12:12,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7441.1, 300 sec: 7345.0). Total num frames: 4255744. Throughput: 0: 7351.1. Samples: 4246744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:12:12,600][1047911] Avg episode reward: [(0, '225.022')]
-[2023-07-08 19:12:12,803][1048168] Updated weights for policy 0, policy_version 8320 (0.0005)
-[2023-07-08 19:12:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7441.1, 300 sec: 7345.0). Total num frames: 4292608. Throughput: 0: 7294.9. Samples: 4288408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:12:17,599][1047911] Avg episode reward: [(0, '228.354')]
-[2023-07-08 19:12:17,600][1048155] Saving new best policy, reward=228.354!
-[2023-07-08 19:12:18,640][1048168] Updated weights for policy 0, policy_version 8400 (0.0005)
-[2023-07-08 19:12:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7345.0). Total num frames: 4325376. Throughput: 0: 7294.1. Samples: 4309508. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:12:22,599][1047911] Avg episode reward: [(0, '226.655')]
-[2023-07-08 19:12:22,601][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008448_4325376.pth...
-[2023-07-08 19:12:22,603][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008024_4108288.pth
-[2023-07-08 19:12:24,444][1048168] Updated weights for policy 0, policy_version 8480 (0.0005)
-[2023-07-08 19:12:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7345.0). Total num frames: 4362240. Throughput: 0: 7240.5. Samples: 4352180. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:12:27,599][1047911] Avg episode reward: [(0, '224.173')]
-[2023-07-08 19:12:30,161][1048168] Updated weights for policy 0, policy_version 8560 (0.0005)
-[2023-07-08 19:12:32,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7345.0). Total num frames: 4399104. Throughput: 0: 7282.9. Samples: 4395024. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:12:32,600][1047911] Avg episode reward: [(0, '226.675')]
-[2023-07-08 19:12:35,356][1048168] Updated weights for policy 0, policy_version 8640 (0.0005)
-[2023-07-08 19:12:37,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7345.0). Total num frames: 4435968. Throughput: 0: 7359.6. Samples: 4420072. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:12:37,600][1047911] Avg episode reward: [(0, '224.816')]
-[2023-07-08 19:12:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008664_4435968.pth...
-[2023-07-08 19:12:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008240_4218880.pth
-[2023-07-08 19:12:41,528][1048168] Updated weights for policy 0, policy_version 8720 (0.0005)
-[2023-07-08 19:12:42,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 4468736. Throughput: 0: 7258.1. Samples: 4460520. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:12:42,599][1047911] Avg episode reward: [(0, '226.862')]
-[2023-07-08 19:12:47,417][1048168] Updated weights for policy 0, policy_version 8800 (0.0005)
-[2023-07-08 19:12:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 4505600. Throughput: 0: 7157.3. Samples: 4501444. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:12:47,599][1047911] Avg episode reward: [(0, '226.095')]
-[2023-07-08 19:12:52,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 4542464. Throughput: 0: 7104.2. Samples: 4522724. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:12:52,600][1047911] Avg episode reward: [(0, '226.529')]
-[2023-07-08 19:12:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008872_4542464.pth...
-[2023-07-08 19:12:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008448_4325376.pth
-[2023-07-08 19:12:53,025][1048168] Updated weights for policy 0, policy_version 8880 (0.0005)
-[2023-07-08 19:12:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7317.3). Total num frames: 4575232. Throughput: 0: 7116.9. Samples: 4567004. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:12:57,599][1047911] Avg episode reward: [(0, '225.861')]
-[2023-07-08 19:12:58,798][1048168] Updated weights for policy 0, policy_version 8960 (0.0005)
-[2023-07-08 19:13:02,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 7317.3). Total num frames: 4612096. Throughput: 0: 7165.1. Samples: 4610836. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:13:02,599][1047911] Avg episode reward: [(0, '224.824')]
-[2023-07-08 19:13:04,478][1048168] Updated weights for policy 0, policy_version 9040 (0.0005)
-[2023-07-08 19:13:07,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7331.1). Total num frames: 4648960. Throughput: 0: 7162.3. Samples: 4631812. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:13:07,600][1047911] Avg episode reward: [(0, '225.402')]
-[2023-07-08 19:13:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009080_4648960.pth...
-[2023-07-08 19:13:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008664_4435968.pth
-[2023-07-08 19:13:10,268][1048168] Updated weights for policy 0, policy_version 9120 (0.0005)
-[2023-07-08 19:13:12,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7331.1). Total num frames: 4685824. Throughput: 0: 7141.5. Samples: 4673548. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:12,600][1047911] Avg episode reward: [(0, '224.214')]
-[2023-07-08 19:13:15,716][1048168] Updated weights for policy 0, policy_version 9200 (0.0005)
-[2023-07-08 19:13:17,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7099.7, 300 sec: 7317.3). Total num frames: 4718592. Throughput: 0: 7184.8. Samples: 4718340. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:17,599][1047911] Avg episode reward: [(0, '227.275')]
-[2023-07-08 19:13:21,712][1048168] Updated weights for policy 0, policy_version 9280 (0.0005)
-[2023-07-08 19:13:22,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 7331.1). Total num frames: 4755456. Throughput: 0: 7088.2. Samples: 4739040. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:13:22,599][1047911] Avg episode reward: [(0, '227.826')]
-[2023-07-08 19:13:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009288_4755456.pth...
-[2023-07-08 19:13:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008872_4542464.pth
-[2023-07-08 19:13:27,030][1048168] Updated weights for policy 0, policy_version 9360 (0.0006)
-[2023-07-08 19:13:27,599][1047911] Fps is (10 sec: 7782.3, 60 sec: 7236.2, 300 sec: 7345.0). Total num frames: 4796416. Throughput: 0: 7169.1. Samples: 4783128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:27,600][1047911] Avg episode reward: [(0, '227.377')]
-[2023-07-08 19:13:32,558][1048168] Updated weights for policy 0, policy_version 9440 (0.0006)
-[2023-07-08 19:13:32,599][1047911] Fps is (10 sec: 7782.3, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 4833280. Throughput: 0: 7282.8. Samples: 4829172. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:32,600][1047911] Avg episode reward: [(0, '225.648')]
-[2023-07-08 19:13:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 4870144. Throughput: 0: 7266.9. Samples: 4849736. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:37,600][1047911] Avg episode reward: [(0, '227.157')]
-[2023-07-08 19:13:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009512_4870144.pth...
-[2023-07-08 19:13:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009080_4648960.pth
-[2023-07-08 19:13:38,232][1048168] Updated weights for policy 0, policy_version 9520 (0.0006)
-[2023-07-08 19:13:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7345.0). Total num frames: 4907008. Throughput: 0: 7282.0. Samples: 4894696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:42,600][1047911] Avg episode reward: [(0, '227.373')]
-[2023-07-08 19:13:43,731][1048168] Updated weights for policy 0, policy_version 9600 (0.0005)
-[2023-07-08 19:13:47,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7331.1). Total num frames: 4943872. Throughput: 0: 7308.2. Samples: 4939704. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:47,600][1047911] Avg episode reward: [(0, '228.341')]
-[2023-07-08 19:13:49,242][1048168] Updated weights for policy 0, policy_version 9680 (0.0005)
-[2023-07-08 19:13:52,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 4980736. Throughput: 0: 7300.4. Samples: 4960328. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:13:52,599][1047911] Avg episode reward: [(0, '226.291')]
-[2023-07-08 19:13:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009728_4980736.pth...
-[2023-07-08 19:13:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009288_4755456.pth
-[2023-07-08 19:13:54,574][1048168] Updated weights for policy 0, policy_version 9760 (0.0005)
-[2023-07-08 19:13:57,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7372.8, 300 sec: 7303.4). Total num frames: 5017600. Throughput: 0: 7396.1. Samples: 5006372. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:13:57,600][1047911] Avg episode reward: [(0, '226.300')]
-[2023-07-08 19:13:59,966][1048168] Updated weights for policy 0, policy_version 9840 (0.0004)
-[2023-07-08 19:14:02,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7303.4). Total num frames: 5054464. Throughput: 0: 7385.3. Samples: 5050680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:02,600][1047911] Avg episode reward: [(0, '227.336')]
-[2023-07-08 19:14:05,633][1048168] Updated weights for policy 0, policy_version 9920 (0.0005)
-[2023-07-08 19:14:07,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7303.4). Total num frames: 5091328. Throughput: 0: 7418.8. Samples: 5072888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:07,600][1047911] Avg episode reward: [(0, '227.871')]
-[2023-07-08 19:14:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009944_5091328.pth...
-[2023-07-08 19:14:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009512_4870144.pth
-[2023-07-08 19:14:11,306][1048168] Updated weights for policy 0, policy_version 10000 (0.0005)
-[2023-07-08 19:14:12,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7372.8, 300 sec: 7303.4). Total num frames: 5128192. Throughput: 0: 7408.4. Samples: 5116504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:12,599][1047911] Avg episode reward: [(0, '231.628')]
-[2023-07-08 19:14:12,600][1048155] Saving new best policy, reward=231.628!
-[2023-07-08 19:14:17,003][1048168] Updated weights for policy 0, policy_version 10080 (0.0005)
-[2023-07-08 19:14:17,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7441.1, 300 sec: 7317.3). Total num frames: 5165056. Throughput: 0: 7365.5. Samples: 5160620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:17,599][1047911] Avg episode reward: [(0, '229.297')]
-[2023-07-08 19:14:22,522][1048168] Updated weights for policy 0, policy_version 10160 (0.0005)
-[2023-07-08 19:14:22,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7441.1, 300 sec: 7317.3). Total num frames: 5201920. Throughput: 0: 7385.5. Samples: 5182084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:22,600][1047911] Avg episode reward: [(0, '229.253')]
-[2023-07-08 19:14:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010160_5201920.pth...
-[2023-07-08 19:14:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009728_4980736.pth
-[2023-07-08 19:14:27,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7331.1). Total num frames: 5238784. Throughput: 0: 7373.3. Samples: 5226496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:27,600][1047911] Avg episode reward: [(0, '227.921')]
-[2023-07-08 19:14:28,201][1048168] Updated weights for policy 0, policy_version 10240 (0.0004)
-[2023-07-08 19:14:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 5271552. Throughput: 0: 7303.1. Samples: 5268344. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:14:32,600][1047911] Avg episode reward: [(0, '228.909')]
-[2023-07-08 19:14:33,766][1048168] Updated weights for policy 0, policy_version 10320 (0.0005)
-[2023-07-08 19:14:37,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 5308416. Throughput: 0: 7372.6. Samples: 5292096. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:14:37,599][1047911] Avg episode reward: [(0, '229.043')]
-[2023-07-08 19:14:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010368_5308416.pth...
-[2023-07-08 19:14:37,603][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009944_5091328.pth
-[2023-07-08 19:14:39,532][1048168] Updated weights for policy 0, policy_version 10400 (0.0005)
-[2023-07-08 19:14:42,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7303.4). Total num frames: 5345280. Throughput: 0: 7289.2. Samples: 5334384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:14:42,599][1047911] Avg episode reward: [(0, '228.995')]
-[2023-07-08 19:14:45,055][1048168] Updated weights for policy 0, policy_version 10480 (0.0005)
-[2023-07-08 19:14:47,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7303.4). Total num frames: 5382144. Throughput: 0: 7280.8. Samples: 5378316. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:14:47,600][1047911] Avg episode reward: [(0, '231.481')]
-[2023-07-08 19:14:50,746][1048168] Updated weights for policy 0, policy_version 10560 (0.0005)
-[2023-07-08 19:14:52,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7303.4). Total num frames: 5419008. Throughput: 0: 7265.7. Samples: 5399844. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:14:52,600][1047911] Avg episode reward: [(0, '228.059')]
-[2023-07-08 19:14:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010584_5419008.pth...
-[2023-07-08 19:14:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010160_5201920.pth
-[2023-07-08 19:14:56,298][1048168] Updated weights for policy 0, policy_version 10640 (0.0005)
-[2023-07-08 19:14:57,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7303.4). Total num frames: 5455872. Throughput: 0: 7293.3. Samples: 5444704. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:14:57,600][1047911] Avg episode reward: [(0, '230.938')]
-[2023-07-08 19:15:01,817][1048168] Updated weights for policy 0, policy_version 10720 (0.0005)
-[2023-07-08 19:15:02,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 5492736. Throughput: 0: 7290.9. Samples: 5488712. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:15:02,600][1047911] Avg episode reward: [(0, '231.332')]
-[2023-07-08 19:15:07,474][1048168] Updated weights for policy 0, policy_version 10800 (0.0005)
-[2023-07-08 19:15:07,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7317.3). Total num frames: 5529600. Throughput: 0: 7297.3. Samples: 5510464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:15:07,600][1047911] Avg episode reward: [(0, '234.201')]
-[2023-07-08 19:15:07,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010800_5529600.pth...
-[2023-07-08 19:15:07,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010368_5308416.pth
-[2023-07-08 19:15:07,606][1048155] Saving new best policy, reward=234.201!
-[2023-07-08 19:15:12,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7304.5, 300 sec: 7331.1). Total num frames: 5566464. Throughput: 0: 7286.6. Samples: 5554392. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:15:12,599][1047911] Avg episode reward: [(0, '231.101')]
-[2023-07-08 19:15:13,164][1048168] Updated weights for policy 0, policy_version 10880 (0.0005)
-[2023-07-08 19:15:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7317.3). Total num frames: 5599232. Throughput: 0: 7279.2. Samples: 5595908. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:15:17,600][1047911] Avg episode reward: [(0, '233.942')]
-[2023-07-08 19:15:18,915][1048168] Updated weights for policy 0, policy_version 10960 (0.0005)
-[2023-07-08 19:15:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 5636096. Throughput: 0: 7280.3. Samples: 5619708. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:15:22,600][1047911] Avg episode reward: [(0, '234.990')]
-[2023-07-08 19:15:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011008_5636096.pth...
-[2023-07-08 19:15:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010584_5419008.pth
-[2023-07-08 19:15:22,605][1048155] Saving new best policy, reward=234.990!
-[2023-07-08 19:15:24,592][1048168] Updated weights for policy 0, policy_version 11040 (0.0006)
-[2023-07-08 19:15:27,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7331.1). Total num frames: 5672960. Throughput: 0: 7257.6. Samples: 5660976. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:15:27,600][1047911] Avg episode reward: [(0, '236.683')]
-[2023-07-08 19:15:27,600][1048155] Saving new best policy, reward=236.683!
-[2023-07-08 19:15:30,419][1048168] Updated weights for policy 0, policy_version 11120 (0.0004)
-[2023-07-08 19:15:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7303.4). Total num frames: 5705728. Throughput: 0: 7237.1. Samples: 5703984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:15:32,599][1047911] Avg episode reward: [(0, '232.048')]
-[2023-07-08 19:15:35,919][1048168] Updated weights for policy 0, policy_version 11200 (0.0005)
-[2023-07-08 19:15:37,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7303.4). Total num frames: 5742592. Throughput: 0: 7252.7. Samples: 5726216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:15:37,599][1047911] Avg episode reward: [(0, '230.469')]
-[2023-07-08 19:15:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011224_5746688.pth...
-[2023-07-08 19:15:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010800_5529600.pth
-[2023-07-08 19:15:41,600][1048168] Updated weights for policy 0, policy_version 11280 (0.0005)
-[2023-07-08 19:15:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7303.4). Total num frames: 5779456. Throughput: 0: 7245.7. Samples: 5770760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:15:42,599][1047911] Avg episode reward: [(0, '233.905')]
-[2023-07-08 19:15:47,410][1048168] Updated weights for policy 0, policy_version 11360 (0.0005)
-[2023-07-08 19:15:47,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7236.3, 300 sec: 7303.4). Total num frames: 5816320. Throughput: 0: 7190.6. Samples: 5812288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:15:47,599][1047911] Avg episode reward: [(0, '232.857')]
-[2023-07-08 19:15:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7303.4). Total num frames: 5849088. Throughput: 0: 7173.7. Samples: 5833280. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:15:52,600][1047911] Avg episode reward: [(0, '235.307')]
-[2023-07-08 19:15:52,607][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011432_5853184.pth...
-[2023-07-08 19:15:52,609][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011008_5636096.pth
-[2023-07-08 19:15:53,115][1048168] Updated weights for policy 0, policy_version 11440 (0.0005)
-[2023-07-08 19:15:57,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7317.3). Total num frames: 5890048. Throughput: 0: 7229.2. Samples: 5879708. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:15:57,600][1047911] Avg episode reward: [(0, '234.512')]
-[2023-07-08 19:15:58,511][1048168] Updated weights for policy 0, policy_version 11520 (0.0006)
-[2023-07-08 19:16:02,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7236.3, 300 sec: 7317.3). Total num frames: 5926912. Throughput: 0: 7262.9. Samples: 5922740. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:16:02,600][1047911] Avg episode reward: [(0, '236.062')]
-[2023-07-08 19:16:04,306][1048168] Updated weights for policy 0, policy_version 11600 (0.0005)
-[2023-07-08 19:16:07,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 7289.5). Total num frames: 5959680. Throughput: 0: 7192.3. Samples: 5943360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:16:07,599][1047911] Avg episode reward: [(0, '234.904')]
-[2023-07-08 19:16:07,640][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011648_5963776.pth...
-[2023-07-08 19:16:07,642][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011224_5746688.pth
-[2023-07-08 19:16:09,817][1048168] Updated weights for policy 0, policy_version 11680 (0.0006)
-[2023-07-08 19:16:12,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7289.5). Total num frames: 5996544. Throughput: 0: 7275.2. Samples: 5988360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:16:12,600][1047911] Avg episode reward: [(0, '234.284')]
-[2023-07-08 19:16:15,503][1048168] Updated weights for policy 0, policy_version 11760 (0.0006)
-[2023-07-08 19:16:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6033408. Throughput: 0: 7264.5. Samples: 6030884. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:16:17,600][1047911] Avg episode reward: [(0, '234.349')]
-[2023-07-08 19:16:21,155][1048168] Updated weights for policy 0, policy_version 11840 (0.0005)
-[2023-07-08 19:16:22,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6070272. Throughput: 0: 7260.5. Samples: 6052940. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:16:22,600][1047911] Avg episode reward: [(0, '233.373')]
-[2023-07-08 19:16:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011856_6070272.pth...
-[2023-07-08 19:16:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011432_5853184.pth
-[2023-07-08 19:16:26,953][1048168] Updated weights for policy 0, policy_version 11920 (0.0005)
-[2023-07-08 19:16:27,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 6107136. Throughput: 0: 7218.2. Samples: 6095580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:16:27,600][1047911] Avg episode reward: [(0, '239.818')]
-[2023-07-08 19:16:27,600][1048155] Saving new best policy, reward=239.818!
-[2023-07-08 19:16:32,499][1048168] Updated weights for policy 0, policy_version 12000 (0.0005)
-[2023-07-08 19:16:32,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 6144000. Throughput: 0: 7280.3. Samples: 6139904. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:16:32,599][1047911] Avg episode reward: [(0, '236.068')]
-[2023-07-08 19:16:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 6180864. Throughput: 0: 7270.4. Samples: 6160448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:16:37,600][1047911] Avg episode reward: [(0, '239.139')]
-[2023-07-08 19:16:37,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012072_6180864.pth...
-[2023-07-08 19:16:37,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011648_5963776.pth
-[2023-07-08 19:16:38,060][1048168] Updated weights for policy 0, policy_version 12080 (0.0005)
-[2023-07-08 19:16:42,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6213632. Throughput: 0: 7223.8. Samples: 6204776. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:16:42,599][1047911] Avg episode reward: [(0, '240.036')]
-[2023-07-08 19:16:42,600][1048155] Saving new best policy, reward=240.036!
-[2023-07-08 19:16:43,946][1048168] Updated weights for policy 0, policy_version 12160 (0.0005)
-[2023-07-08 19:16:47,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6250496. Throughput: 0: 7217.5. Samples: 6247528. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:16:47,600][1047911] Avg episode reward: [(0, '237.161')]
-[2023-07-08 19:16:49,604][1048168] Updated weights for policy 0, policy_version 12240 (0.0005)
-[2023-07-08 19:16:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 6283264. Throughput: 0: 7231.8. Samples: 6268792. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:16:52,599][1047911] Avg episode reward: [(0, '239.120')]
-[2023-07-08 19:16:52,632][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012280_6287360.pth...
-[2023-07-08 19:16:52,634][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011856_6070272.pth
-[2023-07-08 19:16:55,621][1048168] Updated weights for policy 0, policy_version 12320 (0.0004)
-[2023-07-08 19:16:57,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 6320128. Throughput: 0: 7138.2. Samples: 6309580. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:16:57,600][1047911] Avg episode reward: [(0, '238.656')]
-[2023-07-08 19:17:01,147][1048168] Updated weights for policy 0, policy_version 12400 (0.0005)
-[2023-07-08 19:17:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 6356992. Throughput: 0: 7165.4. Samples: 6353328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:17:02,600][1047911] Avg episode reward: [(0, '238.417')]
-[2023-07-08 19:17:06,553][1048168] Updated weights for policy 0, policy_version 12480 (0.0005)
-[2023-07-08 19:17:07,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 6393856. Throughput: 0: 7167.6. Samples: 6375480. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:17:07,599][1047911] Avg episode reward: [(0, '239.740')]
-[2023-07-08 19:17:07,601][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012488_6393856.pth...
-[2023-07-08 19:17:07,603][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012072_6180864.pth
-[2023-07-08 19:17:12,583][1048168] Updated weights for policy 0, policy_version 12560 (0.0005)
-[2023-07-08 19:17:12,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 6430720. Throughput: 0: 7206.3. Samples: 6419864. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:17:12,600][1047911] Avg episode reward: [(0, '237.512')]
-[2023-07-08 19:17:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6467584. Throughput: 0: 7183.7. Samples: 6463168. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:17:17,599][1047911] Avg episode reward: [(0, '238.086')]
-[2023-07-08 19:17:18,143][1048168] Updated weights for policy 0, policy_version 12640 (0.0005)
-[2023-07-08 19:17:22,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6504448. Throughput: 0: 7218.8. Samples: 6485296. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:17:22,600][1047911] Avg episode reward: [(0, '239.859')]
-[2023-07-08 19:17:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012704_6504448.pth...
-[2023-07-08 19:17:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012280_6287360.pth
-[2023-07-08 19:17:23,457][1048168] Updated weights for policy 0, policy_version 12720 (0.0005)
-[2023-07-08 19:17:27,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6541312. Throughput: 0: 7246.7. Samples: 6530876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:17:27,600][1047911] Avg episode reward: [(0, '241.300')]
-[2023-07-08 19:17:27,600][1048155] Saving new best policy, reward=241.300!
-[2023-07-08 19:17:29,121][1048168] Updated weights for policy 0, policy_version 12800 (0.0005)
-[2023-07-08 19:17:32,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 6574080. Throughput: 0: 7246.9. Samples: 6573640. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:17:32,600][1047911] Avg episode reward: [(0, '241.478')]
-[2023-07-08 19:17:32,601][1048155] Saving new best policy, reward=241.478!
-[2023-07-08 19:17:34,867][1048168] Updated weights for policy 0, policy_version 12880 (0.0005)
-[2023-07-08 19:17:37,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 6615040. Throughput: 0: 7239.6. Samples: 6594576. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:17:37,601][1047911] Avg episode reward: [(0, '240.347')]
-[2023-07-08 19:17:37,604][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012920_6615040.pth...
-[2023-07-08 19:17:37,607][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012488_6393856.pth
-[2023-07-08 19:17:40,148][1048168] Updated weights for policy 0, policy_version 12960 (0.0005)
-[2023-07-08 19:17:42,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 6651904. Throughput: 0: 7364.6. Samples: 6640988. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:17:42,600][1047911] Avg episode reward: [(0, '240.783')]
-[2023-07-08 19:17:45,701][1048168] Updated weights for policy 0, policy_version 13040 (0.0005)
-[2023-07-08 19:17:47,599][1047911] Fps is (10 sec: 7373.0, 60 sec: 7304.5, 300 sec: 7275.6). Total num frames: 6688768. Throughput: 0: 7396.2. Samples: 6686156. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:17:47,600][1047911] Avg episode reward: [(0, '242.543')]
-[2023-07-08 19:17:47,600][1048155] Saving new best policy, reward=242.543!
-[2023-07-08 19:17:51,028][1048168] Updated weights for policy 0, policy_version 13120 (0.0005)
-[2023-07-08 19:17:52,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 6725632. Throughput: 0: 7415.1. Samples: 6709160. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:17:52,600][1047911] Avg episode reward: [(0, '242.548')]
-[2023-07-08 19:17:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013136_6725632.pth...
-[2023-07-08 19:17:52,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012704_6504448.pth
-[2023-07-08 19:17:52,607][1048155] Saving new best policy, reward=242.548!
-[2023-07-08 19:17:56,755][1048168] Updated weights for policy 0, policy_version 13200 (0.0005)
-[2023-07-08 19:17:57,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 6762496. Throughput: 0: 7377.0. Samples: 6751828. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:17:57,600][1047911] Avg episode reward: [(0, '241.833')]
-[2023-07-08 19:18:02,377][1048168] Updated weights for policy 0, policy_version 13280 (0.0005)
-[2023-07-08 19:18:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 6799360. Throughput: 0: 7386.8. Samples: 6795576. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:02,600][1047911] Avg episode reward: [(0, '246.952')]
-[2023-07-08 19:18:02,600][1048155] Saving new best policy, reward=246.952!
-[2023-07-08 19:18:07,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7372.8, 300 sec: 7289.5). Total num frames: 6836224. Throughput: 0: 7380.5. Samples: 6817420. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:07,600][1047911] Avg episode reward: [(0, '246.466')]
-[2023-07-08 19:18:07,604][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013352_6836224.pth...
-[2023-07-08 19:18:07,608][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012920_6615040.pth
-[2023-07-08 19:18:08,193][1048168] Updated weights for policy 0, policy_version 13360 (0.0005)
-[2023-07-08 19:18:12,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7304.5, 300 sec: 7289.5). Total num frames: 6868992. Throughput: 0: 7296.1. Samples: 6859200. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:12,600][1047911] Avg episode reward: [(0, '241.411')]
-[2023-07-08 19:18:14,101][1048168] Updated weights for policy 0, policy_version 13440 (0.0005)
-[2023-07-08 19:18:17,599][1047911] Fps is (10 sec: 6553.7, 60 sec: 7236.3, 300 sec: 7275.6). Total num frames: 6901760. Throughput: 0: 7281.9. Samples: 6901324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:17,599][1047911] Avg episode reward: [(0, '245.431')]
-[2023-07-08 19:18:19,925][1048168] Updated weights for policy 0, policy_version 13520 (0.0005)
-[2023-07-08 19:18:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6938624. Throughput: 0: 7278.2. Samples: 6922096. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:22,600][1047911] Avg episode reward: [(0, '247.802')]
-[2023-07-08 19:18:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013552_6938624.pth...
-[2023-07-08 19:18:22,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013136_6725632.pth
-[2023-07-08 19:18:22,604][1048155] Saving new best policy, reward=247.802!
-[2023-07-08 19:18:25,475][1048168] Updated weights for policy 0, policy_version 13600 (0.0005)
-[2023-07-08 19:18:27,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 6975488. Throughput: 0: 7231.6. Samples: 6966412. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:27,600][1047911] Avg episode reward: [(0, '246.340')]
-[2023-07-08 19:18:30,976][1048168] Updated weights for policy 0, policy_version 13680 (0.0005)
-[2023-07-08 19:18:32,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7304.5, 300 sec: 7261.7). Total num frames: 7012352. Throughput: 0: 7205.5. Samples: 7010404. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:18:32,600][1047911] Avg episode reward: [(0, '250.334')]
-[2023-07-08 19:18:32,600][1048155] Saving new best policy, reward=250.334!
-[2023-07-08 19:18:36,811][1048168] Updated weights for policy 0, policy_version 13760 (0.0005)
-[2023-07-08 19:18:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 7049216. Throughput: 0: 7180.3. Samples: 7032272. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:18:37,600][1047911] Avg episode reward: [(0, '251.078')]
-[2023-07-08 19:18:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013768_7049216.pth...
-[2023-07-08 19:18:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013352_6836224.pth
-[2023-07-08 19:18:37,606][1048155] Saving new best policy, reward=251.078!
-[2023-07-08 19:18:42,349][1048168] Updated weights for policy 0, policy_version 13840 (0.0005)
-[2023-07-08 19:18:42,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 7086080. Throughput: 0: 7184.3. Samples: 7075120. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:18:42,599][1047911] Avg episode reward: [(0, '251.263')]
-[2023-07-08 19:18:42,600][1048155] Saving new best policy, reward=251.263!
-[2023-07-08 19:18:47,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7261.7). Total num frames: 7122944. Throughput: 0: 7227.8. Samples: 7120828. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:18:47,599][1047911] Avg episode reward: [(0, '248.362')]
-[2023-07-08 19:18:47,810][1048168] Updated weights for policy 0, policy_version 13920 (0.0005)
-[2023-07-08 19:18:52,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 7155712. Throughput: 0: 7187.0. Samples: 7140836. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:52,600][1047911] Avg episode reward: [(0, '245.347')]
-[2023-07-08 19:18:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013976_7155712.pth...
-[2023-07-08 19:18:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013552_6938624.pth
-[2023-07-08 19:18:53,978][1048168] Updated weights for policy 0, policy_version 14000 (0.0004)
-[2023-07-08 19:18:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 7192576. Throughput: 0: 7157.5. Samples: 7181288. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:18:57,599][1047911] Avg episode reward: [(0, '244.124')]
-[2023-07-08 19:18:59,649][1048168] Updated weights for policy 0, policy_version 14080 (0.0005)
-[2023-07-08 19:19:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7247.8). Total num frames: 7229440. Throughput: 0: 7194.6. Samples: 7225080. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:19:02,600][1047911] Avg episode reward: [(0, '249.115')]
-[2023-07-08 19:19:05,704][1048168] Updated weights for policy 0, policy_version 14160 (0.0005)
-[2023-07-08 19:19:07,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7099.7, 300 sec: 7234.0). Total num frames: 7262208. Throughput: 0: 7169.6. Samples: 7244728. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:19:07,600][1047911] Avg episode reward: [(0, '248.157')]
-[2023-07-08 19:19:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014184_7262208.pth...
-[2023-07-08 19:19:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013768_7049216.pth
-[2023-07-08 19:19:11,360][1048168] Updated weights for policy 0, policy_version 14240 (0.0005)
-[2023-07-08 19:19:12,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7234.0). Total num frames: 7299072. Throughput: 0: 7136.8. Samples: 7287568. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:19:12,600][1047911] Avg episode reward: [(0, '246.882')]
-[2023-07-08 19:19:16,916][1048168] Updated weights for policy 0, policy_version 14320 (0.0005)
-[2023-07-08 19:19:17,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7234.0). Total num frames: 7335936. Throughput: 0: 7142.6. Samples: 7331820. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:19:17,600][1047911] Avg episode reward: [(0, '250.078')]
-[2023-07-08 19:19:22,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 7220.1). Total num frames: 7368704. Throughput: 0: 7113.6. Samples: 7352384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:19:22,600][1047911] Avg episode reward: [(0, '254.680')]
-[2023-07-08 19:19:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014392_7368704.pth...
-[2023-07-08 19:19:22,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013976_7155712.pth
-[2023-07-08 19:19:22,605][1048155] Saving new best policy, reward=254.680!
-[2023-07-08 19:19:22,660][1048168] Updated weights for policy 0, policy_version 14400 (0.0005)
-[2023-07-08 19:19:27,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7247.8). Total num frames: 7409664. Throughput: 0: 7161.2. Samples: 7397376. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:19:27,600][1047911] Avg episode reward: [(0, '250.507')]
-[2023-07-08 19:19:28,057][1048168] Updated weights for policy 0, policy_version 14480 (0.0005)
-[2023-07-08 19:19:32,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7168.0, 300 sec: 7234.0). Total num frames: 7442432. Throughput: 0: 7060.5. Samples: 7438552. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:19:32,599][1047911] Avg episode reward: [(0, '255.889')]
-[2023-07-08 19:19:32,600][1048155] Saving new best policy, reward=255.889!
-[2023-07-08 19:19:34,047][1048168] Updated weights for policy 0, policy_version 14560 (0.0005)
-[2023-07-08 19:19:37,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7234.0). Total num frames: 7479296. Throughput: 0: 7117.6. Samples: 7461128. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:19:37,600][1047911] Avg episode reward: [(0, '243.117')]
-[2023-07-08 19:19:37,630][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014616_7483392.pth...
-[2023-07-08 19:19:37,632][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014184_7262208.pth
-[2023-07-08 19:19:39,306][1048168] Updated weights for policy 0, policy_version 14640 (0.0005)
-[2023-07-08 19:19:42,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7234.0). Total num frames: 7516160. Throughput: 0: 7266.6. Samples: 7508284. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:19:42,600][1047911] Avg episode reward: [(0, '253.773')]
-[2023-07-08 19:19:45,032][1048168] Updated weights for policy 0, policy_version 14720 (0.0005)
-[2023-07-08 19:19:47,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7234.0). Total num frames: 7553024. Throughput: 0: 7196.6. Samples: 7548928. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:19:47,600][1047911] Avg episode reward: [(0, '261.019')]
-[2023-07-08 19:19:47,600][1048155] Saving new best policy, reward=261.019!
-[2023-07-08 19:19:51,052][1048168] Updated weights for policy 0, policy_version 14800 (0.0005)
-[2023-07-08 19:19:52,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 7220.1). Total num frames: 7585792. Throughput: 0: 7214.8. Samples: 7569396. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:19:52,600][1047911] Avg episode reward: [(0, '258.580')]
-[2023-07-08 19:19:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014816_7585792.pth...
-[2023-07-08 19:19:52,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014392_7368704.pth
-[2023-07-08 19:19:56,662][1048168] Updated weights for policy 0, policy_version 14880 (0.0004)
-[2023-07-08 19:19:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7220.1). Total num frames: 7622656. Throughput: 0: 7246.5. Samples: 7613660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:19:57,600][1047911] Avg episode reward: [(0, '257.192')]
-[2023-07-08 19:20:02,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7099.7, 300 sec: 7206.2). Total num frames: 7655424. Throughput: 0: 7165.9. Samples: 7654284. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:20:02,612][1047911] Avg episode reward: [(0, '257.807')]
-[2023-07-08 19:20:02,657][1048168] Updated weights for policy 0, policy_version 14960 (0.0005)
-[2023-07-08 19:20:07,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7168.0, 300 sec: 7206.2). Total num frames: 7692288. Throughput: 0: 7153.2. Samples: 7674280. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:20:07,620][1047911] Avg episode reward: [(0, '257.634')]
-[2023-07-08 19:20:07,624][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015024_7692288.pth...
-[2023-07-08 19:20:07,626][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014616_7483392.pth
-[2023-07-08 19:20:08,837][1048168] Updated weights for policy 0, policy_version 15040 (0.0005)
-[2023-07-08 19:20:12,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7099.7, 300 sec: 7206.2). Total num frames: 7725056. Throughput: 0: 7056.4. Samples: 7714916. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:20:12,638][1047911] Avg episode reward: [(0, '251.437')]
-[2023-07-08 19:20:14,888][1048168] Updated weights for policy 0, policy_version 15120 (0.0004)
-[2023-07-08 19:20:17,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7099.7, 300 sec: 7206.2). Total num frames: 7761920. Throughput: 0: 7096.6. Samples: 7757900. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:20:17,605][1047911] Avg episode reward: [(0, '258.001')]
-[2023-07-08 19:20:20,530][1048168] Updated weights for policy 0, policy_version 15200 (0.0005)
-[2023-07-08 19:20:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7192.3). Total num frames: 7794688. Throughput: 0: 7048.3. Samples: 7778304. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:20:22,600][1047911] Avg episode reward: [(0, '260.176')]
-[2023-07-08 19:20:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015224_7794688.pth...
-[2023-07-08 19:20:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014816_7585792.pth
-[2023-07-08 19:20:26,683][1048168] Updated weights for policy 0, policy_version 15280 (0.0005)
-[2023-07-08 19:20:27,599][1047911] Fps is (10 sec: 6553.5, 60 sec: 6963.2, 300 sec: 7192.3). Total num frames: 7827456. Throughput: 0: 6890.0. Samples: 7818336. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:20:27,600][1047911] Avg episode reward: [(0, '258.208')]
-[2023-07-08 19:20:32,538][1048168] Updated weights for policy 0, policy_version 15360 (0.0005)
-[2023-07-08 19:20:32,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7031.4, 300 sec: 7192.3). Total num frames: 7864320. Throughput: 0: 6917.6. Samples: 7860220. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:20:32,600][1047911] Avg episode reward: [(0, '259.837')]
-[2023-07-08 19:20:37,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 6963.2, 300 sec: 7178.4). Total num frames: 7897088. Throughput: 0: 6918.0. Samples: 7880704. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:20:37,600][1047911] Avg episode reward: [(0, '262.147')]
-[2023-07-08 19:20:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015424_7897088.pth...
-[2023-07-08 19:20:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015024_7692288.pth
-[2023-07-08 19:20:37,605][1048155] Saving new best policy, reward=262.147!
-[2023-07-08 19:20:38,308][1048168] Updated weights for policy 0, policy_version 15440 (0.0005)
-[2023-07-08 19:20:42,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7031.5, 300 sec: 7192.3). Total num frames: 7938048. Throughput: 0: 6935.6. Samples: 7925760. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:20:42,599][1047911] Avg episode reward: [(0, '258.056')]
-[2023-07-08 19:20:43,774][1048168] Updated weights for policy 0, policy_version 15520 (0.0005)
-[2023-07-08 19:20:47,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 6963.2, 300 sec: 7192.3). Total num frames: 7970816. Throughput: 0: 6968.3. Samples: 7967856. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:20:47,599][1047911] Avg episode reward: [(0, '262.675')]
-[2023-07-08 19:20:47,600][1048155] Saving new best policy, reward=262.675!
-[2023-07-08 19:20:49,517][1048168] Updated weights for policy 0, policy_version 15600 (0.0005)
-[2023-07-08 19:20:52,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7031.5, 300 sec: 7178.4). Total num frames: 8007680. Throughput: 0: 7017.3. Samples: 7990056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:20:52,600][1047911] Avg episode reward: [(0, '262.896')]
-[2023-07-08 19:20:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015640_8007680.pth...
-[2023-07-08 19:20:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015224_7794688.pth
-[2023-07-08 19:20:52,606][1048155] Saving new best policy, reward=262.896!
-[2023-07-08 19:20:55,262][1048168] Updated weights for policy 0, policy_version 15680 (0.0005)
-[2023-07-08 19:20:57,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7031.5, 300 sec: 7178.4). Total num frames: 8044544. Throughput: 0: 7051.7. Samples: 8032244. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:20:57,600][1047911] Avg episode reward: [(0, '263.870')]
-[2023-07-08 19:20:57,600][1048155] Saving new best policy, reward=263.870!
-[2023-07-08 19:21:01,005][1048168] Updated weights for policy 0, policy_version 15760 (0.0005)
-[2023-07-08 19:21:02,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7099.7, 300 sec: 7192.3). Total num frames: 8081408. Throughput: 0: 7085.9. Samples: 8076768. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:21:02,600][1047911] Avg episode reward: [(0, '258.602')]
-[2023-07-08 19:21:06,854][1048168] Updated weights for policy 0, policy_version 15840 (0.0004)
-[2023-07-08 19:21:07,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7031.5, 300 sec: 7178.4). Total num frames: 8114176. Throughput: 0: 7096.0. Samples: 8097624. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:21:07,600][1047911] Avg episode reward: [(0, '253.259')]
-[2023-07-08 19:21:07,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015848_8114176.pth...
-[2023-07-08 19:21:07,607][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015424_7897088.pth
-[2023-07-08 19:21:12,599][1047911] Fps is (10 sec: 6553.7, 60 sec: 7031.5, 300 sec: 7164.5). Total num frames: 8146944. Throughput: 0: 7103.5. Samples: 8137992. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:12,599][1047911] Avg episode reward: [(0, '260.469')]
-[2023-07-08 19:21:12,918][1048168] Updated weights for policy 0, policy_version 15920 (0.0005)
-[2023-07-08 19:21:17,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7031.5, 300 sec: 7164.5). Total num frames: 8183808. Throughput: 0: 7083.7. Samples: 8178988. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:17,600][1047911] Avg episode reward: [(0, '262.625')]
-[2023-07-08 19:21:18,653][1048168] Updated weights for policy 0, policy_version 16000 (0.0005)
-[2023-07-08 19:21:22,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7099.7, 300 sec: 7164.5). Total num frames: 8220672. Throughput: 0: 7133.2. Samples: 8201700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:22,600][1047911] Avg episode reward: [(0, '265.473')]
-[2023-07-08 19:21:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016056_8220672.pth...
-[2023-07-08 19:21:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015640_8007680.pth
-[2023-07-08 19:21:22,606][1048155] Saving new best policy, reward=265.473!
-[2023-07-08 19:21:24,135][1048168] Updated weights for policy 0, policy_version 16080 (0.0005)
-[2023-07-08 19:21:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7150.6). Total num frames: 8253440. Throughput: 0: 7103.8. Samples: 8245432. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:21:27,600][1047911] Avg episode reward: [(0, '270.416')]
-[2023-07-08 19:21:27,610][1048155] Saving new best policy, reward=270.416!
-[2023-07-08 19:21:29,970][1048168] Updated weights for policy 0, policy_version 16160 (0.0006)
-[2023-07-08 19:21:32,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7164.5). Total num frames: 8294400. Throughput: 0: 7163.2. Samples: 8290200. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:21:32,600][1047911] Avg episode reward: [(0, '262.335')]
-[2023-07-08 19:21:35,485][1048168] Updated weights for policy 0, policy_version 16240 (0.0005)
-[2023-07-08 19:21:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7164.5). Total num frames: 8327168. Throughput: 0: 7121.2. Samples: 8310508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:37,600][1047911] Avg episode reward: [(0, '273.050')]
-[2023-07-08 19:21:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016264_8327168.pth...
-[2023-07-08 19:21:37,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015848_8114176.pth
-[2023-07-08 19:21:37,604][1048155] Saving new best policy, reward=273.050!
-[2023-07-08 19:21:41,227][1048168] Updated weights for policy 0, policy_version 16320 (0.0005)
-[2023-07-08 19:21:42,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7164.5). Total num frames: 8364032. Throughput: 0: 7117.6. Samples: 8352536. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:42,600][1047911] Avg episode reward: [(0, '270.661')]
-[2023-07-08 19:21:47,026][1048168] Updated weights for policy 0, policy_version 16400 (0.0005)
-[2023-07-08 19:21:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7164.5). Total num frames: 8396800. Throughput: 0: 7082.9. Samples: 8395496. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:47,600][1047911] Avg episode reward: [(0, '276.487')]
-[2023-07-08 19:21:47,600][1048155] Saving new best policy, reward=276.487!
-[2023-07-08 19:21:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7164.5). Total num frames: 8433664. Throughput: 0: 7077.0. Samples: 8416088. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:52,600][1047911] Avg episode reward: [(0, '265.898')]
-[2023-07-08 19:21:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016472_8433664.pth...
-[2023-07-08 19:21:52,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016056_8220672.pth
-[2023-07-08 19:21:53,134][1048168] Updated weights for policy 0, policy_version 16480 (0.0005)
-[2023-07-08 19:21:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7031.5, 300 sec: 7150.6). Total num frames: 8466432. Throughput: 0: 7084.9. Samples: 8456812. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:21:57,600][1047911] Avg episode reward: [(0, '271.613')]
-[2023-07-08 19:21:58,746][1048168] Updated weights for policy 0, policy_version 16560 (0.0005)
-[2023-07-08 19:22:02,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7031.5, 300 sec: 7150.6). Total num frames: 8503296. Throughput: 0: 7139.8. Samples: 8500280. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:22:02,600][1047911] Avg episode reward: [(0, '259.209')]
-[2023-07-08 19:22:04,733][1048168] Updated weights for policy 0, policy_version 16640 (0.0004)
-[2023-07-08 19:22:07,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7031.5, 300 sec: 7136.8). Total num frames: 8536064. Throughput: 0: 7085.8. Samples: 8520560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:22:07,613][1047911] Avg episode reward: [(0, '271.954')]
-[2023-07-08 19:22:07,616][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016672_8536064.pth...
-[2023-07-08 19:22:07,619][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016264_8327168.pth
-[2023-07-08 19:22:11,033][1048168] Updated weights for policy 0, policy_version 16720 (0.0005)
-[2023-07-08 19:22:12,599][1047911] Fps is (10 sec: 6553.5, 60 sec: 7031.5, 300 sec: 7122.9). Total num frames: 8568832. Throughput: 0: 6996.3. Samples: 8560264. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:22:12,600][1047911] Avg episode reward: [(0, '272.269')]
-[2023-07-08 19:22:16,865][1048168] Updated weights for policy 0, policy_version 16800 (0.0005)
-[2023-07-08 19:22:17,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7031.5, 300 sec: 7122.9). Total num frames: 8605696. Throughput: 0: 6920.3. Samples: 8601612. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:22:17,600][1047911] Avg episode reward: [(0, '271.455')]
-[2023-07-08 19:22:22,220][1048168] Updated weights for policy 0, policy_version 16880 (0.0005)
-[2023-07-08 19:22:22,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7031.5, 300 sec: 7122.9). Total num frames: 8642560. Throughput: 0: 6968.5. Samples: 8624092. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:22:22,600][1047911] Avg episode reward: [(0, '274.141')]
-[2023-07-08 19:22:22,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016880_8642560.pth...
-[2023-07-08 19:22:22,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016472_8433664.pth
-[2023-07-08 19:22:27,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7099.7, 300 sec: 7136.8). Total num frames: 8679424. Throughput: 0: 7072.3. Samples: 8670788. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:22:27,600][1047911] Avg episode reward: [(0, '274.798')]
-[2023-07-08 19:22:27,604][1048168] Updated weights for policy 0, policy_version 16960 (0.0006)
-[2023-07-08 19:22:32,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7099.7, 300 sec: 7136.8). Total num frames: 8720384. Throughput: 0: 7128.7. Samples: 8716288. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
-[2023-07-08 19:22:32,600][1047911] Avg episode reward: [(0, '277.205')]
-[2023-07-08 19:22:32,600][1048155] Saving new best policy, reward=277.205!
-[2023-07-08 19:22:33,183][1048168] Updated weights for policy 0, policy_version 17040 (0.0005)
-[2023-07-08 19:22:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7099.7, 300 sec: 7122.9). Total num frames: 8753152. Throughput: 0: 7127.8. Samples: 8736840. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:22:37,599][1047911] Avg episode reward: [(0, '274.861')]
-[2023-07-08 19:22:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017096_8753152.pth...
-[2023-07-08 19:22:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016672_8536064.pth
-[2023-07-08 19:22:38,979][1048168] Updated weights for policy 0, policy_version 17120 (0.0004)
-[2023-07-08 19:22:42,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7122.9). Total num frames: 8790016. Throughput: 0: 7172.7. Samples: 8779584. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:22:42,600][1047911] Avg episode reward: [(0, '267.823')]
-[2023-07-08 19:22:44,464][1048168] Updated weights for policy 0, policy_version 17200 (0.0005)
-[2023-07-08 19:22:47,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 8826880. Throughput: 0: 7208.3. Samples: 8824652. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
-[2023-07-08 19:22:47,600][1047911] Avg episode reward: [(0, '270.632')]
-[2023-07-08 19:22:50,090][1048168] Updated weights for policy 0, policy_version 17280 (0.0005)
-[2023-07-08 19:22:52,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 8863744. Throughput: 0: 7231.5. Samples: 8845980. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:22:52,600][1047911] Avg episode reward: [(0, '273.381')]
-[2023-07-08 19:22:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017312_8863744.pth...
-[2023-07-08 19:22:52,606][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016880_8642560.pth
-[2023-07-08 19:22:56,003][1048168] Updated weights for policy 0, policy_version 17360 (0.0005)
-[2023-07-08 19:22:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7109.0). Total num frames: 8896512. Throughput: 0: 7283.4. Samples: 8888016. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:22:57,600][1047911] Avg episode reward: [(0, '279.254')]
-[2023-07-08 19:22:57,601][1048155] Saving new best policy, reward=279.254!
-[2023-07-08 19:23:01,538][1048168] Updated weights for policy 0, policy_version 17440 (0.0005)
-[2023-07-08 19:23:02,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7236.3, 300 sec: 7122.9). Total num frames: 8937472. Throughput: 0: 7343.0. Samples: 8932048. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:23:02,600][1047911] Avg episode reward: [(0, '273.923')]
-[2023-07-08 19:23:06,917][1048168] Updated weights for policy 0, policy_version 17520 (0.0006)
-[2023-07-08 19:23:07,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7136.8). Total num frames: 8974336. Throughput: 0: 7346.3. Samples: 8954676. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:23:07,600][1047911] Avg episode reward: [(0, '279.275')]
-[2023-07-08 19:23:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017528_8974336.pth...
-[2023-07-08 19:23:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017096_8753152.pth
-[2023-07-08 19:23:07,605][1048155] Saving new best policy, reward=279.275!
-[2023-07-08 19:23:12,599][1047911] Fps is (10 sec: 6963.3, 60 sec: 7304.6, 300 sec: 7136.8). Total num frames: 9007104. Throughput: 0: 7257.5. Samples: 8997376. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
-[2023-07-08 19:23:12,600][1047911] Avg episode reward: [(0, '277.713')]
-[2023-07-08 19:23:12,709][1048168] Updated weights for policy 0, policy_version 17600 (0.0005)
-[2023-07-08 19:23:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7304.5, 300 sec: 7136.8). Total num frames: 9043968. Throughput: 0: 7190.1. Samples: 9039840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:23:17,600][1047911] Avg episode reward: [(0, '276.080')]
-[2023-07-08 19:23:18,822][1048168] Updated weights for policy 0, policy_version 17680 (0.0005)
-[2023-07-08 19:23:22,599][1047911] Fps is (10 sec: 6963.1, 60 sec: 7236.3, 300 sec: 7122.9). Total num frames: 9076736. Throughput: 0: 7171.5. Samples: 9059556. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:23:22,603][1047911] Avg episode reward: [(0, '278.635')]
-[2023-07-08 19:23:22,606][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017728_9076736.pth...
-[2023-07-08 19:23:22,609][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017312_8863744.pth
-[2023-07-08 19:23:24,716][1048168] Updated weights for policy 0, policy_version 17760 (0.0005)
-[2023-07-08 19:23:27,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7122.9). Total num frames: 9113600. Throughput: 0: 7149.7. Samples: 9101320. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:23:27,600][1047911] Avg episode reward: [(0, '277.653')]
-[2023-07-08 19:23:30,171][1048168] Updated weights for policy 0, policy_version 17840 (0.0005)
-[2023-07-08 19:23:32,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9150464. Throughput: 0: 7156.5. Samples: 9146696. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:23:32,600][1047911] Avg episode reward: [(0, '282.403')]
-[2023-07-08 19:23:32,600][1048155] Saving new best policy, reward=282.403!
-[2023-07-08 19:23:35,892][1048168] Updated weights for policy 0, policy_version 17920 (0.0005)
-[2023-07-08 19:23:37,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7122.9). Total num frames: 9187328. Throughput: 0: 7163.9. Samples: 9168356. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:23:37,599][1047911] Avg episode reward: [(0, '276.085')]
-[2023-07-08 19:23:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017944_9187328.pth...
-[2023-07-08 19:23:37,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017528_8974336.pth
-[2023-07-08 19:23:41,333][1048168] Updated weights for policy 0, policy_version 18000 (0.0005)
-[2023-07-08 19:23:42,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7122.9). Total num frames: 9224192. Throughput: 0: 7205.0. Samples: 9212240. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:23:42,600][1047911] Avg episode reward: [(0, '268.964')]
-[2023-07-08 19:23:47,007][1048168] Updated weights for policy 0, policy_version 18080 (0.0005)
-[2023-07-08 19:23:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9256960. Throughput: 0: 7213.9. Samples: 9256672. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
-[2023-07-08 19:23:47,599][1047911] Avg episode reward: [(0, '283.057')]
-[2023-07-08 19:23:47,611][1048155] Saving new best policy, reward=283.057!
-[2023-07-08 19:23:52,599][1047911] Fps is (10 sec: 6963.0, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9293824. Throughput: 0: 7162.1. Samples: 9276972. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:23:52,600][1047911] Avg episode reward: [(0, '283.915')]
-[2023-07-08 19:23:52,603][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018152_9293824.pth...
-[2023-07-08 19:23:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017728_9076736.pth
-[2023-07-08 19:23:52,606][1048155] Saving new best policy, reward=283.915!
-[2023-07-08 19:23:52,744][1048168] Updated weights for policy 0, policy_version 18160 (0.0005)
-[2023-07-08 19:23:57,599][1047911] Fps is (10 sec: 7782.4, 60 sec: 7304.5, 300 sec: 7136.8). Total num frames: 9334784. Throughput: 0: 7225.1. Samples: 9322504. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:23:57,600][1047911] Avg episode reward: [(0, '289.168')]
-[2023-07-08 19:23:57,600][1048155] Saving new best policy, reward=289.168!
-[2023-07-08 19:23:58,201][1048168] Updated weights for policy 0, policy_version 18240 (0.0005)
-[2023-07-08 19:24:02,599][1047911] Fps is (10 sec: 7373.0, 60 sec: 7168.0, 300 sec: 7136.8). Total num frames: 9367552. Throughput: 0: 7220.7. Samples: 9364772. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
-[2023-07-08 19:24:02,600][1047911] Avg episode reward: [(0, '283.958')]
-[2023-07-08 19:24:03,916][1048168] Updated weights for policy 0, policy_version 18320 (0.0004)
-[2023-07-08 19:24:07,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7136.8). Total num frames: 9404416. Throughput: 0: 7293.1. Samples: 9387744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:07,599][1047911] Avg episode reward: [(0, '279.991')]
-[2023-07-08 19:24:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018368_9404416.pth...
-[2023-07-08 19:24:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017944_9187328.pth
-[2023-07-08 19:24:09,450][1048168] Updated weights for policy 0, policy_version 18400 (0.0005)
-[2023-07-08 19:24:12,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7136.8). Total num frames: 9441280. Throughput: 0: 7350.0. Samples: 9432072. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:12,600][1047911] Avg episode reward: [(0, '285.058')]
-[2023-07-08 19:24:15,408][1048168] Updated weights for policy 0, policy_version 18480 (0.0005)
-[2023-07-08 19:24:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7136.8). Total num frames: 9474048. Throughput: 0: 7227.5. Samples: 9471932. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:17,599][1047911] Avg episode reward: [(0, '284.923')]
-[2023-07-08 19:24:21,311][1048168] Updated weights for policy 0, policy_version 18560 (0.0005)
-[2023-07-08 19:24:22,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7236.3, 300 sec: 7122.9). Total num frames: 9510912. Throughput: 0: 7201.9. Samples: 9492440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:22,599][1047911] Avg episode reward: [(0, '288.352')]
-[2023-07-08 19:24:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018576_9510912.pth...
-[2023-07-08 19:24:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018152_9293824.pth
-[2023-07-08 19:24:26,708][1048168] Updated weights for policy 0, policy_version 18640 (0.0005)
-[2023-07-08 19:24:27,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7236.3, 300 sec: 7136.8). Total num frames: 9547776. Throughput: 0: 7239.3. Samples: 9538008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:27,600][1047911] Avg episode reward: [(0, '289.132')]
-[2023-07-08 19:24:32,416][1048168] Updated weights for policy 0, policy_version 18720 (0.0005)
-[2023-07-08 19:24:32,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7236.3, 300 sec: 7136.8). Total num frames: 9584640. Throughput: 0: 7204.2. Samples: 9580860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:32,599][1047911] Avg episode reward: [(0, '294.779')]
-[2023-07-08 19:24:32,600][1048155] Saving new best policy, reward=294.779!
-[2023-07-08 19:24:37,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9617408. Throughput: 0: 7213.2. Samples: 9601564. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:37,600][1047911] Avg episode reward: [(0, '294.809')]
-[2023-07-08 19:24:37,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018784_9617408.pth...
-[2023-07-08 19:24:37,604][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018368_9404416.pth
-[2023-07-08 19:24:37,604][1048155] Saving new best policy, reward=294.809!
-[2023-07-08 19:24:38,238][1048168] Updated weights for policy 0, policy_version 18800 (0.0005)
-[2023-07-08 19:24:42,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9654272. Throughput: 0: 7132.6. Samples: 9643472. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
-[2023-07-08 19:24:42,600][1047911] Avg episode reward: [(0, '291.662')]
-[2023-07-08 19:24:44,290][1048168] Updated weights for policy 0, policy_version 18880 (0.0005)
-[2023-07-08 19:24:47,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9687040. Throughput: 0: 7122.1. Samples: 9685268. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:24:47,600][1047911] Avg episode reward: [(0, '294.111')]
-[2023-07-08 19:24:50,134][1048168] Updated weights for policy 0, policy_version 18960 (0.0005)
-[2023-07-08 19:24:52,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7168.0, 300 sec: 7122.9). Total num frames: 9723904. Throughput: 0: 7062.2. Samples: 9705544. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:24:52,600][1047911] Avg episode reward: [(0, '286.296')]
-[2023-07-08 19:24:52,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018992_9723904.pth...
-[2023-07-08 19:24:52,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018576_9510912.pth
-[2023-07-08 19:24:56,129][1048168] Updated weights for policy 0, policy_version 19040 (0.0004)
-[2023-07-08 19:24:57,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7031.5, 300 sec: 7122.9). Total num frames: 9756672. Throughput: 0: 6998.7. Samples: 9747016. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:24:57,600][1047911] Avg episode reward: [(0, '293.809')]
-[2023-07-08 19:25:01,817][1048168] Updated weights for policy 0, policy_version 19120 (0.0004)
-[2023-07-08 19:25:02,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7122.9). Total num frames: 9793536. Throughput: 0: 7057.3. Samples: 9789512. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:25:02,600][1047911] Avg episode reward: [(0, '289.204')]
-[2023-07-08 19:25:07,430][1048168] Updated weights for policy 0, policy_version 19200 (0.0005)
-[2023-07-08 19:25:07,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7099.7, 300 sec: 7136.8). Total num frames: 9830400. Throughput: 0: 7084.8. Samples: 9811256. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
-[2023-07-08 19:25:07,600][1047911] Avg episode reward: [(0, '293.599')]
-[2023-07-08 19:25:07,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019200_9830400.pth...
-[2023-07-08 19:25:07,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018784_9617408.pth
-[2023-07-08 19:25:12,599][1047911] Fps is (10 sec: 7372.9, 60 sec: 7099.7, 300 sec: 7136.8). Total num frames: 9867264. Throughput: 0: 7087.9. Samples: 9856964. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:25:12,599][1047911] Avg episode reward: [(0, '295.468')]
-[2023-07-08 19:25:12,600][1048155] Saving new best policy, reward=295.468!
-[2023-07-08 19:25:12,908][1048168] Updated weights for policy 0, policy_version 19280 (0.0005)
-[2023-07-08 19:25:17,599][1047911] Fps is (10 sec: 6963.2, 60 sec: 7099.7, 300 sec: 7136.8). Total num frames: 9900032. Throughput: 0: 7078.7. Samples: 9899404. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:25:17,600][1047911] Avg episode reward: [(0, '300.019')]
-[2023-07-08 19:25:17,633][1048155] Saving new best policy, reward=300.019!
-[2023-07-08 19:25:18,630][1048168] Updated weights for policy 0, policy_version 19360 (0.0005)
-[2023-07-08 19:25:22,599][1047911] Fps is (10 sec: 7372.7, 60 sec: 7168.0, 300 sec: 7164.5). Total num frames: 9940992. Throughput: 0: 7112.2. Samples: 9921612. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:25:22,600][1047911] Avg episode reward: [(0, '292.125')]
-[2023-07-08 19:25:22,602][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019416_9940992.pth...
-[2023-07-08 19:25:22,605][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018992_9723904.pth
-[2023-07-08 19:25:24,068][1048168] Updated weights for policy 0, policy_version 19440 (0.0005)
-[2023-07-08 19:25:27,599][1047911] Fps is (10 sec: 7372.8, 60 sec: 7099.7, 300 sec: 7150.6). Total num frames: 9973760. Throughput: 0: 7159.1. Samples: 9965632. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
-[2023-07-08 19:25:27,600][1047911] Avg episode reward: [(0, '297.136')]
-[2023-07-08 19:25:29,874][1048168] Updated weights for policy 0, policy_version 19520 (0.0005)
-[2023-07-08 19:25:31,062][1048155] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000005
-[2023-07-08 19:25:31,594][1048155] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000000
-[2023-07-08 19:25:31,594][1048233] Stopping RolloutWorker_w3...
-[2023-07-08 19:25:31,594][1048202] Stopping RolloutWorker_w2...
-[2023-07-08 19:25:31,594][1048235] Stopping RolloutWorker_w4...
-[2023-07-08 19:25:31,594][1048268] Stopping RolloutWorker_w6...
-[2023-07-08 19:25:31,594][1048267] Stopping RolloutWorker_w5...
-[2023-07-08 19:25:31,594][1048269] Stopping RolloutWorker_w7...
-[2023-07-08 19:25:31,594][1048169] Stopping RolloutWorker_w0...
-[2023-07-08 19:25:31,595][1048233] Loop rollout_proc3_evt_loop terminating...
-[2023-07-08 19:25:31,595][1048202] Loop rollout_proc2_evt_loop terminating...
-[2023-07-08 19:25:31,594][1048170] Stopping RolloutWorker_w1...
-[2023-07-08 19:25:31,595][1048268] Loop rollout_proc6_evt_loop terminating...
-[2023-07-08 19:25:31,595][1048155] Stopping Batcher_0...
-[2023-07-08 19:25:31,595][1048267] Loop rollout_proc5_evt_loop terminating...
-[2023-07-08 19:25:31,595][1048269] Loop rollout_proc7_evt_loop terminating...
-[2023-07-08 19:25:31,594][1047911] Component RolloutWorker_w3 stopped!
-[2023-07-08 19:25:31,595][1048169] Loop rollout_proc0_evt_loop terminating...
-[2023-07-08 19:25:31,595][1048235] Loop rollout_proc4_evt_loop terminating...
-[2023-07-08 19:25:31,595][1048170] Loop rollout_proc1_evt_loop terminating...
-[2023-07-08 19:25:31,595][1048155] Loop batcher_evt_loop terminating...
-[2023-07-08 19:25:31,595][1047911] Component RolloutWorker_w2 stopped!
-[2023-07-08 19:25:31,595][1047911] Component RolloutWorker_w4 stopped!
-[2023-07-08 19:25:31,595][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
-[2023-07-08 19:25:31,595][1047911] Component RolloutWorker_w5 stopped!
-[2023-07-08 19:25:31,596][1047911] Component RolloutWorker_w6 stopped!
-[2023-07-08 19:25:31,596][1047911] Component RolloutWorker_w7 stopped!
-[2023-07-08 19:25:31,596][1047911] Component RolloutWorker_w0 stopped!
-[2023-07-08 19:25:31,596][1047911] Component RolloutWorker_w1 stopped!
-[2023-07-08 19:25:31,596][1047911] Component Batcher_0 stopped!
-[2023-07-08 19:25:31,598][1048155] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019200_9830400.pth
-[2023-07-08 19:25:31,598][1048155] Saving new best policy, reward=301.069!
-[2023-07-08 19:25:31,601][1048155] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
-[2023-07-08 19:25:31,603][1048155] Stopping LearnerWorker_p0...
-[2023-07-08 19:25:31,603][1048155] Loop learner_proc0_evt_loop terminating...
-[2023-07-08 19:25:31,603][1047911] Component LearnerWorker_p0 stopped!
-[2023-07-08 19:25:31,675][1048168] Weights refcount: 2 0
-[2023-07-08 19:25:31,676][1048168] Stopping InferenceWorker_p0-w0...
-[2023-07-08 19:25:31,676][1048168] Loop inference_proc0-0_evt_loop terminating...
-[2023-07-08 19:25:31,676][1047911] Component InferenceWorker_p0-w0 stopped!
-[2023-07-08 19:25:31,677][1047911] Waiting for process learner_proc0 to stop...
-[2023-07-08 19:25:32,316][1047911] Waiting for process inference_proc0-0 to join...
-[2023-07-08 19:25:32,364][1047911] Waiting for process rollout_proc0 to join...
-[2023-07-08 19:25:32,364][1047911] Waiting for process rollout_proc1 to join...
-[2023-07-08 19:25:32,365][1047911] Waiting for process rollout_proc2 to join...
-[2023-07-08 19:25:32,365][1047911] Waiting for process rollout_proc3 to join...
-[2023-07-08 19:25:32,365][1047911] Waiting for process rollout_proc4 to join...
-[2023-07-08 19:25:32,365][1047911] Waiting for process rollout_proc5 to join...
-[2023-07-08 19:25:32,366][1047911] Waiting for process rollout_proc6 to join...
-[2023-07-08 19:25:32,366][1047911] Waiting for process rollout_proc7 to join...
-[2023-07-08 19:25:32,366][1047911] Batcher 0 profile tree view:
-batching: 1.8445, releasing_batches: 1.5634
-[2023-07-08 19:25:32,366][1047911] InferenceWorker_p0-w0 profile tree view:
-wait_policy: 0.0052
-  wait_policy_total: 611.9279
-update_model: 15.3830
+[2023-07-17 12:20:53,966][435289] Worker 0 uses CPU cores [0, 1, 2, 3]
+[2023-07-17 12:20:54,116][435287] Worker 3 uses CPU cores [12, 13, 14, 15]
+[2023-07-17 12:20:54,242][435240] Using optimizer <class 'torch.optim.adam.Adam'>
+[2023-07-17 12:20:54,242][435240] No checkpoints found
+[2023-07-17 12:20:54,243][435240] Did not load from checkpoint, starting from scratch!
+[2023-07-17 12:20:54,243][435240] Initialized policy 0 weights for model version 0
+[2023-07-17 12:20:54,244][435240] LearnerWorker_p0 finished initialization!
+[2023-07-17 12:20:54,245][435284] RunningMeanStd input shape: (39,)
+[2023-07-17 12:20:54,245][435284] RunningMeanStd input shape: (1,)
+[2023-07-17 12:20:54,246][434969] Fps is (10 sec: nan, 60 sec: nan, 300 sec: nan). Total num frames: 0. Throughput: 0: nan. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-07-17 12:20:54,302][434969] Inference worker 0-0 is ready!
+[2023-07-17 12:20:54,303][434969] All inference workers are ready! Signal rollout workers to start!
+[2023-07-17 12:20:54,335][435353] Worker 6 uses CPU cores [24, 25, 26, 27]
+[2023-07-17 12:20:54,469][435290] Worker 5 uses CPU cores [20, 21, 22, 23]
+[2023-07-17 12:20:54,562][435288] Worker 4 uses CPU cores [16, 17, 18, 19]
+[2023-07-17 12:20:57,119][435287] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,130][435287] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,164][435385] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,170][435287] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,175][435385] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,177][435285] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,178][435286] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,179][435289] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,182][435353] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,188][435285] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,189][435286] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,190][435289] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,193][435353] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,216][435385] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,228][435285] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,229][435286] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,230][435289] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,232][435353] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,248][435287] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,294][435385] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,305][435286] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,306][435285] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,307][435289] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,309][435290] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,310][435353] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,404][435290] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,418][435288] Decorrelating experience for 0 frames...
+[2023-07-17 12:20:57,429][435288] Decorrelating experience for 64 frames...
+[2023-07-17 12:20:57,443][435290] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,469][435288] Decorrelating experience for 128 frames...
+[2023-07-17 12:20:57,522][435290] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:57,547][435288] Decorrelating experience for 192 frames...
+[2023-07-17 12:20:59,246][434969] Fps is (10 sec: 0.0, 60 sec: 0.0, 300 sec: 0.0). Total num frames: 0. Throughput: 0: 0.0. Samples: 0. Policy #0 lag: (min: -1.0, avg: -1.0, max: -1.0)
+[2023-07-17 12:21:00,047][435287] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,195][435287] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,213][435385] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,262][435285] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,265][435353] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,268][435289] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,270][435286] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,350][435290] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,358][435385] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,379][435287] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,385][435288] Decorrelating experience for 256 frames...
+[2023-07-17 12:21:00,408][435285] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,409][435353] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,415][435289] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,416][435286] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,495][435290] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,531][435288] Decorrelating experience for 320 frames...
+[2023-07-17 12:21:00,543][435385] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,592][435285] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,594][435353] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,594][435287] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,596][435289] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,600][435286] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,678][435290] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,715][435288] Decorrelating experience for 384 frames...
+[2023-07-17 12:21:00,755][435385] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,804][435285] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,808][435353] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,809][435289] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,811][435286] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,891][435290] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:00,927][435288] Decorrelating experience for 448 frames...
+[2023-07-17 12:21:04,246][434969] Fps is (10 sec: 2457.6, 60 sec: 2457.6, 300 sec: 2457.6). Total num frames: 24576. Throughput: 0: 1820.0. Samples: 18200. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:21:04,246][434969] Avg episode reward: [(0, '95.366')]
+[2023-07-17 12:21:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000048_24576.pth...
+[2023-07-17 12:21:05,504][435284] Updated weights for policy 0, policy_version 80 (0.0005)
+[2023-07-17 12:21:09,246][434969] Fps is (10 sec: 7782.4, 60 sec: 5188.2, 300 sec: 5188.2). Total num frames: 77824. Throughput: 0: 3281.0. Samples: 49216. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:21:09,246][434969] Avg episode reward: [(0, '96.043')]
+[2023-07-17 12:21:09,447][435284] Updated weights for policy 0, policy_version 160 (0.0005)
+[2023-07-17 12:21:11,700][434969] Heartbeat connected on Batcher_0
+[2023-07-17 12:21:11,708][434969] Heartbeat connected on RolloutWorker_w0
+[2023-07-17 12:21:11,710][434969] Heartbeat connected on RolloutWorker_w1
+[2023-07-17 12:21:11,712][434969] Heartbeat connected on RolloutWorker_w2
+[2023-07-17 12:21:11,714][434969] Heartbeat connected on RolloutWorker_w3
+[2023-07-17 12:21:11,716][434969] Heartbeat connected on RolloutWorker_w4
+[2023-07-17 12:21:11,718][434969] Heartbeat connected on RolloutWorker_w5
+[2023-07-17 12:21:11,720][434969] Heartbeat connected on RolloutWorker_w6
+[2023-07-17 12:21:11,722][434969] Heartbeat connected on LearnerWorker_p0
+[2023-07-17 12:21:11,723][434969] Heartbeat connected on RolloutWorker_w7
+[2023-07-17 12:21:11,725][434969] Heartbeat connected on InferenceWorker_p0-w0
+[2023-07-17 12:21:13,290][435284] Updated weights for policy 0, policy_version 240 (0.0005)
+[2023-07-17 12:21:14,246][434969] Fps is (10 sec: 10649.6, 60 sec: 6553.6, 300 sec: 6553.6). Total num frames: 131072. Throughput: 0: 5641.0. Samples: 112820. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:21:14,246][434969] Avg episode reward: [(0, '95.991')]
+[2023-07-17 12:21:14,247][435240] Saving new best policy, reward=95.991!
+[2023-07-17 12:21:17,190][435284] Updated weights for policy 0, policy_version 320 (0.0005)
+[2023-07-17 12:21:19,246][434969] Fps is (10 sec: 10649.6, 60 sec: 7372.8, 300 sec: 7372.8). Total num frames: 184320. Throughput: 0: 7045.4. Samples: 176136. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:21:19,246][434969] Avg episode reward: [(0, '99.114')]
+[2023-07-17 12:21:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000360_184320.pth...
+[2023-07-17 12:21:19,254][435240] Saving new best policy, reward=99.114!
+[2023-07-17 12:21:20,938][435284] Updated weights for policy 0, policy_version 400 (0.0005)
+[2023-07-17 12:21:24,246][434969] Fps is (10 sec: 11059.2, 60 sec: 8055.5, 300 sec: 8055.5). Total num frames: 241664. Throughput: 0: 6972.1. Samples: 209164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:21:24,246][434969] Avg episode reward: [(0, '101.919')]
+[2023-07-17 12:21:24,247][435240] Saving new best policy, reward=101.919!
+[2023-07-17 12:21:24,617][435284] Updated weights for policy 0, policy_version 480 (0.0005)
+[2023-07-17 12:21:28,311][435284] Updated weights for policy 0, policy_version 560 (0.0004)
+[2023-07-17 12:21:29,246][434969] Fps is (10 sec: 11059.2, 60 sec: 8426.0, 300 sec: 8426.0). Total num frames: 294912. Throughput: 0: 7893.5. Samples: 276272. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:21:29,246][434969] Avg episode reward: [(0, '105.584')]
+[2023-07-17 12:21:29,247][435240] Saving new best policy, reward=105.584!
+[2023-07-17 12:21:32,300][435284] Updated weights for policy 0, policy_version 640 (0.0006)
+[2023-07-17 12:21:34,246][434969] Fps is (10 sec: 10239.9, 60 sec: 8601.6, 300 sec: 8601.6). Total num frames: 344064. Throughput: 0: 8455.5. Samples: 338220. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:21:34,246][434969] Avg episode reward: [(0, '107.342')]
+[2023-07-17 12:21:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000672_344064.pth...
+[2023-07-17 12:21:34,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000048_24576.pth
+[2023-07-17 12:21:34,251][435240] Saving new best policy, reward=107.342!
+[2023-07-17 12:21:36,301][435284] Updated weights for policy 0, policy_version 720 (0.0005)
+[2023-07-17 12:21:39,246][434969] Fps is (10 sec: 10240.0, 60 sec: 8829.1, 300 sec: 8829.1). Total num frames: 397312. Throughput: 0: 8193.8. Samples: 368720. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:21:39,246][434969] Avg episode reward: [(0, '127.190')]
+[2023-07-17 12:21:39,247][435240] Saving new best policy, reward=127.190!
+[2023-07-17 12:21:40,173][435284] Updated weights for policy 0, policy_version 800 (0.0004)
+[2023-07-17 12:21:44,230][435284] Updated weights for policy 0, policy_version 880 (0.0004)
+[2023-07-17 12:21:44,246][434969] Fps is (10 sec: 10649.6, 60 sec: 9011.2, 300 sec: 9011.2). Total num frames: 450560. Throughput: 0: 9586.0. Samples: 431372. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:21:44,246][434969] Avg episode reward: [(0, '159.651')]
+[2023-07-17 12:21:44,247][435240] Saving new best policy, reward=159.651!
+[2023-07-17 12:21:48,429][435284] Updated weights for policy 0, policy_version 960 (0.0005)
+[2023-07-17 12:21:49,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9011.2, 300 sec: 9011.2). Total num frames: 495616. Throughput: 0: 10504.2. Samples: 490888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:21:49,246][434969] Avg episode reward: [(0, '195.628')]
+[2023-07-17 12:21:49,303][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000976_499712.pth...
+[2023-07-17 12:21:49,306][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000360_184320.pth
+[2023-07-17 12:21:49,306][435240] Saving new best policy, reward=195.628!
+[2023-07-17 12:21:52,953][435284] Updated weights for policy 0, policy_version 1040 (0.0005)
+[2023-07-17 12:21:54,246][434969] Fps is (10 sec: 9011.3, 60 sec: 9011.2, 300 sec: 9011.2). Total num frames: 540672. Throughput: 0: 10426.1. Samples: 518392. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:21:54,246][434969] Avg episode reward: [(0, '203.533')]
+[2023-07-17 12:21:54,246][435240] Saving new best policy, reward=203.533!
+[2023-07-17 12:21:57,481][435284] Updated weights for policy 0, policy_version 1120 (0.0005)
+[2023-07-17 12:21:59,246][434969] Fps is (10 sec: 9011.2, 60 sec: 9762.1, 300 sec: 9011.2). Total num frames: 585728. Throughput: 0: 10204.6. Samples: 572028. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:21:59,246][434969] Avg episode reward: [(0, '226.544')]
+[2023-07-17 12:21:59,247][435240] Saving new best policy, reward=226.544!
+[2023-07-17 12:22:02,186][435284] Updated weights for policy 0, policy_version 1200 (0.0005)
+[2023-07-17 12:22:04,246][434969] Fps is (10 sec: 9011.1, 60 sec: 10103.5, 300 sec: 9011.2). Total num frames: 630784. Throughput: 0: 9958.6. Samples: 624272. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:22:04,246][434969] Avg episode reward: [(0, '237.062')]
+[2023-07-17 12:22:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001232_630784.pth...
+[2023-07-17 12:22:04,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000672_344064.pth
+[2023-07-17 12:22:04,253][435240] Saving new best policy, reward=237.062!
+[2023-07-17 12:22:06,931][435284] Updated weights for policy 0, policy_version 1280 (0.0005)
+[2023-07-17 12:22:09,246][434969] Fps is (10 sec: 8601.6, 60 sec: 9898.7, 300 sec: 8956.6). Total num frames: 671744. Throughput: 0: 9807.6. Samples: 650508. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:22:09,246][434969] Avg episode reward: [(0, '242.246')]
+[2023-07-17 12:22:09,247][435240] Saving new best policy, reward=242.246!
+[2023-07-17 12:22:11,752][435284] Updated weights for policy 0, policy_version 1360 (0.0006)
+[2023-07-17 12:22:14,246][434969] Fps is (10 sec: 8601.7, 60 sec: 9762.1, 300 sec: 8960.0). Total num frames: 716800. Throughput: 0: 9438.1. Samples: 700984. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:22:14,246][434969] Avg episode reward: [(0, '248.368')]
+[2023-07-17 12:22:14,246][435240] Saving new best policy, reward=248.368!
+[2023-07-17 12:22:16,285][435284] Updated weights for policy 0, policy_version 1440 (0.0005)
+[2023-07-17 12:22:19,246][434969] Fps is (10 sec: 9011.1, 60 sec: 9625.6, 300 sec: 8963.0). Total num frames: 761856. Throughput: 0: 9266.0. Samples: 755188. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:22:19,246][434969] Avg episode reward: [(0, '233.551')]
+[2023-07-17 12:22:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001488_761856.pth...
+[2023-07-17 12:22:19,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000000976_499712.pth
+[2023-07-17 12:22:20,949][435284] Updated weights for policy 0, policy_version 1520 (0.0006)
+[2023-07-17 12:22:24,246][434969] Fps is (10 sec: 9011.1, 60 sec: 9420.8, 300 sec: 8965.7). Total num frames: 806912. Throughput: 0: 9185.6. Samples: 782072. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:22:24,246][434969] Avg episode reward: [(0, '237.505')]
+[2023-07-17 12:22:25,357][435284] Updated weights for policy 0, policy_version 1600 (0.0005)
+[2023-07-17 12:22:29,246][434969] Fps is (10 sec: 9011.2, 60 sec: 9284.3, 300 sec: 8968.1). Total num frames: 851968. Throughput: 0: 9031.7. Samples: 837800. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:22:29,246][434969] Avg episode reward: [(0, '252.278')]
+[2023-07-17 12:22:29,247][435240] Saving new best policy, reward=252.278!
+[2023-07-17 12:22:29,795][435284] Updated weights for policy 0, policy_version 1680 (0.0005)
+[2023-07-17 12:22:34,246][434969] Fps is (10 sec: 9011.2, 60 sec: 9216.0, 300 sec: 8970.2). Total num frames: 897024. Throughput: 0: 8913.1. Samples: 891976. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:22:34,246][434969] Avg episode reward: [(0, '254.858')]
+[2023-07-17 12:22:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001752_897024.pth...
+[2023-07-17 12:22:34,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001232_630784.pth
+[2023-07-17 12:22:34,253][435240] Saving new best policy, reward=254.858!
+[2023-07-17 12:22:34,397][435284] Updated weights for policy 0, policy_version 1760 (0.0005)
+[2023-07-17 12:22:39,059][435284] Updated weights for policy 0, policy_version 1840 (0.0005)
+[2023-07-17 12:22:39,246][434969] Fps is (10 sec: 9011.2, 60 sec: 9079.5, 300 sec: 8972.2). Total num frames: 942080. Throughput: 0: 8884.4. Samples: 918192. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:22:39,246][434969] Avg episode reward: [(0, '276.766')]
+[2023-07-17 12:22:39,247][435240] Saving new best policy, reward=276.766!
+[2023-07-17 12:22:43,598][435284] Updated weights for policy 0, policy_version 1920 (0.0005)
+[2023-07-17 12:22:44,246][434969] Fps is (10 sec: 9011.3, 60 sec: 8942.9, 300 sec: 8974.0). Total num frames: 987136. Throughput: 0: 8875.1. Samples: 971408. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:22:44,246][434969] Avg episode reward: [(0, '291.460')]
+[2023-07-17 12:22:44,247][435240] Saving new best policy, reward=291.460!
+[2023-07-17 12:22:48,147][435284] Updated weights for policy 0, policy_version 2000 (0.0006)
+[2023-07-17 12:22:49,246][434969] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 8975.6). Total num frames: 1032192. Throughput: 0: 8921.6. Samples: 1025744. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-17 12:22:49,246][434969] Avg episode reward: [(0, '304.383')]
+[2023-07-17 12:22:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002016_1032192.pth...
+[2023-07-17 12:22:49,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001488_761856.pth
+[2023-07-17 12:22:49,252][435240] Saving new best policy, reward=304.383!
+[2023-07-17 12:22:52,735][435284] Updated weights for policy 0, policy_version 2080 (0.0005)
+[2023-07-17 12:22:54,246][434969] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 8977.1). Total num frames: 1077248. Throughput: 0: 8937.1. Samples: 1052680. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:22:54,246][434969] Avg episode reward: [(0, '296.457')]
+[2023-07-17 12:22:57,386][435284] Updated weights for policy 0, policy_version 2160 (0.0005)
+[2023-07-17 12:22:59,246][434969] Fps is (10 sec: 9011.3, 60 sec: 8942.9, 300 sec: 8978.4). Total num frames: 1122304. Throughput: 0: 8998.6. Samples: 1105920. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:22:59,246][434969] Avg episode reward: [(0, '299.619')]
+[2023-07-17 12:23:01,823][435284] Updated weights for policy 0, policy_version 2240 (0.0005)
+[2023-07-17 12:23:04,246][434969] Fps is (10 sec: 9011.2, 60 sec: 8942.9, 300 sec: 8979.7). Total num frames: 1167360. Throughput: 0: 9032.4. Samples: 1161648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:04,246][434969] Avg episode reward: [(0, '300.327')]
+[2023-07-17 12:23:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002280_1167360.pth...
+[2023-07-17 12:23:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000001752_897024.pth
+[2023-07-17 12:23:06,041][435284] Updated weights for policy 0, policy_version 2320 (0.0004)
+[2023-07-17 12:23:09,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9079.5, 300 sec: 9011.2). Total num frames: 1216512. Throughput: 0: 9083.9. Samples: 1190848. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:09,246][434969] Avg episode reward: [(0, '302.091')]
+[2023-07-17 12:23:10,290][435284] Updated weights for policy 0, policy_version 2400 (0.0005)
+[2023-07-17 12:23:14,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9147.7, 300 sec: 9040.5). Total num frames: 1265664. Throughput: 0: 9128.8. Samples: 1248596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:14,246][434969] Avg episode reward: [(0, '324.619')]
+[2023-07-17 12:23:14,247][435240] Saving new best policy, reward=324.619!
+[2023-07-17 12:23:14,563][435284] Updated weights for policy 0, policy_version 2480 (0.0005)
+[2023-07-17 12:23:18,845][435284] Updated weights for policy 0, policy_version 2560 (0.0006)
+[2023-07-17 12:23:19,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9147.7, 300 sec: 9039.4). Total num frames: 1310720. Throughput: 0: 9204.6. Samples: 1306180. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:19,246][434969] Avg episode reward: [(0, '375.930')]
+[2023-07-17 12:23:19,268][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002568_1314816.pth...
+[2023-07-17 12:23:19,270][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002016_1032192.pth
+[2023-07-17 12:23:19,270][435240] Saving new best policy, reward=375.930!
+[2023-07-17 12:23:23,137][435284] Updated weights for policy 0, policy_version 2640 (0.0005)
+[2023-07-17 12:23:24,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9216.0, 300 sec: 9065.8). Total num frames: 1359872. Throughput: 0: 9269.3. Samples: 1335308. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:23:24,246][434969] Avg episode reward: [(0, '444.187')]
+[2023-07-17 12:23:24,247][435240] Saving new best policy, reward=444.187!
+[2023-07-17 12:23:27,271][435284] Updated weights for policy 0, policy_version 2720 (0.0004)
+[2023-07-17 12:23:29,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9284.3, 300 sec: 9090.5). Total num frames: 1409024. Throughput: 0: 9370.9. Samples: 1393100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:29,246][434969] Avg episode reward: [(0, '482.765')]
+[2023-07-17 12:23:29,247][435240] Saving new best policy, reward=482.765!
+[2023-07-17 12:23:31,449][435284] Updated weights for policy 0, policy_version 2800 (0.0005)
+[2023-07-17 12:23:34,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9352.5, 300 sec: 9113.6). Total num frames: 1458176. Throughput: 0: 9460.3. Samples: 1451460. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:34,246][434969] Avg episode reward: [(0, '499.350')]
+[2023-07-17 12:23:34,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002848_1458176.pth...
+[2023-07-17 12:23:34,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002280_1167360.pth
+[2023-07-17 12:23:34,253][435240] Saving new best policy, reward=499.350!
+[2023-07-17 12:23:35,690][435284] Updated weights for policy 0, policy_version 2880 (0.0005)
+[2023-07-17 12:23:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9420.8, 300 sec: 9135.3). Total num frames: 1507328. Throughput: 0: 9521.7. Samples: 1481156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:39,246][434969] Avg episode reward: [(0, '514.367')]
+[2023-07-17 12:23:39,247][435240] Saving new best policy, reward=514.367!
+[2023-07-17 12:23:39,894][435284] Updated weights for policy 0, policy_version 2960 (0.0005)
+[2023-07-17 12:23:44,163][435284] Updated weights for policy 0, policy_version 3040 (0.0005)
+[2023-07-17 12:23:44,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9489.1, 300 sec: 9155.8). Total num frames: 1556480. Throughput: 0: 9624.5. Samples: 1539024. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:23:44,246][434969] Avg episode reward: [(0, '487.909')]
+[2023-07-17 12:23:48,259][435284] Updated weights for policy 0, policy_version 3120 (0.0004)
+[2023-07-17 12:23:49,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9557.3, 300 sec: 9175.0). Total num frames: 1605632. Throughput: 0: 9698.2. Samples: 1598068. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:49,246][434969] Avg episode reward: [(0, '528.334')]
+[2023-07-17 12:23:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003136_1605632.pth...
+[2023-07-17 12:23:49,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002568_1314816.pth
+[2023-07-17 12:23:49,251][435240] Saving new best policy, reward=528.334!
+[2023-07-17 12:23:52,547][435284] Updated weights for policy 0, policy_version 3200 (0.0005)
+[2023-07-17 12:23:54,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9625.6, 300 sec: 9193.2). Total num frames: 1654784. Throughput: 0: 9686.0. Samples: 1626720. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:23:54,246][434969] Avg episode reward: [(0, '537.072')]
+[2023-07-17 12:23:54,247][435240] Saving new best policy, reward=537.072!
+[2023-07-17 12:23:56,699][435284] Updated weights for policy 0, policy_version 3280 (0.0005)
+[2023-07-17 12:23:59,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9693.8, 300 sec: 9210.5). Total num frames: 1703936. Throughput: 0: 9715.5. Samples: 1685796. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:23:59,246][434969] Avg episode reward: [(0, '538.970')]
+[2023-07-17 12:23:59,247][435240] Saving new best policy, reward=538.970!
+[2023-07-17 12:24:00,766][435284] Updated weights for policy 0, policy_version 3360 (0.0005)
+[2023-07-17 12:24:04,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9226.8). Total num frames: 1753088. Throughput: 0: 9756.7. Samples: 1745232. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:04,246][434969] Avg episode reward: [(0, '551.515')]
+[2023-07-17 12:24:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003424_1753088.pth...
+[2023-07-17 12:24:04,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000002848_1458176.pth
+[2023-07-17 12:24:04,253][435240] Saving new best policy, reward=551.515!
+[2023-07-17 12:24:05,025][435284] Updated weights for policy 0, policy_version 3440 (0.0005)
+[2023-07-17 12:24:09,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9221.3). Total num frames: 1798144. Throughput: 0: 9740.7. Samples: 1773640. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:24:09,246][434969] Avg episode reward: [(0, '565.114')]
+[2023-07-17 12:24:09,246][435240] Saving new best policy, reward=565.114!
+[2023-07-17 12:24:09,307][435284] Updated weights for policy 0, policy_version 3520 (0.0005)
+[2023-07-17 12:24:13,397][435284] Updated weights for policy 0, policy_version 3600 (0.0005)
+[2023-07-17 12:24:14,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9257.0). Total num frames: 1851392. Throughput: 0: 9766.6. Samples: 1832600. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:14,246][434969] Avg episode reward: [(0, '530.433')]
+[2023-07-17 12:24:17,508][435284] Updated weights for policy 0, policy_version 3680 (0.0006)
+[2023-07-17 12:24:19,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9270.9). Total num frames: 1900544. Throughput: 0: 9799.0. Samples: 1892416. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:24:19,246][434969] Avg episode reward: [(0, '552.429')]
+[2023-07-17 12:24:19,248][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003712_1900544.pth...
+[2023-07-17 12:24:19,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003136_1605632.pth
+[2023-07-17 12:24:21,558][435284] Updated weights for policy 0, policy_version 3760 (0.0005)
+[2023-07-17 12:24:24,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9284.3). Total num frames: 1949696. Throughput: 0: 9812.4. Samples: 1922712. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:24:24,246][434969] Avg episode reward: [(0, '549.298')]
+[2023-07-17 12:24:25,639][435284] Updated weights for policy 0, policy_version 3840 (0.0005)
+[2023-07-17 12:24:29,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9297.0). Total num frames: 1998848. Throughput: 0: 9854.2. Samples: 1982464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:29,246][434969] Avg episode reward: [(0, '553.729')]
+[2023-07-17 12:24:30,012][435284] Updated weights for policy 0, policy_version 3920 (0.0006)
+[2023-07-17 12:24:34,123][435284] Updated weights for policy 0, policy_version 4000 (0.0005)
+[2023-07-17 12:24:34,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9309.1). Total num frames: 2048000. Throughput: 0: 9829.2. Samples: 2040384. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:34,246][434969] Avg episode reward: [(0, '533.560')]
+[2023-07-17 12:24:34,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004000_2048000.pth...
+[2023-07-17 12:24:34,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003424_1753088.pth
+[2023-07-17 12:24:38,309][435284] Updated weights for policy 0, policy_version 4080 (0.0005)
+[2023-07-17 12:24:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9320.7). Total num frames: 2097152. Throughput: 0: 9840.4. Samples: 2069540. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:39,246][434969] Avg episode reward: [(0, '542.025')]
+[2023-07-17 12:24:42,436][435284] Updated weights for policy 0, policy_version 4160 (0.0005)
+[2023-07-17 12:24:44,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9331.8). Total num frames: 2146304. Throughput: 0: 9860.1. Samples: 2129500. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:24:44,246][434969] Avg episode reward: [(0, '588.223')]
+[2023-07-17 12:24:44,247][435240] Saving new best policy, reward=588.223!
+[2023-07-17 12:24:46,607][435284] Updated weights for policy 0, policy_version 4240 (0.0005)
+[2023-07-17 12:24:49,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9342.4). Total num frames: 2195456. Throughput: 0: 9824.3. Samples: 2187328. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:49,246][434969] Avg episode reward: [(0, '572.316')]
+[2023-07-17 12:24:49,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004288_2195456.pth...
+[2023-07-17 12:24:49,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000003712_1900544.pth
+[2023-07-17 12:24:50,971][435284] Updated weights for policy 0, policy_version 4320 (0.0005)
+[2023-07-17 12:24:54,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9335.5). Total num frames: 2240512. Throughput: 0: 9823.4. Samples: 2215692. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:24:54,246][434969] Avg episode reward: [(0, '549.161')]
+[2023-07-17 12:24:55,267][435284] Updated weights for policy 0, policy_version 4400 (0.0005)
+[2023-07-17 12:24:59,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9762.1, 300 sec: 9345.6). Total num frames: 2289664. Throughput: 0: 9794.3. Samples: 2273344. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:24:59,246][434969] Avg episode reward: [(0, '534.821')]
+[2023-07-17 12:24:59,326][435284] Updated weights for policy 0, policy_version 4480 (0.0004)
+[2023-07-17 12:25:03,469][435284] Updated weights for policy 0, policy_version 4560 (0.0005)
+[2023-07-17 12:25:04,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9355.3). Total num frames: 2338816. Throughput: 0: 9805.1. Samples: 2333644. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:25:04,246][434969] Avg episode reward: [(0, '549.560')]
+[2023-07-17 12:25:04,289][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004576_2342912.pth...
+[2023-07-17 12:25:04,292][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004000_2048000.pth
+[2023-07-17 12:25:07,722][435284] Updated weights for policy 0, policy_version 4640 (0.0005)
+[2023-07-17 12:25:09,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9364.6). Total num frames: 2387968. Throughput: 0: 9780.8. Samples: 2362848. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:25:09,246][434969] Avg episode reward: [(0, '531.665')]
+[2023-07-17 12:25:11,929][435284] Updated weights for policy 0, policy_version 4720 (0.0006)
+[2023-07-17 12:25:14,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9762.2, 300 sec: 9373.5). Total num frames: 2437120. Throughput: 0: 9739.6. Samples: 2420744. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:25:14,246][434969] Avg episode reward: [(0, '581.135')]
+[2023-07-17 12:25:16,097][435284] Updated weights for policy 0, policy_version 4800 (0.0005)
+[2023-07-17 12:25:19,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9762.1, 300 sec: 9382.2). Total num frames: 2486272. Throughput: 0: 9752.7. Samples: 2479256. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:25:19,246][434969] Avg episode reward: [(0, '580.744')]
+[2023-07-17 12:25:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004856_2486272.pth...
+[2023-07-17 12:25:19,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004288_2195456.pth
+[2023-07-17 12:25:20,370][435284] Updated weights for policy 0, policy_version 4880 (0.0005)
+[2023-07-17 12:25:24,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9375.3). Total num frames: 2531328. Throughput: 0: 9740.4. Samples: 2507860. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:25:24,246][434969] Avg episode reward: [(0, '555.974')]
+[2023-07-17 12:25:24,706][435284] Updated weights for policy 0, policy_version 4960 (0.0005)
+[2023-07-17 12:25:28,993][435284] Updated weights for policy 0, policy_version 5040 (0.0005)
+[2023-07-17 12:25:29,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9383.6). Total num frames: 2580480. Throughput: 0: 9667.7. Samples: 2564548. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:25:29,246][434969] Avg episode reward: [(0, '579.598')]
+[2023-07-17 12:25:33,298][435284] Updated weights for policy 0, policy_version 5120 (0.0004)
+[2023-07-17 12:25:34,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9391.5). Total num frames: 2629632. Throughput: 0: 9649.3. Samples: 2621544. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:25:34,246][434969] Avg episode reward: [(0, '576.264')]
+[2023-07-17 12:25:34,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005136_2629632.pth...
+[2023-07-17 12:25:34,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004576_2342912.pth
+[2023-07-17 12:25:37,605][435284] Updated weights for policy 0, policy_version 5200 (0.0005)
+[2023-07-17 12:25:39,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9384.9). Total num frames: 2674688. Throughput: 0: 9655.2. Samples: 2650176. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:25:39,246][434969] Avg episode reward: [(0, '526.950')]
+[2023-07-17 12:25:41,791][435284] Updated weights for policy 0, policy_version 5280 (0.0005)
+[2023-07-17 12:25:44,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9625.6, 300 sec: 9392.6). Total num frames: 2723840. Throughput: 0: 9665.8. Samples: 2708304. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:25:44,246][434969] Avg episode reward: [(0, '533.242')]
+[2023-07-17 12:25:45,971][435284] Updated weights for policy 0, policy_version 5360 (0.0005)
+[2023-07-17 12:25:49,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9625.6, 300 sec: 9400.0). Total num frames: 2772992. Throughput: 0: 9644.4. Samples: 2767644. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:25:49,246][434969] Avg episode reward: [(0, '554.496')]
+[2023-07-17 12:25:49,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005416_2772992.pth...
+[2023-07-17 12:25:49,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000004856_2486272.pth
+[2023-07-17 12:25:50,189][435284] Updated weights for policy 0, policy_version 5440 (0.0005)
+[2023-07-17 12:25:54,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9566.6). Total num frames: 2822144. Throughput: 0: 9639.0. Samples: 2796600. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:25:54,246][434969] Avg episode reward: [(0, '540.008')]
+[2023-07-17 12:25:54,500][435284] Updated weights for policy 0, policy_version 5520 (0.0005)
+[2023-07-17 12:25:58,783][435284] Updated weights for policy 0, policy_version 5600 (0.0005)
+[2023-07-17 12:25:59,246][434969] Fps is (10 sec: 9830.6, 60 sec: 9693.9, 300 sec: 9649.9). Total num frames: 2871296. Throughput: 0: 9611.7. Samples: 2853272. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:25:59,246][434969] Avg episode reward: [(0, '579.888')]
+[2023-07-17 12:26:03,024][435284] Updated weights for policy 0, policy_version 5680 (0.0006)
+[2023-07-17 12:26:04,246][434969] Fps is (10 sec: 9420.7, 60 sec: 9625.6, 300 sec: 9622.1). Total num frames: 2916352. Throughput: 0: 9605.1. Samples: 2911484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:04,246][434969] Avg episode reward: [(0, '606.656')]
+[2023-07-17 12:26:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005696_2916352.pth...
+[2023-07-17 12:26:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005136_2629632.pth
+[2023-07-17 12:26:04,251][435240] Saving new best policy, reward=606.656!
+[2023-07-17 12:26:07,235][435284] Updated weights for policy 0, policy_version 5760 (0.0005)
+[2023-07-17 12:26:09,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9625.6, 300 sec: 9608.2). Total num frames: 2965504. Throughput: 0: 9616.2. Samples: 2940588. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:26:09,246][434969] Avg episode reward: [(0, '573.050')]
+[2023-07-17 12:26:11,307][435284] Updated weights for policy 0, policy_version 5840 (0.0005)
+[2023-07-17 12:26:14,246][434969] Fps is (10 sec: 10239.9, 60 sec: 9693.9, 300 sec: 9608.2). Total num frames: 3018752. Throughput: 0: 9678.8. Samples: 3000096. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:14,246][434969] Avg episode reward: [(0, '600.134')]
+[2023-07-17 12:26:15,452][435284] Updated weights for policy 0, policy_version 5920 (0.0005)
+[2023-07-17 12:26:19,246][434969] Fps is (10 sec: 10239.9, 60 sec: 9693.9, 300 sec: 9580.5). Total num frames: 3067904. Throughput: 0: 9737.0. Samples: 3059708. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:19,246][434969] Avg episode reward: [(0, '599.052')]
+[2023-07-17 12:26:19,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005992_3067904.pth...
+[2023-07-17 12:26:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005416_2772992.pth
+[2023-07-17 12:26:19,628][435284] Updated weights for policy 0, policy_version 6000 (0.0005)
+[2023-07-17 12:26:23,854][435284] Updated weights for policy 0, policy_version 6080 (0.0005)
+[2023-07-17 12:26:24,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 3112960. Throughput: 0: 9738.1. Samples: 3088392. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:24,246][434969] Avg episode reward: [(0, '625.150')]
+[2023-07-17 12:26:24,266][435240] Saving new best policy, reward=625.150!
+[2023-07-17 12:26:28,150][435284] Updated weights for policy 0, policy_version 6160 (0.0005)
+[2023-07-17 12:26:29,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9693.9, 300 sec: 9552.7). Total num frames: 3162112. Throughput: 0: 9729.2. Samples: 3146120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:29,246][434969] Avg episode reward: [(0, '512.957')]
+[2023-07-17 12:26:32,356][435284] Updated weights for policy 0, policy_version 6240 (0.0005)
+[2023-07-17 12:26:34,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9693.9, 300 sec: 9538.8). Total num frames: 3211264. Throughput: 0: 9710.8. Samples: 3204628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:34,246][434969] Avg episode reward: [(0, '620.229')]
+[2023-07-17 12:26:34,271][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006272_3211264.pth...
+[2023-07-17 12:26:34,274][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005696_2916352.pth
+[2023-07-17 12:26:36,479][435284] Updated weights for policy 0, policy_version 6320 (0.0004)
+[2023-07-17 12:26:39,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9524.9). Total num frames: 3260416. Throughput: 0: 9733.2. Samples: 3234592. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:26:39,246][434969] Avg episode reward: [(0, '602.976')]
+[2023-07-17 12:26:40,475][435284] Updated weights for policy 0, policy_version 6400 (0.0004)
+[2023-07-17 12:26:44,246][434969] Fps is (10 sec: 10240.1, 60 sec: 9830.4, 300 sec: 9552.7). Total num frames: 3313664. Throughput: 0: 9826.0. Samples: 3295444. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:26:44,246][434969] Avg episode reward: [(0, '613.567')]
+[2023-07-17 12:26:44,677][435284] Updated weights for policy 0, policy_version 6480 (0.0005)
+[2023-07-17 12:26:48,859][435284] Updated weights for policy 0, policy_version 6560 (0.0005)
+[2023-07-17 12:26:49,246][434969] Fps is (10 sec: 10239.9, 60 sec: 9830.4, 300 sec: 9566.6). Total num frames: 3362816. Throughput: 0: 9823.8. Samples: 3353556. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:26:49,246][434969] Avg episode reward: [(0, '608.769')]
+[2023-07-17 12:26:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006568_3362816.pth...
+[2023-07-17 12:26:49,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000005992_3067904.pth
+[2023-07-17 12:26:53,039][435284] Updated weights for policy 0, policy_version 6640 (0.0005)
+[2023-07-17 12:26:54,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9580.5). Total num frames: 3411968. Throughput: 0: 9838.1. Samples: 3383304. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:26:54,246][434969] Avg episode reward: [(0, '603.095')]
+[2023-07-17 12:26:57,264][435284] Updated weights for policy 0, policy_version 6720 (0.0005)
+[2023-07-17 12:26:59,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9594.4). Total num frames: 3461120. Throughput: 0: 9802.6. Samples: 3441212. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:26:59,246][434969] Avg episode reward: [(0, '631.755')]
+[2023-07-17 12:26:59,247][435240] Saving new best policy, reward=631.755!
+[2023-07-17 12:27:01,313][435284] Updated weights for policy 0, policy_version 6800 (0.0005)
+[2023-07-17 12:27:04,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9608.2). Total num frames: 3506176. Throughput: 0: 9814.0. Samples: 3501336. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:27:04,246][434969] Avg episode reward: [(0, '619.386')]
+[2023-07-17 12:27:04,267][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006856_3510272.pth...
+[2023-07-17 12:27:04,269][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006272_3211264.pth
+[2023-07-17 12:27:05,509][435284] Updated weights for policy 0, policy_version 6880 (0.0005)
+[2023-07-17 12:27:09,246][434969] Fps is (10 sec: 9420.7, 60 sec: 9830.4, 300 sec: 9622.1). Total num frames: 3555328. Throughput: 0: 9830.4. Samples: 3530760. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:09,246][434969] Avg episode reward: [(0, '616.417')]
+[2023-07-17 12:27:09,832][435284] Updated weights for policy 0, policy_version 6960 (0.0005)
+[2023-07-17 12:27:14,041][435284] Updated weights for policy 0, policy_version 7040 (0.0006)
+[2023-07-17 12:27:14,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9762.2, 300 sec: 9636.0). Total num frames: 3604480. Throughput: 0: 9823.1. Samples: 3588160. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:27:14,246][434969] Avg episode reward: [(0, '616.046')]
+[2023-07-17 12:27:18,294][435284] Updated weights for policy 0, policy_version 7120 (0.0005)
+[2023-07-17 12:27:19,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9762.2, 300 sec: 9649.9). Total num frames: 3653632. Throughput: 0: 9799.1. Samples: 3645588. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:27:19,246][434969] Avg episode reward: [(0, '620.965')]
+[2023-07-17 12:27:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007136_3653632.pth...
+[2023-07-17 12:27:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006568_3362816.pth
+[2023-07-17 12:27:22,385][435284] Updated weights for policy 0, policy_version 7200 (0.0005)
+[2023-07-17 12:27:24,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9663.8). Total num frames: 3702784. Throughput: 0: 9809.3. Samples: 3676012. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:24,246][434969] Avg episode reward: [(0, '633.483')]
+[2023-07-17 12:27:24,247][435240] Saving new best policy, reward=633.483!
+[2023-07-17 12:27:26,539][435284] Updated weights for policy 0, policy_version 7280 (0.0005)
+[2023-07-17 12:27:29,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9677.7). Total num frames: 3751936. Throughput: 0: 9779.7. Samples: 3735532. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:29,246][434969] Avg episode reward: [(0, '621.373')]
+[2023-07-17 12:27:30,790][435284] Updated weights for policy 0, policy_version 7360 (0.0006)
+[2023-07-17 12:27:34,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9691.6). Total num frames: 3801088. Throughput: 0: 9763.1. Samples: 3792896. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:34,246][434969] Avg episode reward: [(0, '628.521')]
+[2023-07-17 12:27:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007424_3801088.pth...
+[2023-07-17 12:27:34,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000006856_3510272.pth
+[2023-07-17 12:27:35,063][435284] Updated weights for policy 0, policy_version 7440 (0.0005)
+[2023-07-17 12:27:39,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9762.1, 300 sec: 9691.6). Total num frames: 3846144. Throughput: 0: 9739.5. Samples: 3821580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:39,246][434969] Avg episode reward: [(0, '633.192')]
+[2023-07-17 12:27:39,257][435284] Updated weights for policy 0, policy_version 7520 (0.0005)
+[2023-07-17 12:27:43,485][435284] Updated weights for policy 0, policy_version 7600 (0.0005)
+[2023-07-17 12:27:44,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9693.9, 300 sec: 9705.4). Total num frames: 3895296. Throughput: 0: 9739.9. Samples: 3879508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:44,246][434969] Avg episode reward: [(0, '640.345')]
+[2023-07-17 12:27:44,247][435240] Saving new best policy, reward=640.345!
+[2023-07-17 12:27:47,743][435284] Updated weights for policy 0, policy_version 7680 (0.0005)
+[2023-07-17 12:27:49,246][434969] Fps is (10 sec: 9830.2, 60 sec: 9693.9, 300 sec: 9719.3). Total num frames: 3944448. Throughput: 0: 9696.9. Samples: 3937696. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:27:49,246][434969] Avg episode reward: [(0, '646.761')]
+[2023-07-17 12:27:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007704_3944448.pth...
+[2023-07-17 12:27:49,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007136_3653632.pth
+[2023-07-17 12:27:49,251][435240] Saving new best policy, reward=646.761!
+[2023-07-17 12:27:51,897][435284] Updated weights for policy 0, policy_version 7760 (0.0005)
+[2023-07-17 12:27:54,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9733.2). Total num frames: 3993600. Throughput: 0: 9703.7. Samples: 3967424. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:54,246][434969] Avg episode reward: [(0, '619.751')]
+[2023-07-17 12:27:56,103][435284] Updated weights for policy 0, policy_version 7840 (0.0005)
+[2023-07-17 12:27:59,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9693.9, 300 sec: 9747.1). Total num frames: 4042752. Throughput: 0: 9736.6. Samples: 4026308. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:27:59,246][434969] Avg episode reward: [(0, '590.655')]
+[2023-07-17 12:28:00,267][435284] Updated weights for policy 0, policy_version 7920 (0.0005)
+[2023-07-17 12:28:04,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 4091904. Throughput: 0: 9749.7. Samples: 4084324. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:04,246][434969] Avg episode reward: [(0, '612.268')]
+[2023-07-17 12:28:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007992_4091904.pth...
+[2023-07-17 12:28:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007424_3801088.pth
+[2023-07-17 12:28:04,484][435284] Updated weights for policy 0, policy_version 8000 (0.0005)
+[2023-07-17 12:28:08,664][435284] Updated weights for policy 0, policy_version 8080 (0.0005)
+[2023-07-17 12:28:09,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9747.1). Total num frames: 4141056. Throughput: 0: 9731.3. Samples: 4113920. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:28:09,246][434969] Avg episode reward: [(0, '610.932')]
+[2023-07-17 12:28:12,856][435284] Updated weights for policy 0, policy_version 8160 (0.0005)
+[2023-07-17 12:28:14,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 4190208. Throughput: 0: 9729.0. Samples: 4173336. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:14,246][434969] Avg episode reward: [(0, '605.293')]
+[2023-07-17 12:28:16,854][435284] Updated weights for policy 0, policy_version 8240 (0.0005)
+[2023-07-17 12:28:19,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4243456. Throughput: 0: 9806.6. Samples: 4234192. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:19,246][434969] Avg episode reward: [(0, '600.709')]
+[2023-07-17 12:28:19,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008288_4243456.pth...
+[2023-07-17 12:28:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007704_3944448.pth
+[2023-07-17 12:28:20,823][435284] Updated weights for policy 0, policy_version 8320 (0.0004)
+[2023-07-17 12:28:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4292608. Throughput: 0: 9844.0. Samples: 4264560. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:28:24,246][434969] Avg episode reward: [(0, '631.402')]
+[2023-07-17 12:28:25,031][435284] Updated weights for policy 0, policy_version 8400 (0.0005)
+[2023-07-17 12:28:29,124][435284] Updated weights for policy 0, policy_version 8480 (0.0005)
+[2023-07-17 12:28:29,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4341760. Throughput: 0: 9895.5. Samples: 4324804. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:28:29,246][434969] Avg episode reward: [(0, '642.307')]
+[2023-07-17 12:28:33,375][435284] Updated weights for policy 0, policy_version 8560 (0.0006)
+[2023-07-17 12:28:34,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4390912. Throughput: 0: 9889.5. Samples: 4382720. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:28:34,246][434969] Avg episode reward: [(0, '635.010')]
+[2023-07-17 12:28:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008576_4390912.pth...
+[2023-07-17 12:28:34,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000007992_4091904.pth
+[2023-07-17 12:28:37,551][435284] Updated weights for policy 0, policy_version 8640 (0.0006)
+[2023-07-17 12:28:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9774.9). Total num frames: 4440064. Throughput: 0: 9869.6. Samples: 4411556. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-17 12:28:39,246][434969] Avg episode reward: [(0, '640.820')]
+[2023-07-17 12:28:41,681][435284] Updated weights for policy 0, policy_version 8720 (0.0005)
+[2023-07-17 12:28:44,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9774.9). Total num frames: 4489216. Throughput: 0: 9881.5. Samples: 4470976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:44,246][434969] Avg episode reward: [(0, '625.264')]
+[2023-07-17 12:28:45,913][435284] Updated weights for policy 0, policy_version 8800 (0.0005)
+[2023-07-17 12:28:49,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 4534272. Throughput: 0: 9896.1. Samples: 4529648. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:49,246][434969] Avg episode reward: [(0, '649.318')]
+[2023-07-17 12:28:49,265][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008864_4538368.pth...
+[2023-07-17 12:28:49,267][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008288_4243456.pth
+[2023-07-17 12:28:49,267][435240] Saving new best policy, reward=649.318!
+[2023-07-17 12:28:50,120][435284] Updated weights for policy 0, policy_version 8880 (0.0005)
+[2023-07-17 12:28:54,246][434969] Fps is (10 sec: 9420.7, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 4583424. Throughput: 0: 9877.4. Samples: 4558404. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:54,246][434969] Avg episode reward: [(0, '641.727')]
+[2023-07-17 12:28:54,416][435284] Updated weights for policy 0, policy_version 8960 (0.0005)
+[2023-07-17 12:28:58,574][435284] Updated weights for policy 0, policy_version 9040 (0.0005)
+[2023-07-17 12:28:59,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 4632576. Throughput: 0: 9842.8. Samples: 4616264. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:28:59,246][434969] Avg episode reward: [(0, '646.011')]
+[2023-07-17 12:29:02,745][435284] Updated weights for policy 0, policy_version 9120 (0.0005)
+[2023-07-17 12:29:04,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4681728. Throughput: 0: 9802.5. Samples: 4675304. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:29:04,246][434969] Avg episode reward: [(0, '632.751')]
+[2023-07-17 12:29:04,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009144_4681728.pth...
+[2023-07-17 12:29:04,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008576_4390912.pth
+[2023-07-17 12:29:06,955][435284] Updated weights for policy 0, policy_version 9200 (0.0005)
+[2023-07-17 12:29:09,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 4730880. Throughput: 0: 9773.5. Samples: 4704368. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:29:09,246][434969] Avg episode reward: [(0, '636.110')]
+[2023-07-17 12:29:10,955][435284] Updated weights for policy 0, policy_version 9280 (0.0004)
+[2023-07-17 12:29:14,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9761.0). Total num frames: 4780032. Throughput: 0: 9775.5. Samples: 4764700. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:29:14,246][434969] Avg episode reward: [(0, '637.292')]
+[2023-07-17 12:29:15,185][435284] Updated weights for policy 0, policy_version 9360 (0.0005)
+[2023-07-17 12:29:19,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9762.2, 300 sec: 9761.0). Total num frames: 4829184. Throughput: 0: 9797.8. Samples: 4823620. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:29:19,246][434969] Avg episode reward: [(0, '645.790')]
+[2023-07-17 12:29:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009432_4829184.pth...
+[2023-07-17 12:29:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000008864_4538368.pth
+[2023-07-17 12:29:19,314][435284] Updated weights for policy 0, policy_version 9440 (0.0005)
+[2023-07-17 12:29:23,479][435284] Updated weights for policy 0, policy_version 9520 (0.0005)
+[2023-07-17 12:29:24,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9762.1, 300 sec: 9761.0). Total num frames: 4878336. Throughput: 0: 9821.6. Samples: 4853528. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:29:24,246][434969] Avg episode reward: [(0, '648.974')]
+[2023-07-17 12:29:27,488][435284] Updated weights for policy 0, policy_version 9600 (0.0005)
+[2023-07-17 12:29:29,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4931584. Throughput: 0: 9838.2. Samples: 4913696. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:29:29,246][434969] Avg episode reward: [(0, '627.181')]
+[2023-07-17 12:29:31,597][435284] Updated weights for policy 0, policy_version 9680 (0.0005)
+[2023-07-17 12:29:34,246][434969] Fps is (10 sec: 10240.1, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 4980736. Throughput: 0: 9878.4. Samples: 4974176. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:29:34,246][434969] Avg episode reward: [(0, '645.396')]
+[2023-07-17 12:29:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009728_4980736.pth...
+[2023-07-17 12:29:34,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009144_4681728.pth
+[2023-07-17 12:29:35,655][435284] Updated weights for policy 0, policy_version 9760 (0.0004)
+[2023-07-17 12:29:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 5029888. Throughput: 0: 9893.3. Samples: 5003600. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:29:39,246][434969] Avg episode reward: [(0, '635.052')]
+[2023-07-17 12:29:39,872][435284] Updated weights for policy 0, policy_version 9840 (0.0005)
+[2023-07-17 12:29:44,176][435284] Updated weights for policy 0, policy_version 9920 (0.0005)
+[2023-07-17 12:29:44,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 5079040. Throughput: 0: 9899.7. Samples: 5061748. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:29:44,246][434969] Avg episode reward: [(0, '640.793')]
+[2023-07-17 12:29:48,371][435284] Updated weights for policy 0, policy_version 10000 (0.0005)
+[2023-07-17 12:29:49,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 5128192. Throughput: 0: 9882.3. Samples: 5120008. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:29:49,246][434969] Avg episode reward: [(0, '610.901')]
+[2023-07-17 12:29:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010016_5128192.pth...
+[2023-07-17 12:29:49,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009432_4829184.pth
+[2023-07-17 12:29:52,622][435284] Updated weights for policy 0, policy_version 10080 (0.0006)
+[2023-07-17 12:29:53,063][435240] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000001
+[2023-07-17 12:29:54,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 5173248. Throughput: 0: 9874.9. Samples: 5148736. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:29:54,246][434969] Avg episode reward: [(0, '599.341')]
+[2023-07-17 12:29:56,849][435284] Updated weights for policy 0, policy_version 10160 (0.0005)
+[2023-07-17 12:29:59,246][434969] Fps is (10 sec: 9420.8, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 5222400. Throughput: 0: 9818.8. Samples: 5206548. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:29:59,246][434969] Avg episode reward: [(0, '642.863')]
+[2023-07-17 12:30:00,949][435284] Updated weights for policy 0, policy_version 10240 (0.0005)
+[2023-07-17 12:30:04,246][434969] Fps is (10 sec: 10239.9, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 5275648. Throughput: 0: 9864.4. Samples: 5267520. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:04,246][434969] Avg episode reward: [(0, '629.115')]
+[2023-07-17 12:30:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010304_5275648.pth...
+[2023-07-17 12:30:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000009728_4980736.pth
+[2023-07-17 12:30:04,975][435284] Updated weights for policy 0, policy_version 10320 (0.0004)
+[2023-07-17 12:30:09,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9830.4, 300 sec: 9774.9). Total num frames: 5320704. Throughput: 0: 9846.2. Samples: 5296604. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:09,246][434969] Avg episode reward: [(0, '628.908')]
+[2023-07-17 12:30:09,262][435284] Updated weights for policy 0, policy_version 10400 (0.0005)
+[2023-07-17 12:30:13,289][435284] Updated weights for policy 0, policy_version 10480 (0.0004)
+[2023-07-17 12:30:14,246][434969] Fps is (10 sec: 9830.6, 60 sec: 9898.7, 300 sec: 9788.7). Total num frames: 5373952. Throughput: 0: 9827.8. Samples: 5355948. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:14,246][434969] Avg episode reward: [(0, '621.073')]
+[2023-07-17 12:30:17,382][435284] Updated weights for policy 0, policy_version 10560 (0.0005)
+[2023-07-17 12:30:19,246][434969] Fps is (10 sec: 10239.9, 60 sec: 9898.7, 300 sec: 9802.6). Total num frames: 5423104. Throughput: 0: 9823.4. Samples: 5416228. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:19,246][434969] Avg episode reward: [(0, '609.266')]
+[2023-07-17 12:30:19,248][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010592_5423104.pth...
+[2023-07-17 12:30:19,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010016_5128192.pth
+[2023-07-17 12:30:21,363][435284] Updated weights for policy 0, policy_version 10640 (0.0005)
+[2023-07-17 12:30:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9967.0, 300 sec: 9816.5). Total num frames: 5476352. Throughput: 0: 9864.1. Samples: 5447484. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:24,246][434969] Avg episode reward: [(0, '612.175')]
+[2023-07-17 12:30:25,453][435284] Updated weights for policy 0, policy_version 10720 (0.0004)
+[2023-07-17 12:30:29,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9816.5). Total num frames: 5525504. Throughput: 0: 9903.0. Samples: 5507384. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:30:29,246][434969] Avg episode reward: [(0, '621.964')]
+[2023-07-17 12:30:29,544][435284] Updated weights for policy 0, policy_version 10800 (0.0005)
+[2023-07-17 12:30:33,699][435284] Updated weights for policy 0, policy_version 10880 (0.0005)
+[2023-07-17 12:30:34,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9830.4). Total num frames: 5574656. Throughput: 0: 9922.8. Samples: 5566536. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:30:34,246][434969] Avg episode reward: [(0, '620.050')]
+[2023-07-17 12:30:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010888_5574656.pth...
+[2023-07-17 12:30:34,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010304_5275648.pth
+[2023-07-17 12:30:37,992][435284] Updated weights for policy 0, policy_version 10960 (0.0005)
+[2023-07-17 12:30:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9830.4). Total num frames: 5623808. Throughput: 0: 9930.7. Samples: 5595616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:39,246][434969] Avg episode reward: [(0, '626.391')]
+[2023-07-17 12:30:42,129][435284] Updated weights for policy 0, policy_version 11040 (0.0004)
+[2023-07-17 12:30:44,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9898.7, 300 sec: 9830.4). Total num frames: 5672960. Throughput: 0: 9955.5. Samples: 5654548. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-17 12:30:44,246][434969] Avg episode reward: [(0, '609.347')]
+[2023-07-17 12:30:46,194][435284] Updated weights for policy 0, policy_version 11120 (0.0005)
+[2023-07-17 12:30:49,246][434969] Fps is (10 sec: 9830.3, 60 sec: 9898.7, 300 sec: 9830.4). Total num frames: 5722112. Throughput: 0: 9955.2. Samples: 5715504. Policy #0 lag: (min: 4.0, avg: 4.0, max: 4.0)
+[2023-07-17 12:30:49,246][434969] Avg episode reward: [(0, '610.109')]
+[2023-07-17 12:30:49,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011176_5722112.pth...
+[2023-07-17 12:30:49,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010592_5423104.pth
+[2023-07-17 12:30:50,215][435284] Updated weights for policy 0, policy_version 11200 (0.0004)
+[2023-07-17 12:30:54,246][434969] Fps is (10 sec: 9830.4, 60 sec: 9966.9, 300 sec: 9830.4). Total num frames: 5771264. Throughput: 0: 9978.2. Samples: 5745624. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:54,246][434969] Avg episode reward: [(0, '592.255')]
+[2023-07-17 12:30:54,337][435284] Updated weights for policy 0, policy_version 11280 (0.0005)
+[2023-07-17 12:30:58,418][435284] Updated weights for policy 0, policy_version 11360 (0.0005)
+[2023-07-17 12:30:59,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9966.9, 300 sec: 9844.3). Total num frames: 5820416. Throughput: 0: 9991.4. Samples: 5805560. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:30:59,246][434969] Avg episode reward: [(0, '613.891')]
+[2023-07-17 12:31:02,605][435284] Updated weights for policy 0, policy_version 11440 (0.0005)
+[2023-07-17 12:31:04,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9858.2). Total num frames: 5873664. Throughput: 0: 9966.7. Samples: 5864732. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:04,246][434969] Avg episode reward: [(0, '598.550')]
+[2023-07-17 12:31:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011472_5873664.pth...
+[2023-07-17 12:31:04,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000010888_5574656.pth
+[2023-07-17 12:31:06,684][435284] Updated weights for policy 0, policy_version 11520 (0.0005)
+[2023-07-17 12:31:09,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9844.3). Total num frames: 5922816. Throughput: 0: 9936.2. Samples: 5894612. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:09,246][434969] Avg episode reward: [(0, '609.483')]
+[2023-07-17 12:31:10,876][435284] Updated weights for policy 0, policy_version 11600 (0.0005)
+[2023-07-17 12:31:14,246][434969] Fps is (10 sec: 9420.9, 60 sec: 9898.7, 300 sec: 9830.4). Total num frames: 5967872. Throughput: 0: 9897.3. Samples: 5952764. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:14,246][434969] Avg episode reward: [(0, '597.759')]
+[2023-07-17 12:31:15,149][435284] Updated weights for policy 0, policy_version 11680 (0.0005)
+[2023-07-17 12:31:19,246][434969] Fps is (10 sec: 9420.7, 60 sec: 9898.7, 300 sec: 9844.3). Total num frames: 6017024. Throughput: 0: 9902.1. Samples: 6012132. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:19,246][434969] Avg episode reward: [(0, '600.561')]
+[2023-07-17 12:31:19,267][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011760_6021120.pth...
+[2023-07-17 12:31:19,267][435284] Updated weights for policy 0, policy_version 11760 (0.0005)
+[2023-07-17 12:31:19,269][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011176_5722112.pth
+[2023-07-17 12:31:23,254][435284] Updated weights for policy 0, policy_version 11840 (0.0004)
+[2023-07-17 12:31:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9898.7, 300 sec: 9858.2). Total num frames: 6070272. Throughput: 0: 9923.1. Samples: 6042156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:24,246][434969] Avg episode reward: [(0, '629.099')]
+[2023-07-17 12:31:27,368][435284] Updated weights for policy 0, policy_version 11920 (0.0005)
+[2023-07-17 12:31:29,246][434969] Fps is (10 sec: 10240.1, 60 sec: 9898.7, 300 sec: 9858.2). Total num frames: 6119424. Throughput: 0: 9966.5. Samples: 6103040. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:29,246][434969] Avg episode reward: [(0, '618.795')]
+[2023-07-17 12:31:31,439][435284] Updated weights for policy 0, policy_version 12000 (0.0005)
+[2023-07-17 12:31:34,246][434969] Fps is (10 sec: 10240.1, 60 sec: 9967.0, 300 sec: 9872.1). Total num frames: 6172672. Throughput: 0: 9969.3. Samples: 6164120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:34,246][434969] Avg episode reward: [(0, '633.229')]
+[2023-07-17 12:31:34,248][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012056_6172672.pth...
+[2023-07-17 12:31:34,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011472_5873664.pth
+[2023-07-17 12:31:35,377][435284] Updated weights for policy 0, policy_version 12080 (0.0004)
+[2023-07-17 12:31:39,246][434969] Fps is (10 sec: 10240.0, 60 sec: 9966.9, 300 sec: 9858.2). Total num frames: 6221824. Throughput: 0: 9991.1. Samples: 6195224. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:31:39,246][434969] Avg episode reward: [(0, '624.037')]
+[2023-07-17 12:31:39,342][435284] Updated weights for policy 0, policy_version 12160 (0.0004)
+[2023-07-17 12:31:43,363][435284] Updated weights for policy 0, policy_version 12240 (0.0004)
+[2023-07-17 12:31:44,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10035.2, 300 sec: 9872.1). Total num frames: 6275072. Throughput: 0: 10003.1. Samples: 6255700. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:31:44,246][434969] Avg episode reward: [(0, '631.820')]
+[2023-07-17 12:31:47,369][435284] Updated weights for policy 0, policy_version 12320 (0.0005)
+[2023-07-17 12:31:49,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9872.1). Total num frames: 6324224. Throughput: 0: 10060.4. Samples: 6317448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:49,246][434969] Avg episode reward: [(0, '627.662')]
+[2023-07-17 12:31:49,248][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012352_6324224.pth...
+[2023-07-17 12:31:49,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000011760_6021120.pth
+[2023-07-17 12:31:51,430][435284] Updated weights for policy 0, policy_version 12400 (0.0005)
+[2023-07-17 12:31:54,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10035.2, 300 sec: 9872.1). Total num frames: 6373376. Throughput: 0: 10081.8. Samples: 6348292. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:54,246][434969] Avg episode reward: [(0, '629.073')]
+[2023-07-17 12:31:55,581][435284] Updated weights for policy 0, policy_version 12480 (0.0005)
+[2023-07-17 12:31:59,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 9899.8). Total num frames: 6426624. Throughput: 0: 10104.4. Samples: 6407464. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:31:59,246][434969] Avg episode reward: [(0, '641.769')]
+[2023-07-17 12:31:59,588][435284] Updated weights for policy 0, policy_version 12560 (0.0005)
+[2023-07-17 12:32:03,579][435284] Updated weights for policy 0, policy_version 12640 (0.0005)
+[2023-07-17 12:32:04,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9899.8). Total num frames: 6475776. Throughput: 0: 10154.5. Samples: 6469084. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:04,246][434969] Avg episode reward: [(0, '652.162')]
+[2023-07-17 12:32:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012648_6475776.pth...
+[2023-07-17 12:32:04,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012056_6172672.pth
+[2023-07-17 12:32:04,252][435240] Saving new best policy, reward=652.162!
+[2023-07-17 12:32:07,594][435284] Updated weights for policy 0, policy_version 12720 (0.0004)
+[2023-07-17 12:32:09,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 9913.7). Total num frames: 6529024. Throughput: 0: 10175.1. Samples: 6500036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:09,246][434969] Avg episode reward: [(0, '645.415')]
+[2023-07-17 12:32:11,742][435284] Updated weights for policy 0, policy_version 12800 (0.0005)
+[2023-07-17 12:32:14,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10103.5, 300 sec: 9899.8). Total num frames: 6574080. Throughput: 0: 10142.4. Samples: 6559448. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:14,246][434969] Avg episode reward: [(0, '651.368')]
+[2023-07-17 12:32:16,009][435284] Updated weights for policy 0, policy_version 12880 (0.0005)
+[2023-07-17 12:32:19,246][434969] Fps is (10 sec: 9420.7, 60 sec: 10103.5, 300 sec: 9899.8). Total num frames: 6623232. Throughput: 0: 10071.4. Samples: 6617332. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:32:19,246][434969] Avg episode reward: [(0, '640.410')]
+[2023-07-17 12:32:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012936_6623232.pth...
+[2023-07-17 12:32:19,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012352_6324224.pth
+[2023-07-17 12:32:20,185][435284] Updated weights for policy 0, policy_version 12960 (0.0005)
+[2023-07-17 12:32:24,160][435284] Updated weights for policy 0, policy_version 13040 (0.0004)
+[2023-07-17 12:32:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 9913.7). Total num frames: 6676480. Throughput: 0: 10057.3. Samples: 6647800. Policy #0 lag: (min: 3.0, avg: 3.0, max: 3.0)
+[2023-07-17 12:32:24,246][434969] Avg episode reward: [(0, '660.069')]
+[2023-07-17 12:32:24,247][435240] Saving new best policy, reward=660.069!
+[2023-07-17 12:32:28,331][435284] Updated weights for policy 0, policy_version 13120 (0.0005)
+[2023-07-17 12:32:29,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10103.5, 300 sec: 9913.7). Total num frames: 6725632. Throughput: 0: 10043.0. Samples: 6707636. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:32:29,246][434969] Avg episode reward: [(0, '656.330')]
+[2023-07-17 12:32:32,452][435284] Updated weights for policy 0, policy_version 13200 (0.0005)
+[2023-07-17 12:32:34,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10035.2, 300 sec: 9927.6). Total num frames: 6774784. Throughput: 0: 10005.2. Samples: 6767680. Policy #0 lag: (min: 1.0, avg: 1.0, max: 1.0)
+[2023-07-17 12:32:34,246][434969] Avg episode reward: [(0, '661.428')]
+[2023-07-17 12:32:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013232_6774784.pth...
+[2023-07-17 12:32:34,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012648_6475776.pth
+[2023-07-17 12:32:34,252][435240] Saving new best policy, reward=661.428!
+[2023-07-17 12:32:36,380][435284] Updated weights for policy 0, policy_version 13280 (0.0005)
+[2023-07-17 12:32:39,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 9941.5). Total num frames: 6828032. Throughput: 0: 10019.2. Samples: 6799156. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:39,246][434969] Avg episode reward: [(0, '658.535')]
+[2023-07-17 12:32:40,242][435284] Updated weights for policy 0, policy_version 13360 (0.0004)
+[2023-07-17 12:32:44,233][435284] Updated weights for policy 0, policy_version 13440 (0.0004)
+[2023-07-17 12:32:44,246][434969] Fps is (10 sec: 10649.6, 60 sec: 10103.5, 300 sec: 9955.4). Total num frames: 6881280. Throughput: 0: 10088.4. Samples: 6861440. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:44,246][434969] Avg episode reward: [(0, '661.763')]
+[2023-07-17 12:32:44,247][435240] Saving new best policy, reward=661.763!
+[2023-07-17 12:32:48,236][435284] Updated weights for policy 0, policy_version 13520 (0.0004)
+[2023-07-17 12:32:49,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 9955.4). Total num frames: 6930432. Throughput: 0: 10088.2. Samples: 6923056. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:49,246][434969] Avg episode reward: [(0, '659.149')]
+[2023-07-17 12:32:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013536_6930432.pth...
+[2023-07-17 12:32:49,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000012936_6623232.pth
+[2023-07-17 12:32:52,412][435284] Updated weights for policy 0, policy_version 13600 (0.0005)
+[2023-07-17 12:32:54,246][434969] Fps is (10 sec: 9830.3, 60 sec: 10103.5, 300 sec: 9955.4). Total num frames: 6979584. Throughput: 0: 10065.3. Samples: 6952976. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:54,246][434969] Avg episode reward: [(0, '671.174')]
+[2023-07-17 12:32:54,247][435240] Saving new best policy, reward=671.174!
+[2023-07-17 12:32:56,505][435284] Updated weights for policy 0, policy_version 13680 (0.0005)
+[2023-07-17 12:32:59,246][434969] Fps is (10 sec: 9830.3, 60 sec: 10035.2, 300 sec: 9955.4). Total num frames: 7028736. Throughput: 0: 10064.7. Samples: 7012360. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:32:59,246][434969] Avg episode reward: [(0, '671.510')]
+[2023-07-17 12:32:59,247][435240] Saving new best policy, reward=671.510!
+[2023-07-17 12:33:00,699][435284] Updated weights for policy 0, policy_version 13760 (0.0005)
+[2023-07-17 12:33:04,246][434969] Fps is (10 sec: 9830.3, 60 sec: 10035.2, 300 sec: 9955.4). Total num frames: 7077888. Throughput: 0: 10076.5. Samples: 7070776. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:33:04,246][434969] Avg episode reward: [(0, '672.598')]
+[2023-07-17 12:33:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013824_7077888.pth...
+[2023-07-17 12:33:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013232_6774784.pth
+[2023-07-17 12:33:04,251][435240] Saving new best policy, reward=672.598!
+[2023-07-17 12:33:04,889][435284] Updated weights for policy 0, policy_version 13840 (0.0006)
+[2023-07-17 12:33:09,039][435284] Updated weights for policy 0, policy_version 13920 (0.0005)
+[2023-07-17 12:33:09,246][434969] Fps is (10 sec: 9830.5, 60 sec: 9966.9, 300 sec: 9955.4). Total num frames: 7127040. Throughput: 0: 10056.5. Samples: 7100344. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:33:09,246][434969] Avg episode reward: [(0, '665.776')]
+[2023-07-17 12:33:13,159][435284] Updated weights for policy 0, policy_version 14000 (0.0005)
+[2023-07-17 12:33:14,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10035.2, 300 sec: 9941.5). Total num frames: 7176192. Throughput: 0: 10044.0. Samples: 7159616. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:33:14,246][434969] Avg episode reward: [(0, '666.194')]
+[2023-07-17 12:33:17,204][435284] Updated weights for policy 0, policy_version 14080 (0.0005)
+[2023-07-17 12:33:19,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 9955.4). Total num frames: 7229440. Throughput: 0: 10062.7. Samples: 7220504. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:33:19,247][434969] Avg episode reward: [(0, '667.043')]
+[2023-07-17 12:33:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014120_7229440.pth...
+[2023-07-17 12:33:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013536_6930432.pth
+[2023-07-17 12:33:21,204][435284] Updated weights for policy 0, policy_version 14160 (0.0005)
+[2023-07-17 12:33:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10035.2, 300 sec: 9955.4). Total num frames: 7278592. Throughput: 0: 10045.9. Samples: 7251224. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:33:24,246][434969] Avg episode reward: [(0, '678.245')]
+[2023-07-17 12:33:24,247][435240] Saving new best policy, reward=678.245!
+[2023-07-17 12:33:25,164][435284] Updated weights for policy 0, policy_version 14240 (0.0004)
+[2023-07-17 12:33:29,194][435284] Updated weights for policy 0, policy_version 14320 (0.0005)
+[2023-07-17 12:33:29,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 9969.2). Total num frames: 7331840. Throughput: 0: 10021.7. Samples: 7312416. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:33:29,246][434969] Avg episode reward: [(0, '680.324')]
+[2023-07-17 12:33:29,247][435240] Saving new best policy, reward=680.324!
+[2023-07-17 12:33:33,108][435284] Updated weights for policy 0, policy_version 14400 (0.0005)
+[2023-07-17 12:33:34,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 9969.2). Total num frames: 7380992. Throughput: 0: 10046.3. Samples: 7375140. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:33:34,246][434969] Avg episode reward: [(0, '679.968')]
+[2023-07-17 12:33:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014416_7380992.pth...
+[2023-07-17 12:33:34,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000013824_7077888.pth
+[2023-07-17 12:33:37,135][435284] Updated weights for policy 0, policy_version 14480 (0.0005)
+[2023-07-17 12:33:39,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10103.5, 300 sec: 9983.1). Total num frames: 7434240. Throughput: 0: 10057.9. Samples: 7405580. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:33:39,246][434969] Avg episode reward: [(0, '673.616')]
+[2023-07-17 12:33:41,188][435284] Updated weights for policy 0, policy_version 14560 (0.0005)
+[2023-07-17 12:33:44,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10035.2, 300 sec: 9997.0). Total num frames: 7483392. Throughput: 0: 10094.2. Samples: 7466596. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:33:44,246][434969] Avg episode reward: [(0, '680.268')]
+[2023-07-17 12:33:45,247][435284] Updated weights for policy 0, policy_version 14640 (0.0005)
+[2023-07-17 12:33:49,122][435284] Updated weights for policy 0, policy_version 14720 (0.0004)
+[2023-07-17 12:33:49,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 10010.9). Total num frames: 7536640. Throughput: 0: 10171.9. Samples: 7528512. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:33:49,247][434969] Avg episode reward: [(0, '689.030')]
+[2023-07-17 12:33:49,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014720_7536640.pth...
+[2023-07-17 12:33:49,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014120_7229440.pth
+[2023-07-17 12:33:49,253][435240] Saving new best policy, reward=689.030!
+[2023-07-17 12:33:53,004][435284] Updated weights for policy 0, policy_version 14800 (0.0004)
+[2023-07-17 12:33:54,246][434969] Fps is (10 sec: 10649.5, 60 sec: 10171.7, 300 sec: 10024.8). Total num frames: 7589888. Throughput: 0: 10218.9. Samples: 7560196. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:33:54,246][434969] Avg episode reward: [(0, '683.609')]
+[2023-07-17 12:33:56,993][435284] Updated weights for policy 0, policy_version 14880 (0.0004)
+[2023-07-17 12:33:59,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10171.8, 300 sec: 10024.8). Total num frames: 7639040. Throughput: 0: 10282.9. Samples: 7622348. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:33:59,246][434969] Avg episode reward: [(0, '681.380')]
+[2023-07-17 12:34:01,175][435284] Updated weights for policy 0, policy_version 14960 (0.0005)
+[2023-07-17 12:34:04,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10171.7, 300 sec: 10024.8). Total num frames: 7688192. Throughput: 0: 10225.7. Samples: 7680660. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:04,247][434969] Avg episode reward: [(0, '679.113')]
+[2023-07-17 12:34:04,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015016_7688192.pth...
+[2023-07-17 12:34:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014416_7380992.pth
+[2023-07-17 12:34:05,349][435284] Updated weights for policy 0, policy_version 15040 (0.0005)
+[2023-07-17 12:34:09,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10171.7, 300 sec: 10024.8). Total num frames: 7737344. Throughput: 0: 10193.1. Samples: 7709912. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:09,246][434969] Avg episode reward: [(0, '676.684')]
+[2023-07-17 12:34:09,555][435284] Updated weights for policy 0, policy_version 15120 (0.0005)
+[2023-07-17 12:34:13,590][435284] Updated weights for policy 0, policy_version 15200 (0.0005)
+[2023-07-17 12:34:14,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10171.7, 300 sec: 10024.8). Total num frames: 7786496. Throughput: 0: 10150.0. Samples: 7769164. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:14,246][434969] Avg episode reward: [(0, '673.630')]
+[2023-07-17 12:34:17,572][435284] Updated weights for policy 0, policy_version 15280 (0.0005)
+[2023-07-17 12:34:19,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10171.7, 300 sec: 10038.7). Total num frames: 7839744. Throughput: 0: 10143.9. Samples: 7831616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:19,246][434969] Avg episode reward: [(0, '675.786')]
+[2023-07-17 12:34:19,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015312_7839744.pth...
+[2023-07-17 12:34:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000014720_7536640.pth
+[2023-07-17 12:34:21,540][435284] Updated weights for policy 0, policy_version 15360 (0.0004)
+[2023-07-17 12:34:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10171.7, 300 sec: 10024.8). Total num frames: 7888896. Throughput: 0: 10144.3. Samples: 7862072. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:24,246][434969] Avg episode reward: [(0, '679.569')]
+[2023-07-17 12:34:25,498][435284] Updated weights for policy 0, policy_version 15440 (0.0004)
+[2023-07-17 12:34:29,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10171.7, 300 sec: 10038.7). Total num frames: 7942144. Throughput: 0: 10167.2. Samples: 7924120. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:29,246][434969] Avg episode reward: [(0, '672.343')]
+[2023-07-17 12:34:29,554][435284] Updated weights for policy 0, policy_version 15520 (0.0005)
+[2023-07-17 12:34:33,658][435284] Updated weights for policy 0, policy_version 15600 (0.0005)
+[2023-07-17 12:34:34,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10171.7, 300 sec: 10038.7). Total num frames: 7991296. Throughput: 0: 10116.2. Samples: 7983740. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:34,246][434969] Avg episode reward: [(0, '676.416')]
+[2023-07-17 12:34:34,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015608_7991296.pth...
+[2023-07-17 12:34:34,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015016_7688192.pth
+[2023-07-17 12:34:37,750][435284] Updated weights for policy 0, policy_version 15680 (0.0004)
+[2023-07-17 12:34:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10103.5, 300 sec: 10038.7). Total num frames: 8040448. Throughput: 0: 10081.8. Samples: 8013876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:34:39,246][434969] Avg episode reward: [(0, '674.840')]
+[2023-07-17 12:34:41,865][435284] Updated weights for policy 0, policy_version 15760 (0.0005)
+[2023-07-17 12:34:44,246][434969] Fps is (10 sec: 9830.3, 60 sec: 10103.4, 300 sec: 10038.7). Total num frames: 8089600. Throughput: 0: 10028.7. Samples: 8073640. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:34:44,247][434969] Avg episode reward: [(0, '681.000')]
+[2023-07-17 12:34:46,027][435284] Updated weights for policy 0, policy_version 15840 (0.0005)
+[2023-07-17 12:34:49,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 10066.4). Total num frames: 8142848. Throughput: 0: 10076.1. Samples: 8134084. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:34:49,246][434969] Avg episode reward: [(0, '671.547')]
+[2023-07-17 12:34:49,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015904_8142848.pth...
+[2023-07-17 12:34:49,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015312_7839744.pth
+[2023-07-17 12:34:50,044][435284] Updated weights for policy 0, policy_version 15920 (0.0004)
+[2023-07-17 12:34:54,051][435284] Updated weights for policy 0, policy_version 16000 (0.0005)
+[2023-07-17 12:34:54,246][434969] Fps is (10 sec: 10240.2, 60 sec: 10035.2, 300 sec: 10066.4). Total num frames: 8192000. Throughput: 0: 10083.8. Samples: 8163680. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:34:54,246][434969] Avg episode reward: [(0, '671.560')]
+[2023-07-17 12:34:58,072][435284] Updated weights for policy 0, policy_version 16080 (0.0005)
+[2023-07-17 12:34:59,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 10066.4). Total num frames: 8245248. Throughput: 0: 10126.1. Samples: 8224840. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:34:59,246][434969] Avg episode reward: [(0, '673.489')]
+[2023-07-17 12:35:02,011][435284] Updated weights for policy 0, policy_version 16160 (0.0005)
+[2023-07-17 12:35:04,246][434969] Fps is (10 sec: 10239.8, 60 sec: 10103.5, 300 sec: 10080.3). Total num frames: 8294400. Throughput: 0: 10134.6. Samples: 8287676. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:35:04,246][434969] Avg episode reward: [(0, '673.182')]
+[2023-07-17 12:35:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016200_8294400.pth...
+[2023-07-17 12:35:04,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015608_7991296.pth
+[2023-07-17 12:35:05,940][435284] Updated weights for policy 0, policy_version 16240 (0.0004)
+[2023-07-17 12:35:09,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10171.7, 300 sec: 10080.3). Total num frames: 8347648. Throughput: 0: 10153.6. Samples: 8318984. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:35:09,246][434969] Avg episode reward: [(0, '681.959')]
+[2023-07-17 12:35:09,870][435284] Updated weights for policy 0, policy_version 16320 (0.0004)
+[2023-07-17 12:35:13,770][435284] Updated weights for policy 0, policy_version 16400 (0.0005)
+[2023-07-17 12:35:14,246][434969] Fps is (10 sec: 10649.7, 60 sec: 10240.0, 300 sec: 10094.2). Total num frames: 8400896. Throughput: 0: 10170.2. Samples: 8381780. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:35:14,246][434969] Avg episode reward: [(0, '682.211')]
+[2023-07-17 12:35:17,708][435284] Updated weights for policy 0, policy_version 16480 (0.0004)
+[2023-07-17 12:35:19,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10171.7, 300 sec: 10080.3). Total num frames: 8450048. Throughput: 0: 10227.2. Samples: 8443964. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:35:19,246][434969] Avg episode reward: [(0, '686.912')]
+[2023-07-17 12:35:19,274][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016512_8454144.pth...
+[2023-07-17 12:35:19,275][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000015904_8142848.pth
+[2023-07-17 12:35:21,637][435284] Updated weights for policy 0, policy_version 16560 (0.0004)
+[2023-07-17 12:35:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10240.0, 300 sec: 10094.2). Total num frames: 8503296. Throughput: 0: 10255.4. Samples: 8475368. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:35:24,246][434969] Avg episode reward: [(0, '681.689')]
+[2023-07-17 12:35:25,589][435284] Updated weights for policy 0, policy_version 16640 (0.0004)
+[2023-07-17 12:35:29,246][434969] Fps is (10 sec: 10649.7, 60 sec: 10240.0, 300 sec: 10108.1). Total num frames: 8556544. Throughput: 0: 10305.4. Samples: 8537380. Policy #0 lag: (min: 5.0, avg: 5.0, max: 5.0)
+[2023-07-17 12:35:29,246][434969] Avg episode reward: [(0, '687.378')]
+[2023-07-17 12:35:29,642][435284] Updated weights for policy 0, policy_version 16720 (0.0005)
+[2023-07-17 12:35:33,732][435284] Updated weights for policy 0, policy_version 16800 (0.0005)
+[2023-07-17 12:35:34,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10240.0, 300 sec: 10108.1). Total num frames: 8605696. Throughput: 0: 10298.4. Samples: 8597512. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:35:34,246][434969] Avg episode reward: [(0, '680.774')]
+[2023-07-17 12:35:34,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016808_8605696.pth...
+[2023-07-17 12:35:34,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016200_8294400.pth
+[2023-07-17 12:35:37,766][435284] Updated weights for policy 0, policy_version 16880 (0.0005)
+[2023-07-17 12:35:39,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10240.0, 300 sec: 10108.1). Total num frames: 8654848. Throughput: 0: 10319.0. Samples: 8628036. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:35:39,246][434969] Avg episode reward: [(0, '678.973')]
+[2023-07-17 12:35:41,752][435284] Updated weights for policy 0, policy_version 16960 (0.0004)
+[2023-07-17 12:35:44,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10308.3, 300 sec: 10122.0). Total num frames: 8708096. Throughput: 0: 10324.3. Samples: 8689432. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:35:44,246][434969] Avg episode reward: [(0, '683.045')]
+[2023-07-17 12:35:45,926][435284] Updated weights for policy 0, policy_version 17040 (0.0005)
+[2023-07-17 12:35:49,246][434969] Fps is (10 sec: 9830.3, 60 sec: 10171.7, 300 sec: 10108.1). Total num frames: 8753152. Throughput: 0: 10227.3. Samples: 8747904. Policy #0 lag: (min: 0.0, avg: 0.0, max: 0.0)
+[2023-07-17 12:35:49,246][434969] Avg episode reward: [(0, '662.721')]
+[2023-07-17 12:35:49,251][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017104_8757248.pth...
+[2023-07-17 12:35:49,253][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016512_8454144.pth
+[2023-07-17 12:35:50,105][435284] Updated weights for policy 0, policy_version 17120 (0.0005)
+[2023-07-17 12:35:54,246][434969] Fps is (10 sec: 9420.8, 60 sec: 10171.7, 300 sec: 10108.1). Total num frames: 8802304. Throughput: 0: 10194.3. Samples: 8777728. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:35:54,246][434969] Avg episode reward: [(0, '672.997')]
+[2023-07-17 12:35:54,273][435284] Updated weights for policy 0, policy_version 17200 (0.0005)
+[2023-07-17 12:35:58,400][435284] Updated weights for policy 0, policy_version 17280 (0.0005)
+[2023-07-17 12:35:59,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10103.5, 300 sec: 10094.2). Total num frames: 8851456. Throughput: 0: 10107.7. Samples: 8836628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:35:59,246][434969] Avg episode reward: [(0, '679.024')]
+[2023-07-17 12:36:02,594][435284] Updated weights for policy 0, policy_version 17360 (0.0006)
+[2023-07-17 12:36:04,246][434969] Fps is (10 sec: 9830.3, 60 sec: 10103.5, 300 sec: 10094.2). Total num frames: 8900608. Throughput: 0: 10042.5. Samples: 8895876. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:04,246][434969] Avg episode reward: [(0, '667.922')]
+[2023-07-17 12:36:04,265][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017392_8904704.pth...
+[2023-07-17 12:36:04,267][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000016808_8605696.pth
+[2023-07-17 12:36:06,623][435284] Updated weights for policy 0, policy_version 17440 (0.0005)
+[2023-07-17 12:36:09,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 10122.0). Total num frames: 8953856. Throughput: 0: 10016.3. Samples: 8926100. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:09,246][434969] Avg episode reward: [(0, '687.409')]
+[2023-07-17 12:36:10,596][435284] Updated weights for policy 0, policy_version 17520 (0.0004)
+[2023-07-17 12:36:14,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10035.2, 300 sec: 10122.0). Total num frames: 9003008. Throughput: 0: 10002.8. Samples: 8987508. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:14,246][434969] Avg episode reward: [(0, '689.347')]
+[2023-07-17 12:36:14,247][435240] Saving new best policy, reward=689.347!
+[2023-07-17 12:36:14,685][435284] Updated weights for policy 0, policy_version 17600 (0.0005)
+[2023-07-17 12:36:18,645][435284] Updated weights for policy 0, policy_version 17680 (0.0004)
+[2023-07-17 12:36:19,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 10122.0). Total num frames: 9056256. Throughput: 0: 10024.5. Samples: 9048616. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:19,246][434969] Avg episode reward: [(0, '683.154')]
+[2023-07-17 12:36:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017688_9056256.pth...
+[2023-07-17 12:36:19,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017104_8757248.pth
+[2023-07-17 12:36:22,609][435284] Updated weights for policy 0, policy_version 17760 (0.0005)
+[2023-07-17 12:36:24,246][434969] Fps is (10 sec: 10649.7, 60 sec: 10103.5, 300 sec: 10135.9). Total num frames: 9109504. Throughput: 0: 10039.9. Samples: 9079832. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:24,246][434969] Avg episode reward: [(0, '680.385')]
+[2023-07-17 12:36:26,649][435284] Updated weights for policy 0, policy_version 17840 (0.0005)
+[2023-07-17 12:36:29,246][434969] Fps is (10 sec: 10240.1, 60 sec: 10035.2, 300 sec: 10122.0). Total num frames: 9158656. Throughput: 0: 10031.6. Samples: 9140852. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:29,246][434969] Avg episode reward: [(0, '677.963')]
+[2023-07-17 12:36:30,619][435284] Updated weights for policy 0, policy_version 17920 (0.0004)
+[2023-07-17 12:36:34,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 10135.9). Total num frames: 9211904. Throughput: 0: 10129.3. Samples: 9203720. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:34,246][434969] Avg episode reward: [(0, '683.663')]
+[2023-07-17 12:36:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017992_9211904.pth...
+[2023-07-17 12:36:34,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017392_8904704.pth
+[2023-07-17 12:36:34,518][435284] Updated weights for policy 0, policy_version 18000 (0.0004)
+[2023-07-17 12:36:38,743][435284] Updated weights for policy 0, policy_version 18080 (0.0005)
+[2023-07-17 12:36:39,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 10122.0). Total num frames: 9261056. Throughput: 0: 10126.4. Samples: 9233416. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:39,246][434969] Avg episode reward: [(0, '697.151')]
+[2023-07-17 12:36:39,247][435240] Saving new best policy, reward=697.151!
+[2023-07-17 12:36:42,711][435284] Updated weights for policy 0, policy_version 18160 (0.0004)
+[2023-07-17 12:36:44,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10035.2, 300 sec: 10122.0). Total num frames: 9310208. Throughput: 0: 10161.3. Samples: 9293888. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:44,246][434969] Avg episode reward: [(0, '686.225')]
+[2023-07-17 12:36:46,782][435284] Updated weights for policy 0, policy_version 18240 (0.0005)
+[2023-07-17 12:36:49,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10171.7, 300 sec: 10135.9). Total num frames: 9363456. Throughput: 0: 10210.0. Samples: 9355328. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:36:49,246][434969] Avg episode reward: [(0, '686.982')]
+[2023-07-17 12:36:49,250][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018288_9363456.pth...
+[2023-07-17 12:36:49,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017688_9056256.pth
+[2023-07-17 12:36:50,862][435284] Updated weights for policy 0, policy_version 18320 (0.0005)
+[2023-07-17 12:36:54,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10171.7, 300 sec: 10122.0). Total num frames: 9412608. Throughput: 0: 10178.3. Samples: 9384124. Policy #0 lag: (min: 2.0, avg: 2.0, max: 2.0)
+[2023-07-17 12:36:54,246][434969] Avg episode reward: [(0, '685.678')]
+[2023-07-17 12:36:55,036][435284] Updated weights for policy 0, policy_version 18400 (0.0005)
+[2023-07-17 12:36:59,060][435284] Updated weights for policy 0, policy_version 18480 (0.0005)
+[2023-07-17 12:36:59,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10171.7, 300 sec: 10122.0). Total num frames: 9461760. Throughput: 0: 10154.3. Samples: 9444452. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:36:59,246][434969] Avg episode reward: [(0, '682.178')]
+[2023-07-17 12:37:02,998][435284] Updated weights for policy 0, policy_version 18560 (0.0004)
+[2023-07-17 12:37:04,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10240.0, 300 sec: 10122.0). Total num frames: 9515008. Throughput: 0: 10173.8. Samples: 9506436. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:04,246][434969] Avg episode reward: [(0, '684.004')]
+[2023-07-17 12:37:04,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018584_9515008.pth...
+[2023-07-17 12:37:04,251][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000017992_9211904.pth
+[2023-07-17 12:37:07,122][435284] Updated weights for policy 0, policy_version 18640 (0.0004)
+[2023-07-17 12:37:09,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10171.7, 300 sec: 10135.9). Total num frames: 9564160. Throughput: 0: 10127.9. Samples: 9535588. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:09,246][434969] Avg episode reward: [(0, '690.317')]
+[2023-07-17 12:37:11,174][435284] Updated weights for policy 0, policy_version 18720 (0.0005)
+[2023-07-17 12:37:14,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10171.7, 300 sec: 10135.9). Total num frames: 9613312. Throughput: 0: 10129.3. Samples: 9596672. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:14,246][434969] Avg episode reward: [(0, '686.449')]
+[2023-07-17 12:37:15,204][435284] Updated weights for policy 0, policy_version 18800 (0.0005)
+[2023-07-17 12:37:19,184][435284] Updated weights for policy 0, policy_version 18880 (0.0004)
+[2023-07-17 12:37:19,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10171.7, 300 sec: 10135.9). Total num frames: 9666560. Throughput: 0: 10097.9. Samples: 9658128. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:19,246][434969] Avg episode reward: [(0, '690.430')]
+[2023-07-17 12:37:19,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018880_9666560.pth...
+[2023-07-17 12:37:19,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018288_9363456.pth
+[2023-07-17 12:37:23,206][435284] Updated weights for policy 0, policy_version 18960 (0.0004)
+[2023-07-17 12:37:24,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 10135.9). Total num frames: 9715712. Throughput: 0: 10113.4. Samples: 9688520. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:37:24,246][434969] Avg episode reward: [(0, '680.984')]
+[2023-07-17 12:37:27,321][435284] Updated weights for policy 0, policy_version 19040 (0.0005)
+[2023-07-17 12:37:29,246][434969] Fps is (10 sec: 9830.5, 60 sec: 10103.5, 300 sec: 10135.9). Total num frames: 9764864. Throughput: 0: 10103.5. Samples: 9748544. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:37:29,246][434969] Avg episode reward: [(0, '687.276')]
+[2023-07-17 12:37:31,313][435284] Updated weights for policy 0, policy_version 19120 (0.0004)
+[2023-07-17 12:37:34,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 10135.9). Total num frames: 9818112. Throughput: 0: 10103.5. Samples: 9809984. Policy #0 lag: (min: 6.0, avg: 6.0, max: 6.0)
+[2023-07-17 12:37:34,246][434969] Avg episode reward: [(0, '681.146')]
+[2023-07-17 12:37:34,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019176_9818112.pth...
+[2023-07-17 12:37:34,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018584_9515008.pth
+[2023-07-17 12:37:35,277][435284] Updated weights for policy 0, policy_version 19200 (0.0004)
+[2023-07-17 12:37:39,246][434969] Fps is (10 sec: 10240.0, 60 sec: 10103.5, 300 sec: 10122.0). Total num frames: 9867264. Throughput: 0: 10145.9. Samples: 9840688. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:39,246][434969] Avg episode reward: [(0, '692.936')]
+[2023-07-17 12:37:39,499][435284] Updated weights for policy 0, policy_version 19280 (0.0005)
+[2023-07-17 12:37:43,684][435284] Updated weights for policy 0, policy_version 19360 (0.0005)
+[2023-07-17 12:37:44,246][434969] Fps is (10 sec: 9830.4, 60 sec: 10103.5, 300 sec: 10122.0). Total num frames: 9916416. Throughput: 0: 10119.7. Samples: 9899840. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:44,246][434969] Avg episode reward: [(0, '691.258')]
+[2023-07-17 12:37:47,618][435284] Updated weights for policy 0, policy_version 19440 (0.0004)
+[2023-07-17 12:37:49,246][434969] Fps is (10 sec: 10239.9, 60 sec: 10103.5, 300 sec: 10135.9). Total num frames: 9969664. Throughput: 0: 10093.2. Samples: 9960628. Policy #0 lag: (min: 7.0, avg: 7.0, max: 7.0)
+[2023-07-17 12:37:49,246][434969] Avg episode reward: [(0, '693.549')]
+[2023-07-17 12:37:49,249][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019472_9969664.pth...
+[2023-07-17 12:37:49,252][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000018880_9666560.pth
+[2023-07-17 12:37:51,652][435284] Updated weights for policy 0, policy_version 19520 (0.0005)
+[2023-07-17 12:37:52,442][435240] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000010
+[2023-07-17 12:37:52,834][435240] Early stopping after 2 epochs (8 sgd steps), loss delta 0.0000000
+[2023-07-17 12:37:52,835][435288] Stopping RolloutWorker_w4...
+[2023-07-17 12:37:52,835][435289] Stopping RolloutWorker_w0...
+[2023-07-17 12:37:52,835][435286] Stopping RolloutWorker_w2...
+[2023-07-17 12:37:52,835][435288] Loop rollout_proc4_evt_loop terminating...
+[2023-07-17 12:37:52,835][435353] Stopping RolloutWorker_w6...
+[2023-07-17 12:37:52,835][435289] Loop rollout_proc0_evt_loop terminating...
+[2023-07-17 12:37:52,835][435385] Stopping RolloutWorker_w7...
+[2023-07-17 12:37:52,835][435290] Stopping RolloutWorker_w5...
+[2023-07-17 12:37:52,835][435286] Loop rollout_proc2_evt_loop terminating...
+[2023-07-17 12:37:52,835][435353] Loop rollout_proc6_evt_loop terminating...
+[2023-07-17 12:37:52,835][435240] Stopping Batcher_0...
+[2023-07-17 12:37:52,835][435385] Loop rollout_proc7_evt_loop terminating...
+[2023-07-17 12:37:52,835][435287] Stopping RolloutWorker_w3...
+[2023-07-17 12:37:52,835][435290] Loop rollout_proc5_evt_loop terminating...
+[2023-07-17 12:37:52,835][435285] Stopping RolloutWorker_w1...
+[2023-07-17 12:37:52,835][434969] Component RolloutWorker_w4 stopped!
+[2023-07-17 12:37:52,835][435287] Loop rollout_proc3_evt_loop terminating...
+[2023-07-17 12:37:52,835][435285] Loop rollout_proc1_evt_loop terminating...
+[2023-07-17 12:37:52,835][435240] Loop batcher_evt_loop terminating...
+[2023-07-17 12:37:52,836][434969] Component RolloutWorker_w0 stopped!
+[2023-07-17 12:37:52,836][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
+[2023-07-17 12:37:52,836][434969] Component RolloutWorker_w2 stopped!
+[2023-07-17 12:37:52,836][434969] Component RolloutWorker_w6 stopped!
+[2023-07-17 12:37:52,837][434969] Component RolloutWorker_w7 stopped!
+[2023-07-17 12:37:52,837][434969] Component RolloutWorker_w5 stopped!
+[2023-07-17 12:37:52,837][434969] Component Batcher_0 stopped!
+[2023-07-17 12:37:52,838][434969] Component RolloutWorker_w1 stopped!
+[2023-07-17 12:37:52,838][434969] Component RolloutWorker_w3 stopped!
+[2023-07-17 12:37:52,838][435240] Removing /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019176_9818112.pth
+[2023-07-17 12:37:52,839][435240] Saving /home/qgallouedec/data/gia/data/envs/metaworld/train_dir/hammer-v2/checkpoint_p0/checkpoint_000019544_10006528.pth...
+[2023-07-17 12:37:52,842][435240] Stopping LearnerWorker_p0...
+[2023-07-17 12:37:52,842][435240] Loop learner_proc0_evt_loop terminating...
+[2023-07-17 12:37:52,842][434969] Component LearnerWorker_p0 stopped!
+[2023-07-17 12:37:52,865][435284] Weights refcount: 2 0
+[2023-07-17 12:37:52,866][435284] Stopping InferenceWorker_p0-w0...
+[2023-07-17 12:37:52,866][435284] Loop inference_proc0-0_evt_loop terminating...
+[2023-07-17 12:37:52,866][434969] Component InferenceWorker_p0-w0 stopped!
+[2023-07-17 12:37:52,867][434969] Waiting for process learner_proc0 to stop...
+[2023-07-17 12:37:53,462][434969] Waiting for process inference_proc0-0 to join...
+[2023-07-17 12:37:53,462][434969] Waiting for process rollout_proc0 to join...
+[2023-07-17 12:37:53,462][434969] Waiting for process rollout_proc1 to join...
+[2023-07-17 12:37:53,462][434969] Waiting for process rollout_proc2 to join...
+[2023-07-17 12:37:53,463][434969] Waiting for process rollout_proc3 to join...
+[2023-07-17 12:37:53,469][434969] Waiting for process rollout_proc4 to join...
+[2023-07-17 12:37:53,469][434969] Waiting for process rollout_proc5 to join...
+[2023-07-17 12:37:53,469][434969] Waiting for process rollout_proc6 to join...
+[2023-07-17 12:37:53,469][434969] Waiting for process rollout_proc7 to join...
+[2023-07-17 12:37:53,469][434969] Batcher 0 profile tree view:
+batching: 1.7465, releasing_batches: 1.6290
+[2023-07-17 12:37:53,470][434969] InferenceWorker_p0-w0 profile tree view:
+wait_policy: 0.0000
+  wait_policy_total: 390.8820
+update_model: 12.4247
   weight_update: 0.0005
-one_step: 0.0011
-  handle_policy_step: 683.6431
-    deserialize: 28.8396, stack: 7.3479, obs_to_device_normalize: 123.3792, forward: 340.3786, send_messages: 47.4281
-    prepare_outputs: 75.7708
-      to_cpu: 11.6954
-[2023-07-08 19:25:32,367][1047911] Learner 0 profile tree view:
-misc: 0.0097, prepare_batch: 8.4694
-train: 86.7944
-  epoch_init: 0.0348, minibatch_init: 1.2052, losses_postprocess: 1.2620, kl_divergence: 0.4170, after_optimizer: 0.6511
-  calculate_losses: 36.6249
-    losses_init: 0.0287, forward_head: 13.9488, bptt_initial: 0.1267, bptt: 0.1217, tail: 10.6636, advantages_returns: 0.8328, losses: 9.6079
-  update: 45.1400
-    clip: 5.4686
-[2023-07-08 19:25:32,367][1047911] RolloutWorker_w0 profile tree view:
-wait_for_trajectories: 0.4605, enqueue_policy_requests: 15.4897, env_step: 950.1611, overhead: 22.2046, complete_rollouts: 0.3931
-save_policy_outputs: 43.0832
-  split_output_tensors: 14.7064
-[2023-07-08 19:25:32,367][1047911] RolloutWorker_w7 profile tree view:
-wait_for_trajectories: 0.4265, enqueue_policy_requests: 15.5726, env_step: 940.3414, overhead: 22.1831, complete_rollouts: 0.3983
-save_policy_outputs: 43.2654
-  split_output_tensors: 14.7285
-[2023-07-08 19:25:32,368][1047911] Loop Runner_EvtLoop terminating...
-[2023-07-08 19:25:32,368][1047911] Runner profile tree view:
-main_loop: 1401.2039
-[2023-07-08 19:25:32,368][1047911] Collected {0: 10006528}, FPS: 7141.4
+one_step: 0.0010
+  handle_policy_step: 548.4345
+    deserialize: 22.7752, stack: 5.9819, obs_to_device_normalize: 98.6203, forward: 271.7803, send_messages: 38.9361
+    prepare_outputs: 63.4354
+      to_cpu: 9.7053
+[2023-07-17 12:37:53,470][434969] Learner 0 profile tree view:
+misc: 0.0094, prepare_batch: 9.1390
+train: 94.1845
+  epoch_init: 0.0355, minibatch_init: 1.2877, losses_postprocess: 1.2700, kl_divergence: 0.4351, after_optimizer: 0.6234
+  calculate_losses: 40.2063
+    losses_init: 0.0311, forward_head: 15.8321, bptt_initial: 0.1339, bptt: 0.1262, tail: 11.3191, advantages_returns: 0.8632, losses: 10.4974
+  update: 48.7418
+    clip: 5.8378
+[2023-07-17 12:37:53,470][434969] RolloutWorker_w0 profile tree view:
+wait_for_trajectories: 0.3186, enqueue_policy_requests: 13.3601, env_step: 751.2991, overhead: 20.1776, complete_rollouts: 0.3453
+save_policy_outputs: 39.6456
+  split_output_tensors: 13.8446
+[2023-07-17 12:37:53,470][434969] RolloutWorker_w7 profile tree view:
+wait_for_trajectories: 0.3135, enqueue_policy_requests: 12.9609, env_step: 749.6168, overhead: 19.7509, complete_rollouts: 0.3372
+save_policy_outputs: 38.8406
+  split_output_tensors: 13.4433
+[2023-07-17 12:37:53,470][434969] Loop Runner_EvtLoop terminating...
+[2023-07-17 12:37:53,471][434969] Runner profile tree view:
+main_loop: 1021.7469
+[2023-07-17 12:37:53,471][434969] Collected {0: 10006528}, FPS: 9793.5