2025-03-29 14:04:30 | [maml_trainer] Logging to /home/h2khalil/MetaRL-Assistive-Robotics/data/local/experiment/maml_trainer
2025-03-29 14:08:18 | [maml_trainer] Obtaining samples...
2025-03-29 14:45:41 | [maml_trainer] epoch #0 | Sampling for adapation and meta-testing...
2025-03-29 14:52:14 | [maml_trainer] epoch #0 | Finished meta-testing...
2025-03-29 14:52:14 | [maml_trainer] epoch #0 | Saving snapshot...
2025-03-29 14:53:13 | [maml_trainer] epoch #0 | Saved
2025-03-29 14:53:13 | [maml_trainer] epoch #0 | Time 2694.32 s
2025-03-29 14:53:13 | [maml_trainer] epoch #0 | EpochTime 2694.32 s
-------------------------------------------------  ---------------
Average/AverageDiscountedReturn                      -81.6842
Average/AverageReturn                               -192.31
Average/Iteration                                      0
Average/MaxReturn                                   -131.135
Average/MinReturn                                   -216.702
Average/NumEpisodes                                   80
Average/StdReturn                                     18.1135
Average/TerminationRate                                0
GaussianMLPPolicy/Entropy                              9.92564
GaussianMLPPolicy/KLAfter                              0.0257486
GaussianMLPPolicy/KLBefore                             0
GaussianMLPPolicy/LossAfter                            8.36371e-05
GaussianMLPPolicy/LossBefore                           6.16908e-09
GaussianMLPPolicy/dLoss                               -8.36309e-05
Iteration                                              0
MetaTest/Average/AverageDiscountedReturn            -186.585
MetaTest/Average/AverageReturn                      -186.585
MetaTest/Average/Iteration                             0
MetaTest/Average/MaxReturn                          -136.911
MetaTest/Average/MinReturn                          -203.413
MetaTest/Average/NumEpisodes                          20
MetaTest/Average/StdReturn                            20.1941
MetaTest/Average/TerminationRate                       0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -186.585
MetaTest/__unnamed_task__/AverageReturn             -186.585
MetaTest/__unnamed_task__/Iteration                    0
MetaTest/__unnamed_task__/MaxReturn                 -136.911
MetaTest/__unnamed_task__/MinReturn                 -203.413
MetaTest/__unnamed_task__/NumEpisodes                 20
MetaTest/__unnamed_task__/StdReturn                   20.1941
MetaTest/__unnamed_task__/TerminationRate              0
TotalEnvSteps                                      32000
__unnamed_task__/AverageDiscountedReturn             -81.6842
__unnamed_task__/AverageReturn                      -192.31
__unnamed_task__/Iteration                             0
__unnamed_task__/MaxReturn                          -131.135
__unnamed_task__/MinReturn                          -216.702
__unnamed_task__/NumEpisodes                          80
__unnamed_task__/StdReturn                            18.1135
__unnamed_task__/TerminationRate                       0
-------------------------------------------------  ---------------
2025-03-29 15:26:06 | [maml_trainer] epoch #1 | Sampling for adapation and meta-testing...
2025-03-29 15:34:42 | [maml_trainer] epoch #1 | Finished meta-testing...
2025-03-29 15:34:42 | [maml_trainer] epoch #1 | Saving snapshot...
2025-03-29 15:35:01 | [maml_trainer] epoch #1 | Saved
2025-03-29 15:35:01 | [maml_trainer] epoch #1 | Time 5202.54 s
2025-03-29 15:35:01 | [maml_trainer] epoch #1 | EpochTime 2508.21 s
-------------------------------------------------  ---------------
Average/AverageDiscountedReturn                      -77.739
Average/AverageReturn                               -181.998
Average/Iteration                                      1
Average/MaxReturn                                   -114.121
Average/MinReturn                                   -208.155
Average/NumEpisodes                                   80
Average/StdReturn                                     21.1785
Average/TerminationRate                                0
GaussianMLPPolicy/Entropy                              9.92885
GaussianMLPPolicy/KLAfter                              0.0167083
GaussianMLPPolicy/KLBefore                             0
GaussianMLPPolicy/LossAfter                            1.83799e-05
GaussianMLPPolicy/LossBefore                           3.23355e-09
GaussianMLPPolicy/dLoss                               -1.83766e-05
Iteration                                              1
MetaTest/Average/AverageDiscountedReturn            -182.093
MetaTest/Average/AverageReturn                      -182.093
MetaTest/Average/Iteration                             1
MetaTest/Average/MaxReturn                          -135.252
MetaTest/Average/MinReturn                          -201.663
MetaTest/Average/NumEpisodes                          20
MetaTest/Average/StdReturn                            16.923
MetaTest/Average/TerminationRate                       0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -182.093
MetaTest/__unnamed_task__/AverageReturn             -182.093
MetaTest/__unnamed_task__/Iteration                    1
MetaTest/__unnamed_task__/MaxReturn                 -135.252
MetaTest/__unnamed_task__/MinReturn                 -201.663
MetaTest/__unnamed_task__/NumEpisodes                 20
MetaTest/__unnamed_task__/StdReturn                   16.923
MetaTest/__unnamed_task__/TerminationRate              0
TotalEnvSteps                                      64000
__unnamed_task__/AverageDiscountedReturn             -77.739
__unnamed_task__/AverageReturn                      -181.998
__unnamed_task__/Iteration                             1
__unnamed_task__/MaxReturn                          -114.121
__unnamed_task__/MinReturn                          -208.155
__unnamed_task__/NumEpisodes                          80
__unnamed_task__/StdReturn                            21.1785
__unnamed_task__/TerminationRate                       0
-------------------------------------------------  ---------------
2025-03-29 15:49:54 | [maml_trainer] epoch #2 | Sampling for adapation and meta-testing...
2025-03-29 15:53:33 | [maml_trainer] epoch #2 | Finished meta-testing...
2025-03-29 15:53:33 | [maml_trainer] epoch #2 | Saving snapshot...
2025-03-29 15:53:58 | [maml_trainer] epoch #2 | Saved
2025-03-29 15:53:58 | [maml_trainer] epoch #2 | Time 6339.89 s
2025-03-29 15:53:58 | [maml_trainer] epoch #2 | EpochTime 1137.34 s
-------------------------------------------------  ---------------
Average/AverageDiscountedReturn                      -74.4718
Average/AverageReturn                               -172.667
Average/Iteration                                      2
Average/MaxReturn                                   -109.883
Average/MinReturn                                   -201.5
Average/NumEpisodes                                   80
Average/StdReturn                                     23.0811
Average/TerminationRate                                0
GaussianMLPPolicy/Entropy                              9.93337
GaussianMLPPolicy/KLAfter                              0.0174124
GaussianMLPPolicy/KLBefore                             0
GaussianMLPPolicy/LossAfter                           -7.11334e-05
GaussianMLPPolicy/LossBefore                           3.14415e-09
GaussianMLPPolicy/dLoss                                7.11365e-05
Iteration                                              2
MetaTest/Average/AverageDiscountedReturn            -151.168
MetaTest/Average/AverageReturn                      -151.168
MetaTest/Average/Iteration                             2
MetaTest/Average/MaxReturn                          -113.581
MetaTest/Average/MinReturn                          -196.478
MetaTest/Average/NumEpisodes                          20
MetaTest/Average/StdReturn                            25.6446
MetaTest/Average/TerminationRate                       0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -151.168
MetaTest/__unnamed_task__/AverageReturn             -151.168
MetaTest/__unnamed_task__/Iteration                    2
MetaTest/__unnamed_task__/MaxReturn                 -113.581
MetaTest/__unnamed_task__/MinReturn                 -196.478
MetaTest/__unnamed_task__/NumEpisodes                 20
MetaTest/__unnamed_task__/StdReturn                   25.6446
MetaTest/__unnamed_task__/TerminationRate              0
TotalEnvSteps                                      96000
__unnamed_task__/AverageDiscountedReturn             -74.4718
__unnamed_task__/AverageReturn                      -172.667
__unnamed_task__/Iteration                             2
__unnamed_task__/MaxReturn                          -109.883
__unnamed_task__/MinReturn                          -201.5
__unnamed_task__/NumEpisodes                          80
__unnamed_task__/StdReturn                            23.0811
__unnamed_task__/TerminationRate                       0
-------------------------------------------------  ---------------
2025-03-29 16:08:35 | [maml_trainer] epoch #3 | Sampling for adapation and meta-testing...
2025-03-29 16:12:12 | [maml_trainer] epoch #3 | Finished meta-testing...
2025-03-29 16:12:12 | [maml_trainer] epoch #3 | Saving snapshot...
2025-03-29 16:12:30 | [maml_trainer] epoch #3 | Saved
2025-03-29 16:12:30 | [maml_trainer] epoch #3 | Time 7451.28 s
2025-03-29 16:12:30 | [maml_trainer] epoch #3 | EpochTime 1111.39 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -68.066
Average/AverageReturn                                -153.78
Average/Iteration                                       3
Average/MaxReturn                                    -107.395
Average/MinReturn                                    -203.582
Average/NumEpisodes                                    80
Average/StdReturn                                      27.6886
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.93872
GaussianMLPPolicy/KLAfter                               0.0151199
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000121231
GaussianMLPPolicy/LossBefore                            5.57303e-09
GaussianMLPPolicy/dLoss                                 0.000121237
Iteration                                               3
MetaTest/Average/AverageDiscountedReturn             -137.086
MetaTest/Average/AverageReturn                       -137.086
MetaTest/Average/Iteration                              3
MetaTest/Average/MaxReturn                           -112.305
MetaTest/Average/MinReturn                           -205.435
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             27.3853
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -137.086
MetaTest/__unnamed_task__/AverageReturn              -137.086
MetaTest/__unnamed_task__/Iteration                     3
MetaTest/__unnamed_task__/MaxReturn                  -112.305
MetaTest/__unnamed_task__/MinReturn                  -205.435
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    27.3853
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      128000
__unnamed_task__/AverageDiscountedReturn              -68.066
__unnamed_task__/AverageReturn                       -153.78
__unnamed_task__/Iteration                              3
__unnamed_task__/MaxReturn                           -107.395
__unnamed_task__/MinReturn                           -203.582
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             27.6886
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 16:27:27 | [maml_trainer] epoch #4 | Sampling for adapation and meta-testing...
2025-03-29 16:30:59 | [maml_trainer] epoch #4 | Finished meta-testing...
2025-03-29 16:30:59 | [maml_trainer] epoch #4 | Saving snapshot...
2025-03-29 16:31:17 | [maml_trainer] epoch #4 | Saved
2025-03-29 16:31:17 | [maml_trainer] epoch #4 | Time 8578.73 s
2025-03-29 16:31:17 | [maml_trainer] epoch #4 | EpochTime 1127.45 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -61.5336
Average/AverageReturn                                -137.048
Average/Iteration                                       4
Average/MaxReturn                                    -100.233
Average/MinReturn                                    -190.829
Average/NumEpisodes                                    80
Average/StdReturn                                      24.0293
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.94401
GaussianMLPPolicy/KLAfter                               0.0170275
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000103669
GaussianMLPPolicy/LossBefore                            1.43051e-09
GaussianMLPPolicy/dLoss                                 0.000103671
Iteration                                               4
MetaTest/Average/AverageDiscountedReturn             -117.73
MetaTest/Average/AverageReturn                       -117.73
MetaTest/Average/Iteration                              4
MetaTest/Average/MaxReturn                            -95.9234
MetaTest/Average/MinReturn                           -139.476
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             10.6439
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -117.73
MetaTest/__unnamed_task__/AverageReturn              -117.73
MetaTest/__unnamed_task__/Iteration                     4
MetaTest/__unnamed_task__/MaxReturn                   -95.9234
MetaTest/__unnamed_task__/MinReturn                  -139.476
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    10.6439
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      160000
__unnamed_task__/AverageDiscountedReturn              -61.5336
__unnamed_task__/AverageReturn                       -137.048
__unnamed_task__/Iteration                              4
__unnamed_task__/MaxReturn                           -100.233
__unnamed_task__/MinReturn                           -190.829
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             24.0293
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 16:45:56 | [maml_trainer] epoch #5 | Sampling for adapation and meta-testing...
2025-03-29 16:49:29 | [maml_trainer] epoch #5 | Finished meta-testing...
2025-03-29 16:49:29 | [maml_trainer] epoch #5 | Saving snapshot...
2025-03-29 16:49:48 | [maml_trainer] epoch #5 | Saved
2025-03-29 16:49:48 | [maml_trainer] epoch #5 | Time 9689.42 s
2025-03-29 16:49:48 | [maml_trainer] epoch #5 | EpochTime 1110.69 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -54.6357
Average/AverageReturn                                -118.954
Average/Iteration                                       5
Average/MaxReturn                                     -96.6705
Average/MinReturn                                    -173.076
Average/NumEpisodes                                    80
Average/StdReturn                                      14.651
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.94919
GaussianMLPPolicy/KLAfter                               0.0155094
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -8.49818e-05
GaussianMLPPolicy/LossBefore                           -1.69873e-09
GaussianMLPPolicy/dLoss                                 8.49801e-05
Iteration                                               5
MetaTest/Average/AverageDiscountedReturn             -113.253
MetaTest/Average/AverageReturn                       -113.253
MetaTest/Average/Iteration                              5
MetaTest/Average/MaxReturn                            -93.6043
MetaTest/Average/MinReturn                           -127.387
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              8.6004
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -113.253
MetaTest/__unnamed_task__/AverageReturn              -113.253
MetaTest/__unnamed_task__/Iteration                     5
MetaTest/__unnamed_task__/MaxReturn                   -93.6043
MetaTest/__unnamed_task__/MinReturn                  -127.387
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     8.6004
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      192000
__unnamed_task__/AverageDiscountedReturn              -54.6357
__unnamed_task__/AverageReturn                       -118.954
__unnamed_task__/Iteration                              5
__unnamed_task__/MaxReturn                            -96.6705
__unnamed_task__/MinReturn                           -173.076
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             14.651
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 17:04:03 | [maml_trainer] epoch #6 | Sampling for adapation and meta-testing...
2025-03-29 17:07:37 | [maml_trainer] epoch #6 | Finished meta-testing...
2025-03-29 17:07:37 | [maml_trainer] epoch #6 | Saving snapshot...
2025-03-29 17:07:56 | [maml_trainer] epoch #6 | Saved
2025-03-29 17:07:56 | [maml_trainer] epoch #6 | Time 10777.62 s
2025-03-29 17:07:56 | [maml_trainer] epoch #6 | EpochTime 1088.20 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -51.8901
Average/AverageReturn                                -112.45
Average/Iteration                                       6
Average/MaxReturn                                     -93.8763
Average/MinReturn                                    -165.547
Average/NumEpisodes                                    80
Average/StdReturn                                       9.29064
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.95488
GaussianMLPPolicy/KLAfter                               0.0127908
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -4.05952e-05
GaussianMLPPolicy/LossBefore                           -4.73857e-09
GaussianMLPPolicy/dLoss                                 4.05904e-05
Iteration                                               6
MetaTest/Average/AverageDiscountedReturn             -106.046
MetaTest/Average/AverageReturn                       -106.046
MetaTest/Average/Iteration                              6
MetaTest/Average/MaxReturn                            -91.1024
MetaTest/Average/MinReturn                           -123.493
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              9.57805
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -106.046
MetaTest/__unnamed_task__/AverageReturn              -106.046
MetaTest/__unnamed_task__/Iteration                     6
MetaTest/__unnamed_task__/MaxReturn                   -91.1024
MetaTest/__unnamed_task__/MinReturn                  -123.493
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     9.57805
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      224000
__unnamed_task__/AverageDiscountedReturn              -51.8901
__unnamed_task__/AverageReturn                       -112.45
__unnamed_task__/Iteration                              6
__unnamed_task__/MaxReturn                            -93.8763
__unnamed_task__/MinReturn                           -165.547
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              9.29064
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 17:22:14 | [maml_trainer] epoch #7 | Sampling for adapation and meta-testing...
2025-03-29 17:25:50 | [maml_trainer] epoch #7 | Finished meta-testing...
2025-03-29 17:25:50 | [maml_trainer] epoch #7 | Saving snapshot...
2025-03-29 17:26:08 | [maml_trainer] epoch #7 | Saved
2025-03-29 17:26:08 | [maml_trainer] epoch #7 | Time 11869.61 s
2025-03-29 17:26:08 | [maml_trainer] epoch #7 | EpochTime 1091.99 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -49.7706
Average/AverageReturn                                -106.593
Average/Iteration                                       7
Average/MaxReturn                                     -84.0775
Average/MinReturn                                    -152.182
Average/NumEpisodes                                    80
Average/StdReturn                                       9.30248
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96089
GaussianMLPPolicy/KLAfter                               0.00990651
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000145924
GaussianMLPPolicy/LossBefore                            2.80142e-09
GaussianMLPPolicy/dLoss                                 0.000145927
Iteration                                               7
MetaTest/Average/AverageDiscountedReturn             -101.288
MetaTest/Average/AverageReturn                       -101.288
MetaTest/Average/Iteration                              7
MetaTest/Average/MaxReturn                            -84.6947
MetaTest/Average/MinReturn                           -112.773
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              6.69814
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -101.288
MetaTest/__unnamed_task__/AverageReturn              -101.288
MetaTest/__unnamed_task__/Iteration                     7
MetaTest/__unnamed_task__/MaxReturn                   -84.6947
MetaTest/__unnamed_task__/MinReturn                  -112.773
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     6.69814
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      256000
__unnamed_task__/AverageDiscountedReturn              -49.7706
__unnamed_task__/AverageReturn                       -106.593
__unnamed_task__/Iteration                              7
__unnamed_task__/MaxReturn                            -84.0775
__unnamed_task__/MinReturn                           -152.182
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              9.30248
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 17:40:33 | [maml_trainer] epoch #8 | Sampling for adapation and meta-testing...
2025-03-29 17:44:02 | [maml_trainer] epoch #8 | Finished meta-testing...
2025-03-29 17:44:02 | [maml_trainer] epoch #8 | Saving snapshot...
2025-03-29 17:44:20 | [maml_trainer] epoch #8 | Saved
2025-03-29 17:44:20 | [maml_trainer] epoch #8 | Time 12962.01 s
2025-03-29 17:44:20 | [maml_trainer] epoch #8 | EpochTime 1092.40 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -48.0997
Average/AverageReturn                                -101.737
Average/Iteration                                       8
Average/MaxReturn                                     -86.0529
Average/MinReturn                                    -122.63
Average/NumEpisodes                                    80
Average/StdReturn                                       7.35582
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96613
GaussianMLPPolicy/KLAfter                               0.00941518
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             0.000107881
GaussianMLPPolicy/LossBefore                            1.78814e-10
GaussianMLPPolicy/dLoss                                -0.000107881
Iteration                                               8
MetaTest/Average/AverageDiscountedReturn              -96.4115
MetaTest/Average/AverageReturn                        -96.4115
MetaTest/Average/Iteration                              8
MetaTest/Average/MaxReturn                            -84.5984
MetaTest/Average/MinReturn                           -113.651
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              6.14611
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -96.4115
MetaTest/__unnamed_task__/AverageReturn               -96.4115
MetaTest/__unnamed_task__/Iteration                     8
MetaTest/__unnamed_task__/MaxReturn                   -84.5984
MetaTest/__unnamed_task__/MinReturn                  -113.651
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     6.14611
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      288000
__unnamed_task__/AverageDiscountedReturn              -48.0997
__unnamed_task__/AverageReturn                       -101.737
__unnamed_task__/Iteration                              8
__unnamed_task__/MaxReturn                            -86.0529
__unnamed_task__/MinReturn                           -122.63
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.35582
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 17:58:24 | [maml_trainer] epoch #9 | Sampling for adapation and meta-testing...
2025-03-29 18:02:02 | [maml_trainer] epoch #9 | Finished meta-testing...
2025-03-29 18:02:02 | [maml_trainer] epoch #9 | Saving snapshot...
2025-03-29 18:02:21 | [maml_trainer] epoch #9 | Saved
2025-03-29 18:02:21 | [maml_trainer] epoch #9 | Time 14042.66 s
2025-03-29 18:02:21 | [maml_trainer] epoch #9 | EpochTime 1080.64 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -47.5626
Average/AverageReturn                                 -99.9979
Average/Iteration                                       9
Average/MaxReturn                                     -77.0455
Average/MinReturn                                    -119.184
Average/NumEpisodes                                    80
Average/StdReturn                                       8.46917
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.97179
GaussianMLPPolicy/KLAfter                               0.0122861
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000130503
GaussianMLPPolicy/LossBefore                            1.2815e-09
GaussianMLPPolicy/dLoss                                 0.000130504
Iteration                                               9
MetaTest/Average/AverageDiscountedReturn              -97.5832
MetaTest/Average/AverageReturn                        -97.5832
MetaTest/Average/Iteration                              9
MetaTest/Average/MaxReturn                            -75.1328
MetaTest/Average/MinReturn                           -111.216
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              9.13949
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -97.5832
MetaTest/__unnamed_task__/AverageReturn               -97.5832
MetaTest/__unnamed_task__/Iteration                     9
MetaTest/__unnamed_task__/MaxReturn                   -75.1328
MetaTest/__unnamed_task__/MinReturn                  -111.216
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     9.13949
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      320000
__unnamed_task__/AverageDiscountedReturn              -47.5626
__unnamed_task__/AverageReturn                        -99.9979
__unnamed_task__/Iteration                              9
__unnamed_task__/MaxReturn                            -77.0455
__unnamed_task__/MinReturn                           -119.184
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.46917
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 18:16:45 | [maml_trainer] epoch #10 | Sampling for adapation and meta-testing...
2025-03-29 18:20:22 | [maml_trainer] epoch #10 | Finished meta-testing...
2025-03-29 18:20:22 | [maml_trainer] epoch #10 | Saving snapshot...
2025-03-29 18:20:41 | [maml_trainer] epoch #10 | Saved
2025-03-29 18:20:41 | [maml_trainer] epoch #10 | Time 15142.11 s
2025-03-29 18:20:41 | [maml_trainer] epoch #10 | EpochTime 1099.45 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -46.0745
Average/AverageReturn                                 -96.256
Average/Iteration                                      10
Average/MaxReturn                                     -80.0254
Average/MinReturn                                    -106.699
Average/NumEpisodes                                    80
Average/StdReturn                                       6.48753
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.97581
GaussianMLPPolicy/KLAfter                               0.00679781
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             3.39427e-05
GaussianMLPPolicy/LossBefore                            1.77026e-08
GaussianMLPPolicy/dLoss                                -3.3925e-05
Iteration                                              10
MetaTest/Average/AverageDiscountedReturn              -94.5052
MetaTest/Average/AverageReturn                        -94.5052
MetaTest/Average/Iteration                             10
MetaTest/Average/MaxReturn                            -84.0868
MetaTest/Average/MinReturn                           -105.103
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              5.40841
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -94.5052
MetaTest/__unnamed_task__/AverageReturn               -94.5052
MetaTest/__unnamed_task__/Iteration                    10
MetaTest/__unnamed_task__/MaxReturn                   -84.0868
MetaTest/__unnamed_task__/MinReturn                  -105.103
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     5.40841
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      352000
__unnamed_task__/AverageDiscountedReturn              -46.0745
__unnamed_task__/AverageReturn                        -96.256
__unnamed_task__/Iteration                             10
__unnamed_task__/MaxReturn                            -80.0254
__unnamed_task__/MinReturn                           -106.699
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              6.48753
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 18:35:06 | [maml_trainer] epoch #11 | Sampling for adapation and meta-testing...
2025-03-29 18:38:45 | [maml_trainer] epoch #11 | Finished meta-testing...
2025-03-29 18:38:45 | [maml_trainer] epoch #11 | Saving snapshot...
2025-03-29 18:39:03 | [maml_trainer] epoch #11 | Saved
2025-03-29 18:39:03 | [maml_trainer] epoch #11 | Time 16244.92 s
2025-03-29 18:39:03 | [maml_trainer] epoch #11 | EpochTime 1102.81 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -45.5352
Average/AverageReturn                                 -94.5383
Average/Iteration                                      11
Average/MaxReturn                                     -73.6762
Average/MinReturn                                    -109.491
Average/NumEpisodes                                    80
Average/StdReturn                                       8.25946
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.9773
GaussianMLPPolicy/KLAfter                               0.0047538
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -7.09733e-05
GaussianMLPPolicy/LossBefore                           -1.01626e-08
GaussianMLPPolicy/dLoss                                 7.09632e-05
Iteration                                              11
MetaTest/Average/AverageDiscountedReturn              -93.5671
MetaTest/Average/AverageReturn                        -93.5671
MetaTest/Average/Iteration                             11
MetaTest/Average/MaxReturn                            -77.8634
MetaTest/Average/MinReturn                           -111.295
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.69372
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -93.5671
MetaTest/__unnamed_task__/AverageReturn               -93.5671
MetaTest/__unnamed_task__/Iteration                    11
MetaTest/__unnamed_task__/MaxReturn                   -77.8634
MetaTest/__unnamed_task__/MinReturn                  -111.295
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.69372
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      384000
__unnamed_task__/AverageDiscountedReturn              -45.5352
__unnamed_task__/AverageReturn                        -94.5383
__unnamed_task__/Iteration                             11
__unnamed_task__/MaxReturn                            -73.6762
__unnamed_task__/MinReturn                           -109.491
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.25946
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 18:53:30 | [maml_trainer] epoch #12 | Sampling for adapation and meta-testing...
2025-03-29 18:57:07 | [maml_trainer] epoch #12 | Finished meta-testing...
2025-03-29 18:57:07 | [maml_trainer] epoch #12 | Saving snapshot...
2025-03-29 18:57:26 | [maml_trainer] epoch #12 | Saved
2025-03-29 18:57:26 | [maml_trainer] epoch #12 | Time 17347.50 s
2025-03-29 18:57:26 | [maml_trainer] epoch #12 | EpochTime 1102.58 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -44.2988
Average/AverageReturn                                 -91.641
Average/Iteration                                      12
Average/MaxReturn                                     -74.2556
Average/MinReturn                                    -107.967
Average/NumEpisodes                                    80
Average/StdReturn                                       7.70799
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.97989
GaussianMLPPolicy/KLAfter                               0.00380214
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -7.29006e-05
GaussianMLPPolicy/LossBefore                           -6.3777e-09
GaussianMLPPolicy/dLoss                                 7.28943e-05
Iteration                                              12
MetaTest/Average/AverageDiscountedReturn              -90.1427
MetaTest/Average/AverageReturn                        -90.1427
MetaTest/Average/Iteration                             12
MetaTest/Average/MaxReturn                            -75.1154
MetaTest/Average/MinReturn                           -105.122
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              8.42643
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -90.1427
MetaTest/__unnamed_task__/AverageReturn               -90.1427
MetaTest/__unnamed_task__/Iteration                    12
MetaTest/__unnamed_task__/MaxReturn                   -75.1154
MetaTest/__unnamed_task__/MinReturn                  -105.122
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     8.42643
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      416000
__unnamed_task__/AverageDiscountedReturn              -44.2988
__unnamed_task__/AverageReturn                        -91.641
__unnamed_task__/Iteration                             12
__unnamed_task__/MaxReturn                            -74.2556
__unnamed_task__/MinReturn                           -107.967
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.70799
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 19:11:51 | [maml_trainer] epoch #13 | Sampling for adapation and meta-testing...
2025-03-29 19:15:27 | [maml_trainer] epoch #13 | Finished meta-testing...
2025-03-29 19:15:27 | [maml_trainer] epoch #13 | Saving snapshot...
2025-03-29 19:15:46 | [maml_trainer] epoch #13 | Saved
2025-03-29 19:15:46 | [maml_trainer] epoch #13 | Time 18447.05 s
2025-03-29 19:15:46 | [maml_trainer] epoch #13 | EpochTime 1099.55 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -44.4211
Average/AverageReturn                                 -91.7099
Average/Iteration                                      13
Average/MaxReturn                                     -77.8717
Average/MinReturn                                    -110.913
Average/NumEpisodes                                    80
Average/StdReturn                                       7.10949
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98314
GaussianMLPPolicy/KLAfter                               0.00589673
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             6.93649e-05
GaussianMLPPolicy/LossBefore                           -2.68221e-10
GaussianMLPPolicy/dLoss                                -6.93651e-05
Iteration                                              13
MetaTest/Average/AverageDiscountedReturn              -89.5117
MetaTest/Average/AverageReturn                        -89.5117
MetaTest/Average/Iteration                             13
MetaTest/Average/MaxReturn                            -76.6584
MetaTest/Average/MinReturn                           -111.179
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              9.78343
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -89.5117
MetaTest/__unnamed_task__/AverageReturn               -89.5117
MetaTest/__unnamed_task__/Iteration                    13
MetaTest/__unnamed_task__/MaxReturn                   -76.6584
MetaTest/__unnamed_task__/MinReturn                  -111.179
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     9.78343
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      448000
__unnamed_task__/AverageDiscountedReturn              -44.4211
__unnamed_task__/AverageReturn                        -91.7099
__unnamed_task__/Iteration                             13
__unnamed_task__/MaxReturn                            -77.8717
__unnamed_task__/MinReturn                           -110.913
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.10949
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 19:30:00 | [maml_trainer] epoch #14 | Sampling for adapation and meta-testing...
2025-03-29 19:33:38 | [maml_trainer] epoch #14 | Finished meta-testing...
2025-03-29 19:33:38 | [maml_trainer] epoch #14 | Saving snapshot...
2025-03-29 19:33:58 | [maml_trainer] epoch #14 | Saved
2025-03-29 19:33:58 | [maml_trainer] epoch #14 | Time 19539.05 s
2025-03-29 19:33:58 | [maml_trainer] epoch #14 | EpochTime 1091.99 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -44.184
Average/AverageReturn                                 -91.3549
Average/Iteration                                      14
Average/MaxReturn                                     -74.7981
Average/MinReturn                                    -112.451
Average/NumEpisodes                                    80
Average/StdReturn                                       7.34246
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98566
GaussianMLPPolicy/KLAfter                               0.00554289
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000135135
GaussianMLPPolicy/LossBefore                            7.83801e-09
GaussianMLPPolicy/dLoss                                 0.000135143
Iteration                                              14
MetaTest/Average/AverageDiscountedReturn              -85.9367
MetaTest/Average/AverageReturn                        -85.9367
MetaTest/Average/Iteration                             14
MetaTest/Average/MaxReturn                            -76.0258
MetaTest/Average/MinReturn                            -98.301
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              5.71631
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -85.9367
MetaTest/__unnamed_task__/AverageReturn               -85.9367
MetaTest/__unnamed_task__/Iteration                    14
MetaTest/__unnamed_task__/MaxReturn                   -76.0258
MetaTest/__unnamed_task__/MinReturn                   -98.301
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     5.71631
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      480000
__unnamed_task__/AverageDiscountedReturn              -44.184
__unnamed_task__/AverageReturn                        -91.3549
__unnamed_task__/Iteration                             14
__unnamed_task__/MaxReturn                            -74.7981
__unnamed_task__/MinReturn                           -112.451
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.34246
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 19:48:35 | [maml_trainer] epoch #15 | Sampling for adapation and meta-testing...
2025-03-29 19:52:25 | [maml_trainer] epoch #15 | Finished meta-testing...
2025-03-29 19:52:25 | [maml_trainer] epoch #15 | Saving snapshot...
2025-03-29 19:52:43 | [maml_trainer] epoch #15 | Saved
2025-03-29 19:52:43 | [maml_trainer] epoch #15 | Time 20664.63 s
2025-03-29 19:52:43 | [maml_trainer] epoch #15 | EpochTime 1125.58 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -42.9182
Average/AverageReturn                                 -88.7597
Average/Iteration                                      15
Average/MaxReturn                                     -68.5596
Average/MinReturn                                    -106.585
Average/NumEpisodes                                    80
Average/StdReturn                                       7.74858
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98738
GaussianMLPPolicy/KLAfter                               0.00657281
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -3.89444e-05
GaussianMLPPolicy/LossBefore                           -4.73857e-09
GaussianMLPPolicy/dLoss                                 3.89396e-05
Iteration                                              15
MetaTest/Average/AverageDiscountedReturn              -87.4191
MetaTest/Average/AverageReturn                        -87.4191
MetaTest/Average/Iteration                             15
MetaTest/Average/MaxReturn                            -76.7098
MetaTest/Average/MinReturn                            -96.9215
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              5.4876
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -87.4191
MetaTest/__unnamed_task__/AverageReturn               -87.4191
MetaTest/__unnamed_task__/Iteration                    15
MetaTest/__unnamed_task__/MaxReturn                   -76.7098
MetaTest/__unnamed_task__/MinReturn                   -96.9215
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     5.4876
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      512000
__unnamed_task__/AverageDiscountedReturn              -42.9182
__unnamed_task__/AverageReturn                        -88.7597
__unnamed_task__/Iteration                             15
__unnamed_task__/MaxReturn                            -68.5596
__unnamed_task__/MinReturn                           -106.585
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.74858
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 20:08:03 | [maml_trainer] epoch #16 | Sampling for adapation and meta-testing...
2025-03-29 20:12:07 | [maml_trainer] epoch #16 | Finished meta-testing...
2025-03-29 20:12:07 | [maml_trainer] epoch #16 | Saving snapshot...
2025-03-29 20:12:26 | [maml_trainer] epoch #16 | Saved
2025-03-29 20:12:26 | [maml_trainer] epoch #16 | Time 21847.45 s
2025-03-29 20:12:26 | [maml_trainer] epoch #16 | EpochTime 1182.81 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -42.1616
Average/AverageReturn                                 -86.8405
Average/Iteration                                      16
Average/MaxReturn                                     -68.4834
Average/MinReturn                                    -106.56
Average/NumEpisodes                                    80
Average/StdReturn                                       8.69316
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98808
GaussianMLPPolicy/KLAfter                               0.00443145
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -8.56231e-05
GaussianMLPPolicy/LossBefore                            5.66244e-10
GaussianMLPPolicy/dLoss                                 8.56237e-05
Iteration                                              16
MetaTest/Average/AverageDiscountedReturn              -85.452
MetaTest/Average/AverageReturn                        -85.452
MetaTest/Average/Iteration                             16
MetaTest/Average/MaxReturn                            -72.4457
MetaTest/Average/MinReturn                            -97.156
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              6.8053
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -85.452
MetaTest/__unnamed_task__/AverageReturn               -85.452
MetaTest/__unnamed_task__/Iteration                    16
MetaTest/__unnamed_task__/MaxReturn                   -72.4457
MetaTest/__unnamed_task__/MinReturn                   -97.156
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     6.8053
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      544000
__unnamed_task__/AverageDiscountedReturn              -42.1616
__unnamed_task__/AverageReturn                        -86.8405
__unnamed_task__/Iteration                             16
__unnamed_task__/MaxReturn                            -68.4834
__unnamed_task__/MinReturn                           -106.56
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.69316
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 20:29:05 | [maml_trainer] epoch #17 | Sampling for adapation and meta-testing...
2025-03-29 20:32:47 | [maml_trainer] epoch #17 | Finished meta-testing...
2025-03-29 20:32:47 | [maml_trainer] epoch #17 | Saving snapshot...
2025-03-29 20:33:06 | [maml_trainer] epoch #17 | Saved
2025-03-29 20:33:06 | [maml_trainer] epoch #17 | Time 23087.69 s
2025-03-29 20:33:06 | [maml_trainer] epoch #17 | EpochTime 1240.24 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -42.0064
Average/AverageReturn                                 -86.4679
Average/Iteration                                      17
Average/MaxReturn                                     -64.9759
Average/MinReturn                                    -106.147
Average/NumEpisodes                                    80
Average/StdReturn                                       7.44741
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98852
GaussianMLPPolicy/KLAfter                               0.00423174
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             1.23616e-05
GaussianMLPPolicy/LossBefore                            4.52995e-09
GaussianMLPPolicy/dLoss                                -1.2357e-05
Iteration                                              17
MetaTest/Average/AverageDiscountedReturn              -85.5974
MetaTest/Average/AverageReturn                        -85.5974
MetaTest/Average/Iteration                             17
MetaTest/Average/MaxReturn                            -76.2361
MetaTest/Average/MinReturn                            -94.6891
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              6.06291
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -85.5974
MetaTest/__unnamed_task__/AverageReturn               -85.5974
MetaTest/__unnamed_task__/Iteration                    17
MetaTest/__unnamed_task__/MaxReturn                   -76.2361
MetaTest/__unnamed_task__/MinReturn                   -94.6891
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     6.06291
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      576000
__unnamed_task__/AverageDiscountedReturn              -42.0064
__unnamed_task__/AverageReturn                        -86.4679
__unnamed_task__/Iteration                             17
__unnamed_task__/MaxReturn                            -64.9759
__unnamed_task__/MinReturn                           -106.147
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.44741
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 20:48:04 | [maml_trainer] epoch #18 | Sampling for adapation and meta-testing...
2025-03-29 20:51:48 | [maml_trainer] epoch #18 | Finished meta-testing...
2025-03-29 20:51:48 | [maml_trainer] epoch #18 | Saving snapshot...
2025-03-29 20:52:08 | [maml_trainer] epoch #18 | Saved
2025-03-29 20:52:08 | [maml_trainer] epoch #18 | Time 24229.44 s
2025-03-29 20:52:08 | [maml_trainer] epoch #18 | EpochTime 1141.75 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -40.5412
Average/AverageReturn                                 -83.3442
Average/Iteration                                      18
Average/MaxReturn                                     -67.843
Average/MinReturn                                    -104.212
Average/NumEpisodes                                    80
Average/StdReturn                                       8.31696
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98739
GaussianMLPPolicy/KLAfter                               0.00504685
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             2.7662e-05
GaussianMLPPolicy/LossBefore                            2.01762e-08
GaussianMLPPolicy/dLoss                                -2.76419e-05
Iteration                                              18
MetaTest/Average/AverageDiscountedReturn              -83.9848
MetaTest/Average/AverageReturn                        -83.9848
MetaTest/Average/Iteration                             18
MetaTest/Average/MaxReturn                            -67.131
MetaTest/Average/MinReturn                            -97.3472
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.33707
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -83.9848
MetaTest/__unnamed_task__/AverageReturn               -83.9848
MetaTest/__unnamed_task__/Iteration                    18
MetaTest/__unnamed_task__/MaxReturn                   -67.131
MetaTest/__unnamed_task__/MinReturn                   -97.3472
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.33707
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      608000
__unnamed_task__/AverageDiscountedReturn              -40.5412
__unnamed_task__/AverageReturn                        -83.3442
__unnamed_task__/Iteration                             18
__unnamed_task__/MaxReturn                            -67.843
__unnamed_task__/MinReturn                           -104.212
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.31696
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 21:07:42 | [maml_trainer] epoch #19 | Sampling for adapation and meta-testing...
2025-03-29 21:12:14 | [maml_trainer] epoch #19 | Finished meta-testing...
2025-03-29 21:12:14 | [maml_trainer] epoch #19 | Saving snapshot...
2025-03-29 21:12:40 | [maml_trainer] epoch #19 | Saved
2025-03-29 21:12:40 | [maml_trainer] epoch #19 | Time 25461.56 s
2025-03-29 21:12:40 | [maml_trainer] epoch #19 | EpochTime 1232.12 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -40.293
Average/AverageReturn                                 -81.9016
Average/Iteration                                      19
Average/MaxReturn                                     -62.9009
Average/MinReturn                                     -98.1728
Average/NumEpisodes                                    80
Average/StdReturn                                       8.32451
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98773
GaussianMLPPolicy/KLAfter                               0.00653278
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             5.03172e-05
GaussianMLPPolicy/LossBefore                           -4.20213e-09
GaussianMLPPolicy/dLoss                                -5.03214e-05
Iteration                                              19
MetaTest/Average/AverageDiscountedReturn              -77.915
MetaTest/Average/AverageReturn                        -77.915
MetaTest/Average/Iteration                             19
MetaTest/Average/MaxReturn                            -62.651
MetaTest/Average/MinReturn                            -94.5604
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              8.52851
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -77.915
MetaTest/__unnamed_task__/AverageReturn               -77.915
MetaTest/__unnamed_task__/Iteration                    19
MetaTest/__unnamed_task__/MaxReturn                   -62.651
MetaTest/__unnamed_task__/MinReturn                   -94.5604
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     8.52851
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      640000
__unnamed_task__/AverageDiscountedReturn              -40.293
__unnamed_task__/AverageReturn                        -81.9016
__unnamed_task__/Iteration                             19
__unnamed_task__/MaxReturn                            -62.9009
__unnamed_task__/MinReturn                            -98.1728
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.32451
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 21:29:07 | [maml_trainer] epoch #20 | Sampling for adapation and meta-testing...
2025-03-29 21:33:28 | [maml_trainer] epoch #20 | Finished meta-testing...
2025-03-29 21:33:28 | [maml_trainer] epoch #20 | Saving snapshot...
2025-03-29 21:33:49 | [maml_trainer] epoch #20 | Saved
2025-03-29 21:33:49 | [maml_trainer] epoch #20 | Time 26730.45 s
2025-03-29 21:33:49 | [maml_trainer] epoch #20 | EpochTime 1268.88 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -40.5124
Average/AverageReturn                                 -82.7279
Average/Iteration                                      20
Average/MaxReturn                                     -64.2478
Average/MinReturn                                    -104.283
Average/NumEpisodes                                    80
Average/StdReturn                                       7.62047
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98808
GaussianMLPPolicy/KLAfter                               0.00588516
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -4.023e-05
GaussianMLPPolicy/LossBefore                           -2.44379e-09
GaussianMLPPolicy/dLoss                                 4.02276e-05
Iteration                                              20
MetaTest/Average/AverageDiscountedReturn              -78.9486
MetaTest/Average/AverageReturn                        -78.9486
MetaTest/Average/Iteration                             20
MetaTest/Average/MaxReturn                            -64.2495
MetaTest/Average/MinReturn                            -97.0389
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.77431
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -78.9486
MetaTest/__unnamed_task__/AverageReturn               -78.9486
MetaTest/__unnamed_task__/Iteration                    20
MetaTest/__unnamed_task__/MaxReturn                   -64.2495
MetaTest/__unnamed_task__/MinReturn                   -97.0389
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.77431
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      672000
__unnamed_task__/AverageDiscountedReturn              -40.5124
__unnamed_task__/AverageReturn                        -82.7279
__unnamed_task__/Iteration                             20
__unnamed_task__/MaxReturn                            -64.2478
__unnamed_task__/MinReturn                           -104.283
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.62047
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 21:50:05 | [maml_trainer] epoch #21 | Sampling for adapation and meta-testing...
2025-03-29 21:53:55 | [maml_trainer] epoch #21 | Finished meta-testing...
2025-03-29 21:53:55 | [maml_trainer] epoch #21 | Saving snapshot...
2025-03-29 21:54:14 | [maml_trainer] epoch #21 | Saved
2025-03-29 21:54:14 | [maml_trainer] epoch #21 | Time 27955.67 s
2025-03-29 21:54:14 | [maml_trainer] epoch #21 | EpochTime 1225.22 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -39.1371
Average/AverageReturn                                 -79.3492
Average/Iteration                                      21
Average/MaxReturn                                     -64.0934
Average/MinReturn                                     -97.2364
Average/NumEpisodes                                    80
Average/StdReturn                                       7.46332
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98958
GaussianMLPPolicy/KLAfter                               0.00621178
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000169701
GaussianMLPPolicy/LossBefore                            1.78814e-09
GaussianMLPPolicy/dLoss                                 0.000169702
Iteration                                              21
MetaTest/Average/AverageDiscountedReturn              -81.293
MetaTest/Average/AverageReturn                        -81.293
MetaTest/Average/Iteration                             21
MetaTest/Average/MaxReturn                            -61.4477
MetaTest/Average/MinReturn                            -97.6531
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              9.27894
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -81.293
MetaTest/__unnamed_task__/AverageReturn               -81.293
MetaTest/__unnamed_task__/Iteration                    21
MetaTest/__unnamed_task__/MaxReturn                   -61.4477
MetaTest/__unnamed_task__/MinReturn                   -97.6531
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     9.27894
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      704000
__unnamed_task__/AverageDiscountedReturn              -39.1371
__unnamed_task__/AverageReturn                        -79.3492
__unnamed_task__/Iteration                             21
__unnamed_task__/MaxReturn                            -64.0934
__unnamed_task__/MinReturn                            -97.2364
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.46332
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 22:09:47 | [maml_trainer] epoch #22 | Sampling for adapation and meta-testing...
2025-03-29 22:13:37 | [maml_trainer] epoch #22 | Finished meta-testing...
2025-03-29 22:13:37 | [maml_trainer] epoch #22 | Saving snapshot...
2025-03-29 22:13:57 | [maml_trainer] epoch #22 | Saved
2025-03-29 22:13:57 | [maml_trainer] epoch #22 | Time 29138.42 s
2025-03-29 22:13:57 | [maml_trainer] epoch #22 | EpochTime 1182.75 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -39.0393
Average/AverageReturn                                 -78.1868
Average/Iteration                                      22
Average/MaxReturn                                     -62.4644
Average/MinReturn                                    -100.727
Average/NumEpisodes                                    80
Average/StdReturn                                       8.25478
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99013
GaussianMLPPolicy/KLAfter                               0.00648733
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             5.47659e-06
GaussianMLPPolicy/LossBefore                            7.86781e-09
GaussianMLPPolicy/dLoss                                -5.46873e-06
Iteration                                              22
MetaTest/Average/AverageDiscountedReturn              -77.5203
MetaTest/Average/AverageReturn                        -77.5203
MetaTest/Average/Iteration                             22
MetaTest/Average/MaxReturn                            -66.799
MetaTest/Average/MinReturn                            -93.7182
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              8.05823
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -77.5203
MetaTest/__unnamed_task__/AverageReturn               -77.5203
MetaTest/__unnamed_task__/Iteration                    22
MetaTest/__unnamed_task__/MaxReturn                   -66.799
MetaTest/__unnamed_task__/MinReturn                   -93.7182
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     8.05823
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      736000
__unnamed_task__/AverageDiscountedReturn              -39.0393
__unnamed_task__/AverageReturn                        -78.1868
__unnamed_task__/Iteration                             22
__unnamed_task__/MaxReturn                            -62.4644
__unnamed_task__/MinReturn                           -100.727
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.25478
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 22:29:32 | [maml_trainer] epoch #23 | Sampling for adapation and meta-testing...
2025-03-29 22:33:19 | [maml_trainer] epoch #23 | Finished meta-testing...
2025-03-29 22:33:19 | [maml_trainer] epoch #23 | Saving snapshot...
2025-03-29 22:33:44 | [maml_trainer] epoch #23 | Saved
2025-03-29 22:33:44 | [maml_trainer] epoch #23 | Time 30325.91 s
2025-03-29 22:33:44 | [maml_trainer] epoch #23 | EpochTime 1187.49 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -38.6514
Average/AverageReturn                                 -77.2321
Average/Iteration                                      23
Average/MaxReturn                                     -60.5929
Average/MinReturn                                     -99.1665
Average/NumEpisodes                                    80
Average/StdReturn                                       8.54462
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99009
GaussianMLPPolicy/KLAfter                               0.00495013
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -3.9822e-05
GaussianMLPPolicy/LossBefore                           -6.34789e-09
GaussianMLPPolicy/dLoss                                 3.98157e-05
Iteration                                              23
MetaTest/Average/AverageDiscountedReturn              -81.0673
MetaTest/Average/AverageReturn                        -81.0673
MetaTest/Average/Iteration                             23
MetaTest/Average/MaxReturn                            -66.4252
MetaTest/Average/MinReturn                            -95.045
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.70191
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -81.0673
MetaTest/__unnamed_task__/AverageReturn               -81.0673
MetaTest/__unnamed_task__/Iteration                    23
MetaTest/__unnamed_task__/MaxReturn                   -66.4252
MetaTest/__unnamed_task__/MinReturn                   -95.045
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.70191
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      768000
__unnamed_task__/AverageDiscountedReturn              -38.6514
__unnamed_task__/AverageReturn                        -77.2321
__unnamed_task__/Iteration                             23
__unnamed_task__/MaxReturn                            -60.5929
__unnamed_task__/MinReturn                            -99.1665
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.54462
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 22:49:27 | [maml_trainer] epoch #24 | Sampling for adapation and meta-testing...
2025-03-29 22:53:17 | [maml_trainer] epoch #24 | Finished meta-testing...
2025-03-29 22:53:17 | [maml_trainer] epoch #24 | Saving snapshot...
2025-03-29 22:53:35 | [maml_trainer] epoch #24 | Saved
2025-03-29 22:53:35 | [maml_trainer] epoch #24 | Time 31517.02 s
2025-03-29 22:53:35 | [maml_trainer] epoch #24 | EpochTime 1191.10 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -39.2607
Average/AverageReturn                                 -78.2703
Average/Iteration                                      24
Average/MaxReturn                                     -54.8975
Average/MinReturn                                     -99.8802
Average/NumEpisodes                                    80
Average/StdReturn                                       8.38224
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99185
GaussianMLPPolicy/KLAfter                               0.00455429
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -6.12408e-06
GaussianMLPPolicy/LossBefore                            3.93391e-09
GaussianMLPPolicy/dLoss                                 6.12801e-06
Iteration                                              24
MetaTest/Average/AverageDiscountedReturn              -77.3183
MetaTest/Average/AverageReturn                        -77.3183
MetaTest/Average/Iteration                             24
MetaTest/Average/MaxReturn                            -62.821
MetaTest/Average/MinReturn                            -91.9925
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.90627
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -77.3183
MetaTest/__unnamed_task__/AverageReturn               -77.3183
MetaTest/__unnamed_task__/Iteration                    24
MetaTest/__unnamed_task__/MaxReturn                   -62.821
MetaTest/__unnamed_task__/MinReturn                   -91.9925
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.90627
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      800000
__unnamed_task__/AverageDiscountedReturn              -39.2607
__unnamed_task__/AverageReturn                        -78.2703
__unnamed_task__/Iteration                             24
__unnamed_task__/MaxReturn                            -54.8975
__unnamed_task__/MinReturn                            -99.8802
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.38224
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 23:08:52 | [maml_trainer] epoch #25 | Sampling for adapation and meta-testing...
2025-03-29 23:12:45 | [maml_trainer] epoch #25 | Finished meta-testing...
2025-03-29 23:12:45 | [maml_trainer] epoch #25 | Saving snapshot...
2025-03-29 23:13:04 | [maml_trainer] epoch #25 | Saved
2025-03-29 23:13:04 | [maml_trainer] epoch #25 | Time 32685.10 s
2025-03-29 23:13:04 | [maml_trainer] epoch #25 | EpochTime 1168.08 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -38.9653
Average/AverageReturn                                 -77.5143
Average/Iteration                                      25
Average/MaxReturn                                     -56.8329
Average/MinReturn                                    -102.339
Average/NumEpisodes                                    80
Average/StdReturn                                       9.2522
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99353
GaussianMLPPolicy/KLAfter                               0.00390212
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -4.11071e-05
GaussianMLPPolicy/LossBefore                            3.09944e-09
GaussianMLPPolicy/dLoss                                 4.11102e-05
Iteration                                              25
MetaTest/Average/AverageDiscountedReturn              -76.4429
MetaTest/Average/AverageReturn                        -76.4429
MetaTest/Average/Iteration                             25
MetaTest/Average/MaxReturn                            -64.9046
MetaTest/Average/MinReturn                            -90.3075
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.10372
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -76.4429
MetaTest/__unnamed_task__/AverageReturn               -76.4429
MetaTest/__unnamed_task__/Iteration                    25
MetaTest/__unnamed_task__/MaxReturn                   -64.9046
MetaTest/__unnamed_task__/MinReturn                   -90.3075
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.10372
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      832000
__unnamed_task__/AverageDiscountedReturn              -38.9653
__unnamed_task__/AverageReturn                        -77.5143
__unnamed_task__/Iteration                             25
__unnamed_task__/MaxReturn                            -56.8329
__unnamed_task__/MinReturn                           -102.339
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              9.2522
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 23:28:16 | [maml_trainer] epoch #26 | Sampling for adapation and meta-testing...
2025-03-29 23:32:02 | [maml_trainer] epoch #26 | Finished meta-testing...
2025-03-29 23:32:02 | [maml_trainer] epoch #26 | Saving snapshot...
2025-03-29 23:32:21 | [maml_trainer] epoch #26 | Saved
2025-03-29 23:32:21 | [maml_trainer] epoch #26 | Time 33842.07 s
2025-03-29 23:32:21 | [maml_trainer] epoch #26 | EpochTime 1156.97 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -38.4893
Average/AverageReturn                                 -75.8672
Average/Iteration                                      26
Average/MaxReturn                                     -56.3208
Average/MinReturn                                    -106.57
Average/NumEpisodes                                    80
Average/StdReturn                                       7.88509
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99464
GaussianMLPPolicy/KLAfter                               0.00439373
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -3.36744e-05
GaussianMLPPolicy/LossBefore                            9.65595e-09
GaussianMLPPolicy/dLoss                                 3.3684e-05
Iteration                                              26
MetaTest/Average/AverageDiscountedReturn              -73.5904
MetaTest/Average/AverageReturn                        -73.5904
MetaTest/Average/Iteration                             26
MetaTest/Average/MaxReturn                            -58.4429
MetaTest/Average/MinReturn                            -92.3816
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              6.97084
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -73.5904
MetaTest/__unnamed_task__/AverageReturn               -73.5904
MetaTest/__unnamed_task__/Iteration                    26
MetaTest/__unnamed_task__/MaxReturn                   -58.4429
MetaTest/__unnamed_task__/MinReturn                   -92.3816
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     6.97084
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      864000
__unnamed_task__/AverageDiscountedReturn              -38.4893
__unnamed_task__/AverageReturn                        -75.8672
__unnamed_task__/Iteration                             26
__unnamed_task__/MaxReturn                            -56.3208
__unnamed_task__/MinReturn                           -106.57
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              7.88509
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-29 23:47:29 | [maml_trainer] epoch #27 | Sampling for adapation and meta-testing...
2025-03-29 23:51:17 | [maml_trainer] epoch #27 | Finished meta-testing...
2025-03-29 23:51:17 | [maml_trainer] epoch #27 | Saving snapshot...
2025-03-29 23:51:36 | [maml_trainer] epoch #27 | Saved
2025-03-29 23:51:36 | [maml_trainer] epoch #27 | Time 34997.57 s
2025-03-29 23:51:36 | [maml_trainer] epoch #27 | EpochTime 1155.49 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -37.619
Average/AverageReturn                                 -74.0338
Average/Iteration                                      27
Average/MaxReturn                                     -57.3566
Average/MinReturn                                     -93.3387
Average/NumEpisodes                                    80
Average/StdReturn                                       8.25711
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99539
GaussianMLPPolicy/KLAfter                               0.00423975
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -5.14696e-05
GaussianMLPPolicy/LossBefore                           -8.04663e-10
GaussianMLPPolicy/dLoss                                 5.14688e-05
Iteration                                              27
MetaTest/Average/AverageDiscountedReturn              -73.2912
MetaTest/Average/AverageReturn                        -73.2912
MetaTest/Average/Iteration                             27
MetaTest/Average/MaxReturn                            -61.0363
MetaTest/Average/MinReturn                            -85.9363
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              6.6946
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -73.2912
MetaTest/__unnamed_task__/AverageReturn               -73.2912
MetaTest/__unnamed_task__/Iteration                    27
MetaTest/__unnamed_task__/MaxReturn                   -61.0363
MetaTest/__unnamed_task__/MinReturn                   -85.9363
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     6.6946
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      896000
__unnamed_task__/AverageDiscountedReturn              -37.619
__unnamed_task__/AverageReturn                        -74.0338
__unnamed_task__/Iteration                             27
__unnamed_task__/MaxReturn                            -57.3566
__unnamed_task__/MinReturn                            -93.3387
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.25711
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-30 00:07:01 | [maml_trainer] epoch #28 | Sampling for adapation and meta-testing...
2025-03-30 00:10:54 | [maml_trainer] epoch #28 | Finished meta-testing...
2025-03-30 00:10:54 | [maml_trainer] epoch #28 | Saving snapshot...
2025-03-30 00:11:14 | [maml_trainer] epoch #28 | Saved
2025-03-30 00:11:14 | [maml_trainer] epoch #28 | Time 36175.25 s
2025-03-30 00:11:14 | [maml_trainer] epoch #28 | EpochTime 1177.68 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -37.5926
Average/AverageReturn                                 -73.2493
Average/Iteration                                      28
Average/MaxReturn                                     -51.5353
Average/MinReturn                                    -103.984
Average/NumEpisodes                                    80
Average/StdReturn                                       8.62127
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99619
GaussianMLPPolicy/KLAfter                               0.00540624
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             8.6349e-05
GaussianMLPPolicy/LossBefore                           -8.34465e-10
GaussianMLPPolicy/dLoss                                -8.63498e-05
Iteration                                              28
MetaTest/Average/AverageDiscountedReturn              -69.8318
MetaTest/Average/AverageReturn                        -69.8318
MetaTest/Average/Iteration                             28
MetaTest/Average/MaxReturn                            -59.1333
MetaTest/Average/MinReturn                            -85.8919
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.84116
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -69.8318
MetaTest/__unnamed_task__/AverageReturn               -69.8318
MetaTest/__unnamed_task__/Iteration                    28
MetaTest/__unnamed_task__/MaxReturn                   -59.1333
MetaTest/__unnamed_task__/MinReturn                   -85.8919
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.84116
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      928000
__unnamed_task__/AverageDiscountedReturn              -37.5926
__unnamed_task__/AverageReturn                        -73.2493
__unnamed_task__/Iteration                             28
__unnamed_task__/MaxReturn                            -51.5353
__unnamed_task__/MinReturn                           -103.984
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.62127
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-30 00:26:35 | [maml_trainer] epoch #29 | Sampling for adapation and meta-testing...
2025-03-30 00:30:27 | [maml_trainer] epoch #29 | Finished meta-testing...
2025-03-30 00:30:27 | [maml_trainer] epoch #29 | Saving snapshot...
2025-03-30 00:30:45 | [maml_trainer] epoch #29 | Saved
2025-03-30 00:30:45 | [maml_trainer] epoch #29 | Time 37346.37 s
2025-03-30 00:30:45 | [maml_trainer] epoch #29 | EpochTime 1171.11 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -37.2795
Average/AverageReturn                                 -73.0523
Average/Iteration                                      29
Average/MaxReturn                                     -58.5436
Average/MinReturn                                    -107.782
Average/NumEpisodes                                    80
Average/StdReturn                                       8.99926
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99548
GaussianMLPPolicy/KLAfter                               0.00820142
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -4.05774e-05
GaussianMLPPolicy/LossBefore                            1.2815e-08
GaussianMLPPolicy/dLoss                                 4.05903e-05
Iteration                                              29
MetaTest/Average/AverageDiscountedReturn              -73.5466
MetaTest/Average/AverageReturn                        -73.5466
MetaTest/Average/Iteration                             29
MetaTest/Average/MaxReturn                            -61.929
MetaTest/Average/MinReturn                            -93.6044
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.32256
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -73.5466
MetaTest/__unnamed_task__/AverageReturn               -73.5466
MetaTest/__unnamed_task__/Iteration                    29
MetaTest/__unnamed_task__/MaxReturn                   -61.929
MetaTest/__unnamed_task__/MinReturn                   -93.6044
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.32256
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      960000
__unnamed_task__/AverageDiscountedReturn              -37.2795
__unnamed_task__/AverageReturn                        -73.0523
__unnamed_task__/Iteration                             29
__unnamed_task__/MaxReturn                            -58.5436
__unnamed_task__/MinReturn                           -107.782
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                              8.99926
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-30 00:46:00 | [maml_trainer] epoch #30 | Sampling for adapation and meta-testing...
2025-03-30 00:49:47 | [maml_trainer] epoch #30 | Finished meta-testing...
2025-03-30 00:49:47 | [maml_trainer] epoch #30 | Saving snapshot...
2025-03-30 00:50:06 | [maml_trainer] epoch #30 | Saved
2025-03-30 00:50:06 | [maml_trainer] epoch #30 | Time 38507.83 s
2025-03-30 00:50:06 | [maml_trainer] epoch #30 | EpochTime 1161.45 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -37.4665
Average/AverageReturn                                 -74.243
Average/Iteration                                      30
Average/MaxReturn                                     -56.8646
Average/MinReturn                                    -105.34
Average/NumEpisodes                                    80
Average/StdReturn                                      10.4928
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99394
GaussianMLPPolicy/KLAfter                               0.00501623
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -4.50298e-05
GaussianMLPPolicy/LossBefore                            8.94067e-11
GaussianMLPPolicy/dLoss                                 4.50298e-05
Iteration                                              30
MetaTest/Average/AverageDiscountedReturn              -71.6487
MetaTest/Average/AverageReturn                        -71.6487
MetaTest/Average/Iteration                             30
MetaTest/Average/MaxReturn                            -55.5973
MetaTest/Average/MinReturn                            -88.3613
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              7.66005
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -71.6487
MetaTest/__unnamed_task__/AverageReturn               -71.6487
MetaTest/__unnamed_task__/Iteration                    30
MetaTest/__unnamed_task__/MaxReturn                   -55.5973
MetaTest/__unnamed_task__/MinReturn                   -88.3613
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     7.66005
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      992000
__unnamed_task__/AverageDiscountedReturn              -37.4665
__unnamed_task__/AverageReturn                        -74.243
__unnamed_task__/Iteration                             30
__unnamed_task__/MaxReturn                            -56.8646
__unnamed_task__/MinReturn                           -105.34
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             10.4928
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-03-30 01:05:15 | [maml_trainer] epoch #31 | Sampling for adapation and meta-testing...
2025-03-30 01:09:03 | [maml_trainer] epoch #31 | Finished meta-testing...
2025-03-30 01:09:03 | [maml_trainer] epoch #31 | Saving snapshot...
2025-03-30 01:09:22 | [maml_trainer] epoch #31 | Saved
2025-03-30 01:09:22 | [maml_trainer] epoch #31 | Time 39663.66 s
2025-03-30 01:09:22 | [maml_trainer] epoch #31 | EpochTime 1155.83 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -37.0946
Average/AverageReturn                               -72.7077
Average/Iteration                                    31
Average/MaxReturn                                   -54.9062
Average/MinReturn                                  -105.692
Average/NumEpisodes                                  80
Average/StdReturn                                     8.95361
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99306
GaussianMLPPolicy/KLAfter                             0.00564931
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.5789e-05
GaussianMLPPolicy/LossBefore                          3.57628e-09
GaussianMLPPolicy/dLoss                               1.57926e-05
Iteration                                            31
MetaTest/Average/AverageDiscountedReturn            -72.3601
MetaTest/Average/AverageReturn                      -72.3601
MetaTest/Average/Iteration                           31
MetaTest/Average/MaxReturn                          -57.8592
MetaTest/Average/MinReturn                          -91.2836
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.27259
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -72.3601
MetaTest/__unnamed_task__/AverageReturn             -72.3601
MetaTest/__unnamed_task__/Iteration                  31
MetaTest/__unnamed_task__/MaxReturn                 -57.8592
MetaTest/__unnamed_task__/MinReturn                 -91.2836
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.27259
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.024e+06
__unnamed_task__/AverageDiscountedReturn            -37.0946
__unnamed_task__/AverageReturn                      -72.7077
__unnamed_task__/Iteration                           31
__unnamed_task__/MaxReturn                          -54.9062
__unnamed_task__/MinReturn                         -105.692
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.95361
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 01:24:31 | [maml_trainer] epoch #32 | Sampling for adapation and meta-testing...
2025-03-30 01:28:20 | [maml_trainer] epoch #32 | Finished meta-testing...
2025-03-30 01:28:20 | [maml_trainer] epoch #32 | Saving snapshot...
2025-03-30 01:28:39 | [maml_trainer] epoch #32 | Saved
2025-03-30 01:28:39 | [maml_trainer] epoch #32 | Time 40820.69 s
2025-03-30 01:28:39 | [maml_trainer] epoch #32 | EpochTime 1157.03 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -37.3497
Average/AverageReturn                               -73.5079
Average/Iteration                                    32
Average/MaxReturn                                   -52.5385
Average/MinReturn                                  -103.177
Average/NumEpisodes                                  80
Average/StdReturn                                     9.60238
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99214
GaussianMLPPolicy/KLAfter                             0.00590476
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.10662e-05
GaussianMLPPolicy/LossBefore                         -2.05636e-09
GaussianMLPPolicy/dLoss                              -2.10683e-05
Iteration                                            32
MetaTest/Average/AverageDiscountedReturn            -72.7471
MetaTest/Average/AverageReturn                      -72.7471
MetaTest/Average/Iteration                           32
MetaTest/Average/MaxReturn                          -56.8577
MetaTest/Average/MinReturn                          -87.1797
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.84465
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -72.7471
MetaTest/__unnamed_task__/AverageReturn             -72.7471
MetaTest/__unnamed_task__/Iteration                  32
MetaTest/__unnamed_task__/MaxReturn                 -56.8577
MetaTest/__unnamed_task__/MinReturn                 -87.1797
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.84465
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.056e+06
__unnamed_task__/AverageDiscountedReturn            -37.3497
__unnamed_task__/AverageReturn                      -73.5079
__unnamed_task__/Iteration                           32
__unnamed_task__/MaxReturn                          -52.5385
__unnamed_task__/MinReturn                         -103.177
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.60238
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 01:44:03 | [maml_trainer] epoch #33 | Sampling for adapation and meta-testing...
2025-03-30 01:47:56 | [maml_trainer] epoch #33 | Finished meta-testing...
2025-03-30 01:47:56 | [maml_trainer] epoch #33 | Saving snapshot...
2025-03-30 01:48:14 | [maml_trainer] epoch #33 | Saved
2025-03-30 01:48:14 | [maml_trainer] epoch #33 | Time 41995.79 s
2025-03-30 01:48:14 | [maml_trainer] epoch #33 | EpochTime 1175.09 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.8805
Average/AverageReturn                               -71.8276
Average/Iteration                                    33
Average/MaxReturn                                   -55.1094
Average/MinReturn                                   -98.2301
Average/NumEpisodes                                  80
Average/StdReturn                                     7.78342
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9909
GaussianMLPPolicy/KLAfter                             0.00394269
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           9.31437e-05
GaussianMLPPolicy/LossBefore                         -2.38419e-10
GaussianMLPPolicy/dLoss                              -9.31439e-05
Iteration                                            33
MetaTest/Average/AverageDiscountedReturn            -75.5403
MetaTest/Average/AverageReturn                      -75.5403
MetaTest/Average/Iteration                           33
MetaTest/Average/MaxReturn                          -59.5254
MetaTest/Average/MinReturn                         -103.37
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.1374
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -75.5403
MetaTest/__unnamed_task__/AverageReturn             -75.5403
MetaTest/__unnamed_task__/Iteration                  33
MetaTest/__unnamed_task__/MaxReturn                 -59.5254
MetaTest/__unnamed_task__/MinReturn                -103.37
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.1374
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.088e+06
__unnamed_task__/AverageDiscountedReturn            -36.8805
__unnamed_task__/AverageReturn                      -71.8276
__unnamed_task__/Iteration                           33
__unnamed_task__/MaxReturn                          -55.1094
__unnamed_task__/MinReturn                          -98.2301
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            7.78342
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 02:03:22 | [maml_trainer] epoch #34 | Sampling for adapation and meta-testing...
2025-03-30 02:07:12 | [maml_trainer] epoch #34 | Finished meta-testing...
2025-03-30 02:07:12 | [maml_trainer] epoch #34 | Saving snapshot...
2025-03-30 02:07:31 | [maml_trainer] epoch #34 | Saved
2025-03-30 02:07:31 | [maml_trainer] epoch #34 | Time 43152.13 s
2025-03-30 02:07:31 | [maml_trainer] epoch #34 | EpochTime 1156.34 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.4516
Average/AverageReturn                               -71.333
Average/Iteration                                    34
Average/MaxReturn                                   -49.2488
Average/MinReturn                                   -99.0932
Average/NumEpisodes                                  80
Average/StdReturn                                     8.8994
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98876
GaussianMLPPolicy/KLAfter                             0.00424328
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.68705e-05
GaussianMLPPolicy/LossBefore                         -6.4075e-09
GaussianMLPPolicy/dLoss                              -2.68769e-05
Iteration                                            34
MetaTest/Average/AverageDiscountedReturn            -72.4147
MetaTest/Average/AverageReturn                      -72.4147
MetaTest/Average/Iteration                           34
MetaTest/Average/MaxReturn                          -53.7246
MetaTest/Average/MinReturn                         -102.553
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           12.3654
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -72.4147
MetaTest/__unnamed_task__/AverageReturn             -72.4147
MetaTest/__unnamed_task__/Iteration                  34
MetaTest/__unnamed_task__/MaxReturn                 -53.7246
MetaTest/__unnamed_task__/MinReturn                -102.553
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  12.3654
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.12e+06
__unnamed_task__/AverageDiscountedReturn            -36.4516
__unnamed_task__/AverageReturn                      -71.333
__unnamed_task__/Iteration                           34
__unnamed_task__/MaxReturn                          -49.2488
__unnamed_task__/MinReturn                          -99.0932
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.8994
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 02:22:42 | [maml_trainer] epoch #35 | Sampling for adapation and meta-testing...
2025-03-30 02:26:26 | [maml_trainer] epoch #35 | Finished meta-testing...
2025-03-30 02:26:26 | [maml_trainer] epoch #35 | Saving snapshot...
2025-03-30 02:26:45 | [maml_trainer] epoch #35 | Saved
2025-03-30 02:26:45 | [maml_trainer] epoch #35 | Time 44306.87 s
2025-03-30 02:26:45 | [maml_trainer] epoch #35 | EpochTime 1154.74 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.7406
Average/AverageReturn                               -72.8103
Average/Iteration                                    35
Average/MaxReturn                                   -56.1665
Average/MinReturn                                  -102.853
Average/NumEpisodes                                  80
Average/StdReturn                                     8.92532
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98709
GaussianMLPPolicy/KLAfter                             0.00340089
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.66524e-05
GaussianMLPPolicy/LossBefore                         -1.12653e-08
GaussianMLPPolicy/dLoss                               1.66412e-05
Iteration                                            35
MetaTest/Average/AverageDiscountedReturn            -75.8542
MetaTest/Average/AverageReturn                      -75.8542
MetaTest/Average/Iteration                           35
MetaTest/Average/MaxReturn                          -60.8955
MetaTest/Average/MinReturn                         -100.432
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           11.311
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -75.8542
MetaTest/__unnamed_task__/AverageReturn             -75.8542
MetaTest/__unnamed_task__/Iteration                  35
MetaTest/__unnamed_task__/MaxReturn                 -60.8955
MetaTest/__unnamed_task__/MinReturn                -100.432
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  11.311
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.152e+06
__unnamed_task__/AverageDiscountedReturn            -36.7406
__unnamed_task__/AverageReturn                      -72.8103
__unnamed_task__/Iteration                           35
__unnamed_task__/MaxReturn                          -56.1665
__unnamed_task__/MinReturn                         -102.853
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.92532
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 02:41:50 | [maml_trainer] epoch #36 | Sampling for adapation and meta-testing...
2025-03-30 02:45:39 | [maml_trainer] epoch #36 | Finished meta-testing...
2025-03-30 02:45:39 | [maml_trainer] epoch #36 | Saving snapshot...
2025-03-30 02:45:58 | [maml_trainer] epoch #36 | Saved
2025-03-30 02:45:58 | [maml_trainer] epoch #36 | Time 45459.74 s
2025-03-30 02:45:58 | [maml_trainer] epoch #36 | EpochTime 1152.87 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -37.0912
Average/AverageReturn                               -73.5921
Average/Iteration                                    36
Average/MaxReturn                                   -56.5694
Average/MinReturn                                  -101.049
Average/NumEpisodes                                  80
Average/StdReturn                                     9.41712
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98615
GaussianMLPPolicy/KLAfter                             0.00316686
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.02998e-05
GaussianMLPPolicy/LossBefore                         -9.23872e-10
GaussianMLPPolicy/dLoss                               9.02989e-05
Iteration                                            36
MetaTest/Average/AverageDiscountedReturn            -73.155
MetaTest/Average/AverageReturn                      -73.155
MetaTest/Average/Iteration                           36
MetaTest/Average/MaxReturn                          -56.6504
MetaTest/Average/MinReturn                          -91.8004
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.94149
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -73.155
MetaTest/__unnamed_task__/AverageReturn             -73.155
MetaTest/__unnamed_task__/Iteration                  36
MetaTest/__unnamed_task__/MaxReturn                 -56.6504
MetaTest/__unnamed_task__/MinReturn                 -91.8004
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.94149
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.184e+06
__unnamed_task__/AverageDiscountedReturn            -37.0912
__unnamed_task__/AverageReturn                      -73.5921
__unnamed_task__/Iteration                           36
__unnamed_task__/MaxReturn                          -56.5694
__unnamed_task__/MinReturn                         -101.049
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.41712
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 03:01:05 | [maml_trainer] epoch #37 | Sampling for adapation and meta-testing...
2025-03-30 03:04:52 | [maml_trainer] epoch #37 | Finished meta-testing...
2025-03-30 03:04:52 | [maml_trainer] epoch #37 | Saving snapshot...
2025-03-30 03:05:11 | [maml_trainer] epoch #37 | Saved
2025-03-30 03:05:11 | [maml_trainer] epoch #37 | Time 46612.75 s
2025-03-30 03:05:11 | [maml_trainer] epoch #37 | EpochTime 1153.00 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -37.2924
Average/AverageReturn                               -74.4608
Average/Iteration                                    37
Average/MaxReturn                                   -52.543
Average/MinReturn                                  -108.952
Average/NumEpisodes                                  80
Average/StdReturn                                    10.3376
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98455
GaussianMLPPolicy/KLAfter                             0.00291497
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -8.37182e-05
GaussianMLPPolicy/LossBefore                          1.57952e-09
GaussianMLPPolicy/dLoss                               8.37197e-05
Iteration                                            37
MetaTest/Average/AverageDiscountedReturn            -74.7993
MetaTest/Average/AverageReturn                      -74.7993
MetaTest/Average/Iteration                           37
MetaTest/Average/MaxReturn                          -55.0935
MetaTest/Average/MinReturn                          -91.6709
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.13376
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -74.7993
MetaTest/__unnamed_task__/AverageReturn             -74.7993
MetaTest/__unnamed_task__/Iteration                  37
MetaTest/__unnamed_task__/MaxReturn                 -55.0935
MetaTest/__unnamed_task__/MinReturn                 -91.6709
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.13376
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.216e+06
__unnamed_task__/AverageDiscountedReturn            -37.2924
__unnamed_task__/AverageReturn                      -74.4608
__unnamed_task__/Iteration                           37
__unnamed_task__/MaxReturn                          -52.543
__unnamed_task__/MinReturn                         -108.952
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.3376
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 03:20:26 | [maml_trainer] epoch #38 | Sampling for adapation and meta-testing...
2025-03-30 03:24:13 | [maml_trainer] epoch #38 | Finished meta-testing...
2025-03-30 03:24:13 | [maml_trainer] epoch #38 | Saving snapshot...
2025-03-30 03:24:31 | [maml_trainer] epoch #38 | Saved
2025-03-30 03:24:31 | [maml_trainer] epoch #38 | Time 47772.51 s
2025-03-30 03:24:31 | [maml_trainer] epoch #38 | EpochTime 1159.75 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -37.5391
Average/AverageReturn                              -75.2278
Average/Iteration                                   38
Average/MaxReturn                                  -56.7293
Average/MinReturn                                  -96.3083
Average/NumEpisodes                                 80
Average/StdReturn                                    9.34174
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98249
GaussianMLPPolicy/KLAfter                            0.0013104
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.68165e-05
GaussianMLPPolicy/LossBefore                        -1.27554e-08
GaussianMLPPolicy/dLoss                             -2.68292e-05
Iteration                                           38
MetaTest/Average/AverageDiscountedReturn           -77.0793
MetaTest/Average/AverageReturn                     -77.0793
MetaTest/Average/Iteration                          38
MetaTest/Average/MaxReturn                         -59.8339
MetaTest/Average/MinReturn                         -88.8127
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.75957
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -77.0793
MetaTest/__unnamed_task__/AverageReturn            -77.0793
MetaTest/__unnamed_task__/Iteration                 38
MetaTest/__unnamed_task__/MaxReturn                -59.8339
MetaTest/__unnamed_task__/MinReturn                -88.8127
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.75957
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.248e+06
__unnamed_task__/AverageDiscountedReturn           -37.5391
__unnamed_task__/AverageReturn                     -75.2278
__unnamed_task__/Iteration                          38
__unnamed_task__/MaxReturn                         -56.7293
__unnamed_task__/MinReturn                         -96.3083
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.34174
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 03:39:39 | [maml_trainer] epoch #39 | Sampling for adapation and meta-testing...
2025-03-30 03:43:27 | [maml_trainer] epoch #39 | Finished meta-testing...
2025-03-30 03:43:27 | [maml_trainer] epoch #39 | Saving snapshot...
2025-03-30 03:43:46 | [maml_trainer] epoch #39 | Saved
2025-03-30 03:43:46 | [maml_trainer] epoch #39 | Time 48927.35 s
2025-03-30 03:43:46 | [maml_trainer] epoch #39 | EpochTime 1154.84 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.4193
Average/AverageReturn                               -72.5379
Average/Iteration                                    39
Average/MaxReturn                                   -49.8306
Average/MinReturn                                  -102.671
Average/NumEpisodes                                  80
Average/StdReturn                                    10.8982
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98024
GaussianMLPPolicy/KLAfter                             0.00100474
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.42951e-05
GaussianMLPPolicy/LossBefore                          3.09944e-09
GaussianMLPPolicy/dLoss                               3.42982e-05
Iteration                                            39
MetaTest/Average/AverageDiscountedReturn            -75.2167
MetaTest/Average/AverageReturn                      -75.2167
MetaTest/Average/Iteration                           39
MetaTest/Average/MaxReturn                          -60.536
MetaTest/Average/MinReturn                          -92.4341
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.44411
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -75.2167
MetaTest/__unnamed_task__/AverageReturn             -75.2167
MetaTest/__unnamed_task__/Iteration                  39
MetaTest/__unnamed_task__/MaxReturn                 -60.536
MetaTest/__unnamed_task__/MinReturn                 -92.4341
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.44411
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.28e+06
__unnamed_task__/AverageDiscountedReturn            -36.4193
__unnamed_task__/AverageReturn                      -72.5379
__unnamed_task__/Iteration                           39
__unnamed_task__/MaxReturn                          -49.8306
__unnamed_task__/MinReturn                         -102.671
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.8982
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 03:58:58 | [maml_trainer] epoch #40 | Sampling for adapation and meta-testing...
2025-03-30 04:02:47 | [maml_trainer] epoch #40 | Finished meta-testing...
2025-03-30 04:02:47 | [maml_trainer] epoch #40 | Saving snapshot...
2025-03-30 04:03:06 | [maml_trainer] epoch #40 | Saved
2025-03-30 04:03:06 | [maml_trainer] epoch #40 | Time 50087.20 s
2025-03-30 04:03:06 | [maml_trainer] epoch #40 | EpochTime 1159.84 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -37.2816
Average/AverageReturn                               -74.6616
Average/Iteration                                    40
Average/MaxReturn                                   -55.3021
Average/MinReturn                                  -101.099
Average/NumEpisodes                                  80
Average/StdReturn                                    10.5999
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97764
GaussianMLPPolicy/KLAfter                             0.00123003
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.02526e-05
GaussianMLPPolicy/LossBefore                          8.88109e-09
GaussianMLPPolicy/dLoss                               9.02615e-05
Iteration                                            40
MetaTest/Average/AverageDiscountedReturn            -74.6646
MetaTest/Average/AverageReturn                      -74.6646
MetaTest/Average/Iteration                           40
MetaTest/Average/MaxReturn                          -58.8318
MetaTest/Average/MinReturn                          -94.8908
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.4725
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -74.6646
MetaTest/__unnamed_task__/AverageReturn             -74.6646
MetaTest/__unnamed_task__/Iteration                  40
MetaTest/__unnamed_task__/MaxReturn                 -58.8318
MetaTest/__unnamed_task__/MinReturn                 -94.8908
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.4725
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.312e+06
__unnamed_task__/AverageDiscountedReturn            -37.2816
__unnamed_task__/AverageReturn                      -74.6616
__unnamed_task__/Iteration                           40
__unnamed_task__/MaxReturn                          -55.3021
__unnamed_task__/MinReturn                         -101.099
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.5999
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 04:18:11 | [maml_trainer] epoch #41 | Sampling for adapation and meta-testing...
2025-03-30 04:21:58 | [maml_trainer] epoch #41 | Finished meta-testing...
2025-03-30 04:21:58 | [maml_trainer] epoch #41 | Saving snapshot...
2025-03-30 04:22:17 | [maml_trainer] epoch #41 | Saved
2025-03-30 04:22:17 | [maml_trainer] epoch #41 | Time 51238.02 s
2025-03-30 04:22:17 | [maml_trainer] epoch #41 | EpochTime 1150.82 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -37.3154
Average/AverageReturn                               -74.4014
Average/Iteration                                    41
Average/MaxReturn                                   -52.8987
Average/MinReturn                                   -99.1047
Average/NumEpisodes                                  80
Average/StdReturn                                    10.2155
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97562
GaussianMLPPolicy/KLAfter                             0.00183982
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.75738e-06
GaussianMLPPolicy/LossBefore                         -4.64916e-09
GaussianMLPPolicy/dLoss                              -4.76202e-06
Iteration                                            41
MetaTest/Average/AverageDiscountedReturn            -73.1431
MetaTest/Average/AverageReturn                      -73.1431
MetaTest/Average/Iteration                           41
MetaTest/Average/MaxReturn                          -50.2254
MetaTest/Average/MinReturn                         -107.159
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           11.968
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -73.1431
MetaTest/__unnamed_task__/AverageReturn             -73.1431
MetaTest/__unnamed_task__/Iteration                  41
MetaTest/__unnamed_task__/MaxReturn                 -50.2254
MetaTest/__unnamed_task__/MinReturn                -107.159
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  11.968
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.344e+06
__unnamed_task__/AverageDiscountedReturn            -37.3154
__unnamed_task__/AverageReturn                      -74.4014
__unnamed_task__/Iteration                           41
__unnamed_task__/MaxReturn                          -52.8987
__unnamed_task__/MinReturn                          -99.1047
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.2155
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 04:37:30 | [maml_trainer] epoch #42 | Sampling for adapation and meta-testing...
2025-03-30 04:41:18 | [maml_trainer] epoch #42 | Finished meta-testing...
2025-03-30 04:41:18 | [maml_trainer] epoch #42 | Saving snapshot...
2025-03-30 04:41:36 | [maml_trainer] epoch #42 | Saved
2025-03-30 04:41:36 | [maml_trainer] epoch #42 | Time 52397.57 s
2025-03-30 04:41:36 | [maml_trainer] epoch #42 | EpochTime 1159.54 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.7731
Average/AverageReturn                               -73.3162
Average/Iteration                                    42
Average/MaxReturn                                   -51.6155
Average/MinReturn                                   -95.3423
Average/NumEpisodes                                  80
Average/StdReturn                                    10.5624
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97442
GaussianMLPPolicy/KLAfter                             0.00115957
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           5.39981e-05
GaussianMLPPolicy/LossBefore                          6.13928e-09
GaussianMLPPolicy/dLoss                              -5.39919e-05
Iteration                                            42
MetaTest/Average/AverageDiscountedReturn            -74.7366
MetaTest/Average/AverageReturn                      -74.7366
MetaTest/Average/Iteration                           42
MetaTest/Average/MaxReturn                          -52.4039
MetaTest/Average/MinReturn                         -103.73
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           13.1375
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -74.7366
MetaTest/__unnamed_task__/AverageReturn             -74.7366
MetaTest/__unnamed_task__/Iteration                  42
MetaTest/__unnamed_task__/MaxReturn                 -52.4039
MetaTest/__unnamed_task__/MinReturn                -103.73
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  13.1375
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.376e+06
__unnamed_task__/AverageDiscountedReturn            -36.7731
__unnamed_task__/AverageReturn                      -73.3162
__unnamed_task__/Iteration                           42
__unnamed_task__/MaxReturn                          -51.6155
__unnamed_task__/MinReturn                          -95.3423
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.5624
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 04:56:46 | [maml_trainer] epoch #43 | Sampling for adapation and meta-testing...
2025-03-30 05:00:35 | [maml_trainer] epoch #43 | Finished meta-testing...
2025-03-30 05:00:35 | [maml_trainer] epoch #43 | Saving snapshot...
2025-03-30 05:00:54 | [maml_trainer] epoch #43 | Saved
2025-03-30 05:00:54 | [maml_trainer] epoch #43 | Time 53555.96 s
2025-03-30 05:00:54 | [maml_trainer] epoch #43 | EpochTime 1158.39 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.954
Average/AverageReturn                               -74.5294
Average/Iteration                                    43
Average/MaxReturn                                   -57.0835
Average/MinReturn                                  -102.206
Average/NumEpisodes                                  80
Average/StdReturn                                    11.4103
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9732
GaussianMLPPolicy/KLAfter                             0.0014267
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.87965e-06
GaussianMLPPolicy/LossBefore                          5.24521e-09
GaussianMLPPolicy/dLoss                               9.8849e-06
Iteration                                            43
MetaTest/Average/AverageDiscountedReturn            -72.8948
MetaTest/Average/AverageReturn                      -72.8948
MetaTest/Average/Iteration                           43
MetaTest/Average/MaxReturn                          -57.7517
MetaTest/Average/MinReturn                          -95.9168
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.40209
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -72.8948
MetaTest/__unnamed_task__/AverageReturn             -72.8948
MetaTest/__unnamed_task__/Iteration                  43
MetaTest/__unnamed_task__/MaxReturn                 -57.7517
MetaTest/__unnamed_task__/MinReturn                 -95.9168
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.40209
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.408e+06
__unnamed_task__/AverageDiscountedReturn            -36.954
__unnamed_task__/AverageReturn                      -74.5294
__unnamed_task__/Iteration                           43
__unnamed_task__/MaxReturn                          -57.0835
__unnamed_task__/MinReturn                         -102.206
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.4103
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 05:16:17 | [maml_trainer] epoch #44 | Sampling for adapation and meta-testing...
2025-03-30 05:20:05 | [maml_trainer] epoch #44 | Finished meta-testing...
2025-03-30 05:20:05 | [maml_trainer] epoch #44 | Saving snapshot...
2025-03-30 05:20:25 | [maml_trainer] epoch #44 | Saved
2025-03-30 05:20:25 | [maml_trainer] epoch #44 | Time 54726.26 s
2025-03-30 05:20:25 | [maml_trainer] epoch #44 | EpochTime 1170.29 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -37.0479
Average/AverageReturn                              -74.1627
Average/Iteration                                   44
Average/MaxReturn                                  -56.4595
Average/MinReturn                                  -94.4407
Average/NumEpisodes                                 80
Average/StdReturn                                    9.89138
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97147
GaussianMLPPolicy/KLAfter                            0.00203974
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.16829e-06
GaussianMLPPolicy/LossBefore                         7.33137e-09
GaussianMLPPolicy/dLoss                              5.17562e-06
Iteration                                           44
MetaTest/Average/AverageDiscountedReturn           -73.5263
MetaTest/Average/AverageReturn                     -73.5263
MetaTest/Average/Iteration                          44
MetaTest/Average/MaxReturn                         -60.3453
MetaTest/Average/MinReturn                         -93.2349
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.34565
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -73.5263
MetaTest/__unnamed_task__/AverageReturn            -73.5263
MetaTest/__unnamed_task__/Iteration                 44
MetaTest/__unnamed_task__/MaxReturn                -60.3453
MetaTest/__unnamed_task__/MinReturn                -93.2349
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.34565
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.44e+06
__unnamed_task__/AverageDiscountedReturn           -37.0479
__unnamed_task__/AverageReturn                     -74.1627
__unnamed_task__/Iteration                          44
__unnamed_task__/MaxReturn                         -56.4595
__unnamed_task__/MinReturn                         -94.4407
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.89138
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 05:35:42 | [maml_trainer] epoch #45 | Sampling for adapation and meta-testing...
2025-03-30 05:39:30 | [maml_trainer] epoch #45 | Finished meta-testing...
2025-03-30 05:39:30 | [maml_trainer] epoch #45 | Saving snapshot...
2025-03-30 05:39:49 | [maml_trainer] epoch #45 | Saved
2025-03-30 05:39:49 | [maml_trainer] epoch #45 | Time 55890.51 s
2025-03-30 05:39:49 | [maml_trainer] epoch #45 | EpochTime 1164.25 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.7074
Average/AverageReturn                               -74.2219
Average/Iteration                                    45
Average/MaxReturn                                   -53.189
Average/MinReturn                                  -106.012
Average/NumEpisodes                                  80
Average/StdReturn                                    12.0614
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97127
GaussianMLPPolicy/KLAfter                             0.00203822
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000134953
GaussianMLPPolicy/LossBefore                         -6.58631e-09
GaussianMLPPolicy/dLoss                               0.000134946
Iteration                                            45
MetaTest/Average/AverageDiscountedReturn            -70.5354
MetaTest/Average/AverageReturn                      -70.5354
MetaTest/Average/Iteration                           45
MetaTest/Average/MaxReturn                          -55.408
MetaTest/Average/MinReturn                          -93.4584
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.54395
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -70.5354
MetaTest/__unnamed_task__/AverageReturn             -70.5354
MetaTest/__unnamed_task__/Iteration                  45
MetaTest/__unnamed_task__/MaxReturn                 -55.408
MetaTest/__unnamed_task__/MinReturn                 -93.4584
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.54395
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.472e+06
__unnamed_task__/AverageDiscountedReturn            -36.7074
__unnamed_task__/AverageReturn                      -74.2219
__unnamed_task__/Iteration                           45
__unnamed_task__/MaxReturn                          -53.189
__unnamed_task__/MinReturn                         -106.012
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.0614
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 05:55:04 | [maml_trainer] epoch #46 | Sampling for adapation and meta-testing...
2025-03-30 05:58:52 | [maml_trainer] epoch #46 | Finished meta-testing...
2025-03-30 05:58:52 | [maml_trainer] epoch #46 | Saving snapshot...
2025-03-30 05:59:11 | [maml_trainer] epoch #46 | Saved
2025-03-30 05:59:11 | [maml_trainer] epoch #46 | Time 57052.15 s
2025-03-30 05:59:11 | [maml_trainer] epoch #46 | EpochTime 1161.64 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -35.308
Average/AverageReturn                               -70.0999
Average/Iteration                                    46
Average/MaxReturn                                   -50.7085
Average/MinReturn                                   -96.7041
Average/NumEpisodes                                  80
Average/StdReturn                                     9.48822
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97037
GaussianMLPPolicy/KLAfter                             0.00242521
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.9179e-05
GaussianMLPPolicy/LossBefore                          4.44055e-09
GaussianMLPPolicy/dLoss                               1.91835e-05
Iteration                                            46
MetaTest/Average/AverageDiscountedReturn            -75.755
MetaTest/Average/AverageReturn                      -75.755
MetaTest/Average/Iteration                           46
MetaTest/Average/MaxReturn                          -52.5598
MetaTest/Average/MinReturn                         -108.069
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           13.0543
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -75.755
MetaTest/__unnamed_task__/AverageReturn             -75.755
MetaTest/__unnamed_task__/Iteration                  46
MetaTest/__unnamed_task__/MaxReturn                 -52.5598
MetaTest/__unnamed_task__/MinReturn                -108.069
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  13.0543
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.504e+06
__unnamed_task__/AverageDiscountedReturn            -35.308
__unnamed_task__/AverageReturn                      -70.0999
__unnamed_task__/Iteration                           46
__unnamed_task__/MaxReturn                          -50.7085
__unnamed_task__/MinReturn                          -96.7041
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.48822
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 06:14:30 | [maml_trainer] epoch #47 | Sampling for adapation and meta-testing...
2025-03-30 06:18:20 | [maml_trainer] epoch #47 | Finished meta-testing...
2025-03-30 06:18:20 | [maml_trainer] epoch #47 | Saving snapshot...
2025-03-30 06:18:38 | [maml_trainer] epoch #47 | Saved
2025-03-30 06:18:38 | [maml_trainer] epoch #47 | Time 58219.61 s
2025-03-30 06:18:38 | [maml_trainer] epoch #47 | EpochTime 1167.45 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -35.2398
Average/AverageReturn                               -70.2842
Average/Iteration                                    47
Average/MaxReturn                                   -51.4477
Average/MinReturn                                   -94.4066
Average/NumEpisodes                                  80
Average/StdReturn                                    10.2812
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.96887
GaussianMLPPolicy/KLAfter                             0.0028483
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.68726e-05
GaussianMLPPolicy/LossBefore                          1.00434e-08
GaussianMLPPolicy/dLoss                              -6.68626e-05
Iteration                                            47
MetaTest/Average/AverageDiscountedReturn            -73.602
MetaTest/Average/AverageReturn                      -73.602
MetaTest/Average/Iteration                           47
MetaTest/Average/MaxReturn                          -55.2488
MetaTest/Average/MinReturn                         -102.634
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           13.463
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -73.602
MetaTest/__unnamed_task__/AverageReturn             -73.602
MetaTest/__unnamed_task__/Iteration                  47
MetaTest/__unnamed_task__/MaxReturn                 -55.2488
MetaTest/__unnamed_task__/MinReturn                -102.634
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  13.463
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.536e+06
__unnamed_task__/AverageDiscountedReturn            -35.2398
__unnamed_task__/AverageReturn                      -70.2842
__unnamed_task__/Iteration                           47
__unnamed_task__/MaxReturn                          -51.4477
__unnamed_task__/MinReturn                          -94.4066
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.2812
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 06:33:49 | [maml_trainer] epoch #48 | Sampling for adapation and meta-testing...
2025-03-30 06:37:44 | [maml_trainer] epoch #48 | Finished meta-testing...
2025-03-30 06:37:44 | [maml_trainer] epoch #48 | Saving snapshot...
2025-03-30 06:38:03 | [maml_trainer] epoch #48 | Saved
2025-03-30 06:38:03 | [maml_trainer] epoch #48 | Time 59384.80 s
2025-03-30 06:38:03 | [maml_trainer] epoch #48 | EpochTime 1165.19 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -35.501
Average/AverageReturn                               -70.7312
Average/Iteration                                    48
Average/MaxReturn                                   -53.1059
Average/MinReturn                                   -99.2901
Average/NumEpisodes                                  80
Average/StdReturn                                     9.63416
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.96774
GaussianMLPPolicy/KLAfter                             0.00265233
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           5.39433e-05
GaussianMLPPolicy/LossBefore                         -8.91089e-09
GaussianMLPPolicy/dLoss                              -5.39522e-05
Iteration                                            48
MetaTest/Average/AverageDiscountedReturn            -71.1436
MetaTest/Average/AverageReturn                      -71.1436
MetaTest/Average/Iteration                           48
MetaTest/Average/MaxReturn                          -59.1449
MetaTest/Average/MinReturn                         -100.102
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.1807
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -71.1436
MetaTest/__unnamed_task__/AverageReturn             -71.1436
MetaTest/__unnamed_task__/Iteration                  48
MetaTest/__unnamed_task__/MaxReturn                 -59.1449
MetaTest/__unnamed_task__/MinReturn                -100.102
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.1807
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.568e+06
__unnamed_task__/AverageDiscountedReturn            -35.501
__unnamed_task__/AverageReturn                      -70.7312
__unnamed_task__/Iteration                           48
__unnamed_task__/MaxReturn                          -53.1059
__unnamed_task__/MinReturn                          -99.2901
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.63416
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 06:53:36 | [maml_trainer] epoch #49 | Sampling for adapation and meta-testing...
2025-03-30 06:57:27 | [maml_trainer] epoch #49 | Finished meta-testing...
2025-03-30 06:57:27 | [maml_trainer] epoch #49 | Saving snapshot...
2025-03-30 06:57:46 | [maml_trainer] epoch #49 | Saved
2025-03-30 06:57:46 | [maml_trainer] epoch #49 | Time 60567.90 s
2025-03-30 06:57:46 | [maml_trainer] epoch #49 | EpochTime 1183.10 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.782
Average/AverageReturn                              -68.587
Average/Iteration                                   49
Average/MaxReturn                                  -51.5807
Average/MinReturn                                  -91.5508
Average/NumEpisodes                                 80
Average/StdReturn                                    8.7624
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96567
GaussianMLPPolicy/KLAfter                            0.00242913
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000106155
GaussianMLPPolicy/LossBefore                        -1.51992e-08
GaussianMLPPolicy/dLoss                              0.00010614
Iteration                                           49
MetaTest/Average/AverageDiscountedReturn           -71.6926
MetaTest/Average/AverageReturn                     -71.6926
MetaTest/Average/Iteration                          49
MetaTest/Average/MaxReturn                         -57.3365
MetaTest/Average/MinReturn                         -87.2391
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.89822
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -71.6926
MetaTest/__unnamed_task__/AverageReturn            -71.6926
MetaTest/__unnamed_task__/Iteration                 49
MetaTest/__unnamed_task__/MaxReturn                -57.3365
MetaTest/__unnamed_task__/MinReturn                -87.2391
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.89822
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.6e+06
__unnamed_task__/AverageDiscountedReturn           -34.782
__unnamed_task__/AverageReturn                     -68.587
__unnamed_task__/Iteration                          49
__unnamed_task__/MaxReturn                         -51.5807
__unnamed_task__/MinReturn                         -91.5508
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.7624
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 07:13:15 | [maml_trainer] epoch #50 | Sampling for adapation and meta-testing...
2025-03-30 07:17:07 | [maml_trainer] epoch #50 | Finished meta-testing...
2025-03-30 07:17:07 | [maml_trainer] epoch #50 | Saving snapshot...
2025-03-30 07:17:27 | [maml_trainer] epoch #50 | Saved
2025-03-30 07:17:27 | [maml_trainer] epoch #50 | Time 61748.14 s
2025-03-30 07:17:27 | [maml_trainer] epoch #50 | EpochTime 1180.23 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -36.1261
Average/AverageReturn                               -72.3799
Average/Iteration                                    50
Average/MaxReturn                                   -51.9743
Average/MinReturn                                  -103.821
Average/NumEpisodes                                  80
Average/StdReturn                                    11.0117
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.96313
GaussianMLPPolicy/KLAfter                             0.00378725
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000103202
GaussianMLPPolicy/LossBefore                          7.30157e-09
GaussianMLPPolicy/dLoss                               0.000103209
Iteration                                            50
MetaTest/Average/AverageDiscountedReturn            -66.6026
MetaTest/Average/AverageReturn                      -66.6026
MetaTest/Average/Iteration                           50
MetaTest/Average/MaxReturn                          -50.3326
MetaTest/Average/MinReturn                          -94.1973
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           11.0838
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -66.6026
MetaTest/__unnamed_task__/AverageReturn             -66.6026
MetaTest/__unnamed_task__/Iteration                  50
MetaTest/__unnamed_task__/MaxReturn                 -50.3326
MetaTest/__unnamed_task__/MinReturn                 -94.1973
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  11.0838
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.632e+06
__unnamed_task__/AverageDiscountedReturn            -36.1261
__unnamed_task__/AverageReturn                      -72.3799
__unnamed_task__/Iteration                           50
__unnamed_task__/MaxReturn                          -51.9743
__unnamed_task__/MinReturn                         -103.821
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.0117
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 07:33:06 | [maml_trainer] epoch #51 | Sampling for adapation and meta-testing...
2025-03-30 07:36:58 | [maml_trainer] epoch #51 | Finished meta-testing...
2025-03-30 07:36:58 | [maml_trainer] epoch #51 | Saving snapshot...
2025-03-30 07:37:16 | [maml_trainer] epoch #51 | Saved
2025-03-30 07:37:16 | [maml_trainer] epoch #51 | Time 62937.84 s
2025-03-30 07:37:16 | [maml_trainer] epoch #51 | EpochTime 1189.70 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.5078
Average/AverageReturn                              -67.9598
Average/Iteration                                   51
Average/MaxReturn                                  -53.6169
Average/MinReturn                                  -99.0024
Average/NumEpisodes                                 80
Average/StdReturn                                    9.87471
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96079
GaussianMLPPolicy/KLAfter                            0.00303802
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000123951
GaussianMLPPolicy/LossBefore                        -7.48038e-09
GaussianMLPPolicy/dLoss                              0.000123944
Iteration                                           51
MetaTest/Average/AverageDiscountedReturn           -68.354
MetaTest/Average/AverageReturn                     -68.354
MetaTest/Average/Iteration                          51
MetaTest/Average/MaxReturn                         -55.8222
MetaTest/Average/MinReturn                         -92.862
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.7064
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -68.354
MetaTest/__unnamed_task__/AverageReturn            -68.354
MetaTest/__unnamed_task__/Iteration                 51
MetaTest/__unnamed_task__/MaxReturn                -55.8222
MetaTest/__unnamed_task__/MinReturn                -92.862
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.7064
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.664e+06
__unnamed_task__/AverageDiscountedReturn           -34.5078
__unnamed_task__/AverageReturn                     -67.9598
__unnamed_task__/Iteration                          51
__unnamed_task__/MaxReturn                         -53.6169
__unnamed_task__/MinReturn                         -99.0024
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.87471
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 07:52:40 | [maml_trainer] epoch #52 | Sampling for adapation and meta-testing...
2025-03-30 07:56:33 | [maml_trainer] epoch #52 | Finished meta-testing...
2025-03-30 07:56:33 | [maml_trainer] epoch #52 | Saving snapshot...
2025-03-30 07:56:52 | [maml_trainer] epoch #52 | Saved
2025-03-30 07:56:52 | [maml_trainer] epoch #52 | Time 64113.72 s
2025-03-30 07:56:52 | [maml_trainer] epoch #52 | EpochTime 1175.87 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.7591
Average/AverageReturn                               -68.4752
Average/Iteration                                    52
Average/MaxReturn                                   -52.0886
Average/MinReturn                                  -104.947
Average/NumEpisodes                                  80
Average/StdReturn                                    10.0482
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95934
GaussianMLPPolicy/KLAfter                             0.00231181
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           0.000119713
GaussianMLPPolicy/LossBefore                          1.10269e-09
GaussianMLPPolicy/dLoss                              -0.000119712
Iteration                                            52
MetaTest/Average/AverageDiscountedReturn            -65.3499
MetaTest/Average/AverageReturn                      -65.3499
MetaTest/Average/Iteration                           52
MetaTest/Average/MaxReturn                          -53.6891
MetaTest/Average/MinReturn                          -95.1861
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.53845
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -65.3499
MetaTest/__unnamed_task__/AverageReturn             -65.3499
MetaTest/__unnamed_task__/Iteration                  52
MetaTest/__unnamed_task__/MaxReturn                 -53.6891
MetaTest/__unnamed_task__/MinReturn                 -95.1861
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.53845
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.696e+06
__unnamed_task__/AverageDiscountedReturn            -34.7591
__unnamed_task__/AverageReturn                      -68.4752
__unnamed_task__/Iteration                           52
__unnamed_task__/MaxReturn                          -52.0886
__unnamed_task__/MinReturn                         -104.947
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.0482
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 08:12:21 | [maml_trainer] epoch #53 | Sampling for adapation and meta-testing...
2025-03-30 08:16:13 | [maml_trainer] epoch #53 | Finished meta-testing...
2025-03-30 08:16:13 | [maml_trainer] epoch #53 | Saving snapshot...
2025-03-30 08:16:32 | [maml_trainer] epoch #53 | Saved
2025-03-30 08:16:32 | [maml_trainer] epoch #53 | Time 65293.91 s
2025-03-30 08:16:32 | [maml_trainer] epoch #53 | EpochTime 1180.19 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.0202
Average/AverageReturn                              -66.4909
Average/Iteration                                   53
Average/MaxReturn                                  -50.67
Average/MinReturn                                  -89.5265
Average/NumEpisodes                                 80
Average/StdReturn                                    9.12984
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95614
GaussianMLPPolicy/KLAfter                            0.00212966
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.2078e-05
GaussianMLPPolicy/LossBefore                         1.38581e-08
GaussianMLPPolicy/dLoss                             -3.20641e-05
Iteration                                           53
MetaTest/Average/AverageDiscountedReturn           -64.8484
MetaTest/Average/AverageReturn                     -64.8484
MetaTest/Average/Iteration                          53
MetaTest/Average/MaxReturn                         -55.4042
MetaTest/Average/MinReturn                         -89.6816
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.08264
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -64.8484
MetaTest/__unnamed_task__/AverageReturn            -64.8484
MetaTest/__unnamed_task__/Iteration                 53
MetaTest/__unnamed_task__/MaxReturn                -55.4042
MetaTest/__unnamed_task__/MinReturn                -89.6816
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.08264
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.728e+06
__unnamed_task__/AverageDiscountedReturn           -34.0202
__unnamed_task__/AverageReturn                     -66.4909
__unnamed_task__/Iteration                          53
__unnamed_task__/MaxReturn                         -50.67
__unnamed_task__/MinReturn                         -89.5265
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.12984
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 08:32:00 | [maml_trainer] epoch #54 | Sampling for adapation and meta-testing...
2025-03-30 08:35:53 | [maml_trainer] epoch #54 | Finished meta-testing...
2025-03-30 08:35:53 | [maml_trainer] epoch #54 | Saving snapshot...
2025-03-30 08:36:12 | [maml_trainer] epoch #54 | Saved
2025-03-30 08:36:12 | [maml_trainer] epoch #54 | Time 66473.46 s
2025-03-30 08:36:12 | [maml_trainer] epoch #54 | EpochTime 1179.55 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.5405
Average/AverageReturn                              -67.1072
Average/Iteration                                   54
Average/MaxReturn                                  -50.0964
Average/MinReturn                                  -96.8493
Average/NumEpisodes                                 80
Average/StdReturn                                    8.31513
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95319
GaussianMLPPolicy/KLAfter                            0.00190791
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.6339e-05
GaussianMLPPolicy/LossBefore                         8.55327e-09
GaussianMLPPolicy/dLoss                             -2.63304e-05
Iteration                                           54
MetaTest/Average/AverageDiscountedReturn           -72.1158
MetaTest/Average/AverageReturn                     -72.1158
MetaTest/Average/Iteration                          54
MetaTest/Average/MaxReturn                         -54.6623
MetaTest/Average/MinReturn                         -96.1283
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.3021
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -72.1158
MetaTest/__unnamed_task__/AverageReturn            -72.1158
MetaTest/__unnamed_task__/Iteration                 54
MetaTest/__unnamed_task__/MaxReturn                -54.6623
MetaTest/__unnamed_task__/MinReturn                -96.1283
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.3021
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.76e+06
__unnamed_task__/AverageDiscountedReturn           -34.5405
__unnamed_task__/AverageReturn                     -67.1072
__unnamed_task__/Iteration                          54
__unnamed_task__/MaxReturn                         -50.0964
__unnamed_task__/MinReturn                         -96.8493
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.31513
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 08:51:43 | [maml_trainer] epoch #55 | Sampling for adapation and meta-testing...
2025-03-30 08:55:34 | [maml_trainer] epoch #55 | Finished meta-testing...
2025-03-30 08:55:34 | [maml_trainer] epoch #55 | Saving snapshot...
2025-03-30 08:55:52 | [maml_trainer] epoch #55 | Saved
2025-03-30 08:55:52 | [maml_trainer] epoch #55 | Time 67653.97 s
2025-03-30 08:55:52 | [maml_trainer] epoch #55 | EpochTime 1180.50 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.8009
Average/AverageReturn                               -68.5233
Average/Iteration                                    55
Average/MaxReturn                                   -52.6985
Average/MinReturn                                  -102.17
Average/NumEpisodes                                  80
Average/StdReturn                                    10.6403
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95057
GaussianMLPPolicy/KLAfter                             0.00149358
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.25732e-05
GaussianMLPPolicy/LossBefore                          4.91738e-09
GaussianMLPPolicy/dLoss                               1.25781e-05
Iteration                                            55
MetaTest/Average/AverageDiscountedReturn            -68.9306
MetaTest/Average/AverageReturn                      -68.9306
MetaTest/Average/Iteration                           55
MetaTest/Average/MaxReturn                          -52.5642
MetaTest/Average/MinReturn                          -86.9834
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.7156
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -68.9306
MetaTest/__unnamed_task__/AverageReturn             -68.9306
MetaTest/__unnamed_task__/Iteration                  55
MetaTest/__unnamed_task__/MaxReturn                 -52.5642
MetaTest/__unnamed_task__/MinReturn                 -86.9834
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.7156
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.792e+06
__unnamed_task__/AverageDiscountedReturn            -34.8009
__unnamed_task__/AverageReturn                      -68.5233
__unnamed_task__/Iteration                           55
__unnamed_task__/MaxReturn                          -52.6985
__unnamed_task__/MinReturn                         -102.17
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.6403
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 09:11:21 | [maml_trainer] epoch #56 | Sampling for adapation and meta-testing...
2025-03-30 09:15:13 | [maml_trainer] epoch #56 | Finished meta-testing...
2025-03-30 09:15:13 | [maml_trainer] epoch #56 | Saving snapshot...
2025-03-30 09:15:32 | [maml_trainer] epoch #56 | Saved
2025-03-30 09:15:32 | [maml_trainer] epoch #56 | Time 68833.73 s
2025-03-30 09:15:32 | [maml_trainer] epoch #56 | EpochTime 1179.76 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.0952
Average/AverageReturn                               -66.2796
Average/Iteration                                    56
Average/MaxReturn                                   -49.2654
Average/MinReturn                                  -100.227
Average/NumEpisodes                                  80
Average/StdReturn                                     9.77627
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94756
GaussianMLPPolicy/KLAfter                             0.00106588
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.04902e-05
GaussianMLPPolicy/LossBefore                         -2.5034e-09
GaussianMLPPolicy/dLoss                              -1.04927e-05
Iteration                                            56
MetaTest/Average/AverageDiscountedReturn            -69.4817
MetaTest/Average/AverageReturn                      -69.4817
MetaTest/Average/Iteration                           56
MetaTest/Average/MaxReturn                          -55.7282
MetaTest/Average/MinReturn                         -103.015
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.2461
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -69.4817
MetaTest/__unnamed_task__/AverageReturn             -69.4817
MetaTest/__unnamed_task__/Iteration                  56
MetaTest/__unnamed_task__/MaxReturn                 -55.7282
MetaTest/__unnamed_task__/MinReturn                -103.015
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.2461
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.824e+06
__unnamed_task__/AverageDiscountedReturn            -34.0952
__unnamed_task__/AverageReturn                      -66.2796
__unnamed_task__/Iteration                           56
__unnamed_task__/MaxReturn                          -49.2654
__unnamed_task__/MinReturn                         -100.227
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.77627
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 09:31:07 | [maml_trainer] epoch #57 | Sampling for adapation and meta-testing...
2025-03-30 09:35:01 | [maml_trainer] epoch #57 | Finished meta-testing...
2025-03-30 09:35:01 | [maml_trainer] epoch #57 | Saving snapshot...
2025-03-30 09:35:21 | [maml_trainer] epoch #57 | Saved
2025-03-30 09:35:21 | [maml_trainer] epoch #57 | Time 70022.54 s
2025-03-30 09:35:21 | [maml_trainer] epoch #57 | EpochTime 1188.81 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.2165
Average/AverageReturn                               -66.8332
Average/Iteration                                    57
Average/MaxReturn                                   -50.6638
Average/MinReturn                                  -103.892
Average/NumEpisodes                                  80
Average/StdReturn                                    10.9889
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94402
GaussianMLPPolicy/KLAfter                             0.000960415
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.55056e-05
GaussianMLPPolicy/LossBefore                         -1.09076e-08
GaussianMLPPolicy/dLoss                               1.54947e-05
Iteration                                            57
MetaTest/Average/AverageDiscountedReturn            -66.1783
MetaTest/Average/AverageReturn                      -66.1783
MetaTest/Average/Iteration                           57
MetaTest/Average/MaxReturn                          -53.2826
MetaTest/Average/MinReturn                          -90.8523
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           11.7308
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -66.1783
MetaTest/__unnamed_task__/AverageReturn             -66.1783
MetaTest/__unnamed_task__/Iteration                  57
MetaTest/__unnamed_task__/MaxReturn                 -53.2826
MetaTest/__unnamed_task__/MinReturn                 -90.8523
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  11.7308
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.856e+06
__unnamed_task__/AverageDiscountedReturn            -34.2165
__unnamed_task__/AverageReturn                      -66.8332
__unnamed_task__/Iteration                           57
__unnamed_task__/MaxReturn                          -50.6638
__unnamed_task__/MinReturn                         -103.892
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.9889
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 09:51:15 | [maml_trainer] epoch #58 | Sampling for adapation and meta-testing...
2025-03-30 09:55:20 | [maml_trainer] epoch #58 | Finished meta-testing...
2025-03-30 09:55:20 | [maml_trainer] epoch #58 | Saving snapshot...
2025-03-30 09:55:40 | [maml_trainer] epoch #58 | Saved
2025-03-30 09:55:40 | [maml_trainer] epoch #58 | Time 71241.26 s
2025-03-30 09:55:40 | [maml_trainer] epoch #58 | EpochTime 1218.71 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.9315
Average/AverageReturn                               -65.9189
Average/Iteration                                    58
Average/MaxReturn                                   -48.8424
Average/MinReturn                                  -107.534
Average/NumEpisodes                                  80
Average/StdReturn                                    11.631
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94289
GaussianMLPPolicy/KLAfter                             0.00122573
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.73295e-05
GaussianMLPPolicy/LossBefore                         -5.06639e-10
GaussianMLPPolicy/dLoss                              -6.733e-05
Iteration                                            58
MetaTest/Average/AverageDiscountedReturn            -67.4854
MetaTest/Average/AverageReturn                      -67.4854
MetaTest/Average/Iteration                           58
MetaTest/Average/MaxReturn                          -52.5224
MetaTest/Average/MinReturn                          -86.0433
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.7243
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -67.4854
MetaTest/__unnamed_task__/AverageReturn             -67.4854
MetaTest/__unnamed_task__/Iteration                  58
MetaTest/__unnamed_task__/MaxReturn                 -52.5224
MetaTest/__unnamed_task__/MinReturn                 -86.0433
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.7243
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.888e+06
__unnamed_task__/AverageDiscountedReturn            -33.9315
__unnamed_task__/AverageReturn                      -65.9189
__unnamed_task__/Iteration                           58
__unnamed_task__/MaxReturn                          -48.8424
__unnamed_task__/MinReturn                         -107.534
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.631
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 10:11:32 | [maml_trainer] epoch #59 | Sampling for adapation and meta-testing...
2025-03-30 10:15:30 | [maml_trainer] epoch #59 | Finished meta-testing...
2025-03-30 10:15:30 | [maml_trainer] epoch #59 | Saving snapshot...
2025-03-30 10:15:49 | [maml_trainer] epoch #59 | Saved
2025-03-30 10:15:49 | [maml_trainer] epoch #59 | Time 72450.72 s
2025-03-30 10:15:49 | [maml_trainer] epoch #59 | EpochTime 1209.46 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.0166
Average/AverageReturn                               -65.806
Average/Iteration                                    59
Average/MaxReturn                                   -50.3163
Average/MinReturn                                   -86.7859
Average/NumEpisodes                                  80
Average/StdReturn                                     8.7453
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94205
GaussianMLPPolicy/KLAfter                             0.00126563
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.43983e-06
GaussianMLPPolicy/LossBefore                          3.01003e-09
GaussianMLPPolicy/dLoss                              -4.43682e-06
Iteration                                            59
MetaTest/Average/AverageDiscountedReturn            -68.4232
MetaTest/Average/AverageReturn                      -68.4232
MetaTest/Average/Iteration                           59
MetaTest/Average/MaxReturn                          -51.6871
MetaTest/Average/MinReturn                         -101.553
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.6166
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -68.4232
MetaTest/__unnamed_task__/AverageReturn             -68.4232
MetaTest/__unnamed_task__/Iteration                  59
MetaTest/__unnamed_task__/MaxReturn                 -51.6871
MetaTest/__unnamed_task__/MinReturn                -101.553
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.6166
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.92e+06
__unnamed_task__/AverageDiscountedReturn            -34.0166
__unnamed_task__/AverageReturn                      -65.806
__unnamed_task__/Iteration                           59
__unnamed_task__/MaxReturn                          -50.3163
__unnamed_task__/MinReturn                          -86.7859
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.7453
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 10:31:56 | [maml_trainer] epoch #60 | Sampling for adapation and meta-testing...
2025-03-30 10:35:50 | [maml_trainer] epoch #60 | Finished meta-testing...
2025-03-30 10:35:50 | [maml_trainer] epoch #60 | Saving snapshot...
2025-03-30 10:36:09 | [maml_trainer] epoch #60 | Saved
2025-03-30 10:36:09 | [maml_trainer] epoch #60 | Time 73670.70 s
2025-03-30 10:36:09 | [maml_trainer] epoch #60 | EpochTime 1219.98 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.9335
Average/AverageReturn                              -64.9959
Average/Iteration                                   60
Average/MaxReturn                                  -49.6029
Average/MinReturn                                  -91.1613
Average/NumEpisodes                                 80
Average/StdReturn                                    8.50574
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94134
GaussianMLPPolicy/KLAfter                            0.00176932
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.53141e-06
GaussianMLPPolicy/LossBefore                        -4.41074e-09
GaussianMLPPolicy/dLoss                              9.527e-06
Iteration                                           60
MetaTest/Average/AverageDiscountedReturn           -67.9696
MetaTest/Average/AverageReturn                     -67.9696
MetaTest/Average/Iteration                          60
MetaTest/Average/MaxReturn                         -50.5714
MetaTest/Average/MinReturn                         -88.4776
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.22608
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -67.9696
MetaTest/__unnamed_task__/AverageReturn            -67.9696
MetaTest/__unnamed_task__/Iteration                 60
MetaTest/__unnamed_task__/MaxReturn                -50.5714
MetaTest/__unnamed_task__/MinReturn                -88.4776
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.22608
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.952e+06
__unnamed_task__/AverageDiscountedReturn           -33.9335
__unnamed_task__/AverageReturn                     -64.9959
__unnamed_task__/Iteration                          60
__unnamed_task__/MaxReturn                         -49.6029
__unnamed_task__/MinReturn                         -91.1613
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.50574
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 10:52:07 | [maml_trainer] epoch #61 | Sampling for adapation and meta-testing...
2025-03-30 10:56:05 | [maml_trainer] epoch #61 | Finished meta-testing...
2025-03-30 10:56:05 | [maml_trainer] epoch #61 | Saving snapshot...
2025-03-30 10:56:25 | [maml_trainer] epoch #61 | Saved
2025-03-30 10:56:25 | [maml_trainer] epoch #61 | Time 74886.24 s
2025-03-30 10:56:25 | [maml_trainer] epoch #61 | EpochTime 1215.54 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.7933
Average/AverageReturn                               -65.4313
Average/Iteration                                    61
Average/MaxReturn                                   -50.1676
Average/MinReturn                                  -100.306
Average/NumEpisodes                                  80
Average/StdReturn                                     9.71002
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9402
GaussianMLPPolicy/KLAfter                             0.00342025
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           0.000139571
GaussianMLPPolicy/LossBefore                          4.64916e-09
GaussianMLPPolicy/dLoss                              -0.000139567
Iteration                                            61
MetaTest/Average/AverageDiscountedReturn            -62.2821
MetaTest/Average/AverageReturn                      -62.2821
MetaTest/Average/Iteration                           61
MetaTest/Average/MaxReturn                          -51.2635
MetaTest/Average/MinReturn                          -93.7327
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.76574
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.2821
MetaTest/__unnamed_task__/AverageReturn             -62.2821
MetaTest/__unnamed_task__/Iteration                  61
MetaTest/__unnamed_task__/MaxReturn                 -51.2635
MetaTest/__unnamed_task__/MinReturn                 -93.7327
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.76574
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         1.984e+06
__unnamed_task__/AverageDiscountedReturn            -33.7933
__unnamed_task__/AverageReturn                      -65.4313
__unnamed_task__/Iteration                           61
__unnamed_task__/MaxReturn                          -50.1676
__unnamed_task__/MinReturn                         -100.306
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.71002
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 11:12:06 | [maml_trainer] epoch #62 | Sampling for adapation and meta-testing...
2025-03-30 11:16:02 | [maml_trainer] epoch #62 | Finished meta-testing...
2025-03-30 11:16:02 | [maml_trainer] epoch #62 | Saving snapshot...
2025-03-30 11:16:22 | [maml_trainer] epoch #62 | Saved
2025-03-30 11:16:22 | [maml_trainer] epoch #62 | Time 76083.09 s
2025-03-30 11:16:22 | [maml_trainer] epoch #62 | EpochTime 1196.85 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.2571
Average/AverageReturn                               -66.2137
Average/Iteration                                    62
Average/MaxReturn                                   -47.4374
Average/MinReturn                                  -105.496
Average/NumEpisodes                                  80
Average/StdReturn                                     9.26708
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93945
GaussianMLPPolicy/KLAfter                             0.00308344
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.43708e-05
GaussianMLPPolicy/LossBefore                          8.85129e-09
GaussianMLPPolicy/dLoss                               9.43797e-05
Iteration                                            62
MetaTest/Average/AverageDiscountedReturn            -64.1902
MetaTest/Average/AverageReturn                      -64.1902
MetaTest/Average/Iteration                           62
MetaTest/Average/MaxReturn                          -55.0323
MetaTest/Average/MinReturn                          -88.1229
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.65618
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -64.1902
MetaTest/__unnamed_task__/AverageReturn             -64.1902
MetaTest/__unnamed_task__/Iteration                  62
MetaTest/__unnamed_task__/MaxReturn                 -55.0323
MetaTest/__unnamed_task__/MinReturn                 -88.1229
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.65618
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.016e+06
__unnamed_task__/AverageDiscountedReturn            -34.2571
__unnamed_task__/AverageReturn                      -66.2137
__unnamed_task__/Iteration                           62
__unnamed_task__/MaxReturn                          -47.4374
__unnamed_task__/MinReturn                         -105.496
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.26708
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 11:32:11 | [maml_trainer] epoch #63 | Sampling for adapation and meta-testing...
2025-03-30 11:36:08 | [maml_trainer] epoch #63 | Finished meta-testing...
2025-03-30 11:36:08 | [maml_trainer] epoch #63 | Saving snapshot...
2025-03-30 11:36:27 | [maml_trainer] epoch #63 | Saved
2025-03-30 11:36:27 | [maml_trainer] epoch #63 | Time 77288.89 s
2025-03-30 11:36:27 | [maml_trainer] epoch #63 | EpochTime 1205.80 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.1044
Average/AverageReturn                              -65.1778
Average/Iteration                                   63
Average/MaxReturn                                  -51.8389
Average/MinReturn                                  -97.6694
Average/NumEpisodes                                 80
Average/StdReturn                                    9.05329
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93816
GaussianMLPPolicy/KLAfter                            0.00198464
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.60297e-05
GaussianMLPPolicy/LossBefore                         1.3113e-09
GaussianMLPPolicy/dLoss                              7.6031e-05
Iteration                                           63
MetaTest/Average/AverageDiscountedReturn           -65.7784
MetaTest/Average/AverageReturn                     -65.7784
MetaTest/Average/Iteration                          63
MetaTest/Average/MaxReturn                         -50.5306
MetaTest/Average/MinReturn                         -84.9034
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.28841
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -65.7784
MetaTest/__unnamed_task__/AverageReturn            -65.7784
MetaTest/__unnamed_task__/Iteration                 63
MetaTest/__unnamed_task__/MaxReturn                -50.5306
MetaTest/__unnamed_task__/MinReturn                -84.9034
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.28841
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.048e+06
__unnamed_task__/AverageDiscountedReturn           -34.1044
__unnamed_task__/AverageReturn                     -65.1778
__unnamed_task__/Iteration                          63
__unnamed_task__/MaxReturn                         -51.8389
__unnamed_task__/MinReturn                         -97.6694
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.05329
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 11:52:08 | [maml_trainer] epoch #64 | Sampling for adapation and meta-testing...
2025-03-30 11:56:02 | [maml_trainer] epoch #64 | Finished meta-testing...
2025-03-30 11:56:02 | [maml_trainer] epoch #64 | Saving snapshot...
2025-03-30 11:56:21 | [maml_trainer] epoch #64 | Saved
2025-03-30 11:56:21 | [maml_trainer] epoch #64 | Time 78482.36 s
2025-03-30 11:56:21 | [maml_trainer] epoch #64 | EpochTime 1193.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.3195
Average/AverageReturn                              -63.4258
Average/Iteration                                   64
Average/MaxReturn                                  -48.0061
Average/MinReturn                                  -97.6364
Average/NumEpisodes                                 80
Average/StdReturn                                    8.72762
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93663
GaussianMLPPolicy/KLAfter                            0.000971522
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.30036e-05
GaussianMLPPolicy/LossBefore                         7.689e-09
GaussianMLPPolicy/dLoss                              2.30113e-05
Iteration                                           64
MetaTest/Average/AverageDiscountedReturn           -64.6023
MetaTest/Average/AverageReturn                     -64.6023
MetaTest/Average/Iteration                          64
MetaTest/Average/MaxReturn                         -54.3463
MetaTest/Average/MinReturn                         -83.31
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.32806
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -64.6023
MetaTest/__unnamed_task__/AverageReturn            -64.6023
MetaTest/__unnamed_task__/Iteration                 64
MetaTest/__unnamed_task__/MaxReturn                -54.3463
MetaTest/__unnamed_task__/MinReturn                -83.31
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.32806
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.08e+06
__unnamed_task__/AverageDiscountedReturn           -33.3195
__unnamed_task__/AverageReturn                     -63.4258
__unnamed_task__/Iteration                          64
__unnamed_task__/MaxReturn                         -48.0061
__unnamed_task__/MinReturn                         -97.6364
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.72762
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 12:11:52 | [maml_trainer] epoch #65 | Sampling for adapation and meta-testing...
2025-03-30 12:15:46 | [maml_trainer] epoch #65 | Finished meta-testing...
2025-03-30 12:15:46 | [maml_trainer] epoch #65 | Saving snapshot...
2025-03-30 12:16:06 | [maml_trainer] epoch #65 | Saved
2025-03-30 12:16:06 | [maml_trainer] epoch #65 | Time 79667.50 s
2025-03-30 12:16:06 | [maml_trainer] epoch #65 | EpochTime 1185.14 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.4383
Average/AverageReturn                               -66.0166
Average/Iteration                                    65
Average/MaxReturn                                   -51.111
Average/MinReturn                                  -102.261
Average/NumEpisodes                                  80
Average/StdReturn                                     9.23279
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93547
GaussianMLPPolicy/KLAfter                             0.00170985
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.23287e-05
GaussianMLPPolicy/LossBefore                          3.39746e-09
GaussianMLPPolicy/dLoss                               9.23321e-05
Iteration                                            65
MetaTest/Average/AverageDiscountedReturn            -61.4679
MetaTest/Average/AverageReturn                      -61.4679
MetaTest/Average/Iteration                           65
MetaTest/Average/MaxReturn                          -50.9164
MetaTest/Average/MinReturn                          -83.765
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.59918
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.4679
MetaTest/__unnamed_task__/AverageReturn             -61.4679
MetaTest/__unnamed_task__/Iteration                  65
MetaTest/__unnamed_task__/MaxReturn                 -50.9164
MetaTest/__unnamed_task__/MinReturn                 -83.765
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.59918
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.112e+06
__unnamed_task__/AverageDiscountedReturn            -34.4383
__unnamed_task__/AverageReturn                      -66.0166
__unnamed_task__/Iteration                           65
__unnamed_task__/MaxReturn                          -51.111
__unnamed_task__/MinReturn                         -102.261
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.23279
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 12:32:06 | [maml_trainer] epoch #66 | Sampling for adapation and meta-testing...
2025-03-30 12:36:05 | [maml_trainer] epoch #66 | Finished meta-testing...
2025-03-30 12:36:05 | [maml_trainer] epoch #66 | Saving snapshot...
2025-03-30 12:36:25 | [maml_trainer] epoch #66 | Saved
2025-03-30 12:36:25 | [maml_trainer] epoch #66 | Time 80886.15 s
2025-03-30 12:36:25 | [maml_trainer] epoch #66 | EpochTime 1218.65 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.0147
Average/AverageReturn                               -65.6605
Average/Iteration                                    66
Average/MaxReturn                                   -51.0911
Average/MinReturn                                  -103.053
Average/NumEpisodes                                  80
Average/StdReturn                                     9.92892
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93535
GaussianMLPPolicy/KLAfter                             0.00190514
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.23688e-05
GaussianMLPPolicy/LossBefore                          3.27826e-10
GaussianMLPPolicy/dLoss                              -4.23685e-05
Iteration                                            66
MetaTest/Average/AverageDiscountedReturn            -64.5053
MetaTest/Average/AverageReturn                      -64.5053
MetaTest/Average/Iteration                           66
MetaTest/Average/MaxReturn                          -52.6175
MetaTest/Average/MinReturn                          -78.0003
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.21188
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -64.5053
MetaTest/__unnamed_task__/AverageReturn             -64.5053
MetaTest/__unnamed_task__/Iteration                  66
MetaTest/__unnamed_task__/MaxReturn                 -52.6175
MetaTest/__unnamed_task__/MinReturn                 -78.0003
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.21188
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.144e+06
__unnamed_task__/AverageDiscountedReturn            -34.0147
__unnamed_task__/AverageReturn                      -65.6605
__unnamed_task__/Iteration                           66
__unnamed_task__/MaxReturn                          -51.0911
__unnamed_task__/MinReturn                         -103.053
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.92892
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 12:52:22 | [maml_trainer] epoch #67 | Sampling for adapation and meta-testing...
2025-03-30 12:56:17 | [maml_trainer] epoch #67 | Finished meta-testing...
2025-03-30 12:56:17 | [maml_trainer] epoch #67 | Saving snapshot...
2025-03-30 12:56:37 | [maml_trainer] epoch #67 | Saved
2025-03-30 12:56:37 | [maml_trainer] epoch #67 | Time 82098.58 s
2025-03-30 12:56:37 | [maml_trainer] epoch #67 | EpochTime 1212.43 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.4342
Average/AverageReturn                              -63.3142
Average/Iteration                                   67
Average/MaxReturn                                  -50.9793
Average/MinReturn                                  -89.9246
Average/NumEpisodes                                 80
Average/StdReturn                                    7.63025
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93606
GaussianMLPPolicy/KLAfter                            0.00226789
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.13591e-05
GaussianMLPPolicy/LossBefore                        -2.71201e-09
GaussianMLPPolicy/dLoss                             -8.13618e-05
Iteration                                           67
MetaTest/Average/AverageDiscountedReturn           -64.0518
MetaTest/Average/AverageReturn                     -64.0518
MetaTest/Average/Iteration                          67
MetaTest/Average/MaxReturn                         -55.3486
MetaTest/Average/MinReturn                         -77.3847
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.20589
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -64.0518
MetaTest/__unnamed_task__/AverageReturn            -64.0518
MetaTest/__unnamed_task__/Iteration                 67
MetaTest/__unnamed_task__/MaxReturn                -55.3486
MetaTest/__unnamed_task__/MinReturn                -77.3847
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.20589
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.176e+06
__unnamed_task__/AverageDiscountedReturn           -33.4342
__unnamed_task__/AverageReturn                     -63.3142
__unnamed_task__/Iteration                          67
__unnamed_task__/MaxReturn                         -50.9793
__unnamed_task__/MinReturn                         -89.9246
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.63025
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 13:12:39 | [maml_trainer] epoch #68 | Sampling for adapation and meta-testing...
2025-03-30 13:16:45 | [maml_trainer] epoch #68 | Finished meta-testing...
2025-03-30 13:16:45 | [maml_trainer] epoch #68 | Saving snapshot...
2025-03-30 13:17:06 | [maml_trainer] epoch #68 | Saved
2025-03-30 13:17:06 | [maml_trainer] epoch #68 | Time 83327.35 s
2025-03-30 13:17:06 | [maml_trainer] epoch #68 | EpochTime 1228.76 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.1264
Average/AverageReturn                              -65.0363
Average/Iteration                                   68
Average/MaxReturn                                  -51.2984
Average/MinReturn                                  -87.7544
Average/NumEpisodes                                 80
Average/StdReturn                                    7.41963
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93672
GaussianMLPPolicy/KLAfter                            0.00334071
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.5789e-05
GaussianMLPPolicy/LossBefore                         4.47035e-10
GaussianMLPPolicy/dLoss                              2.57895e-05
Iteration                                           68
MetaTest/Average/AverageDiscountedReturn           -62.8084
MetaTest/Average/AverageReturn                     -62.8084
MetaTest/Average/Iteration                          68
MetaTest/Average/MaxReturn                         -49.2811
MetaTest/Average/MinReturn                         -81.4928
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.35533
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -62.8084
MetaTest/__unnamed_task__/AverageReturn            -62.8084
MetaTest/__unnamed_task__/Iteration                 68
MetaTest/__unnamed_task__/MaxReturn                -49.2811
MetaTest/__unnamed_task__/MinReturn                -81.4928
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.35533
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.208e+06
__unnamed_task__/AverageDiscountedReturn           -34.1264
__unnamed_task__/AverageReturn                     -65.0363
__unnamed_task__/Iteration                          68
__unnamed_task__/MaxReturn                         -51.2984
__unnamed_task__/MinReturn                         -87.7544
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.41963
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 13:33:17 | [maml_trainer] epoch #69 | Sampling for adapation and meta-testing...
2025-03-30 13:37:26 | [maml_trainer] epoch #69 | Finished meta-testing...
2025-03-30 13:37:26 | [maml_trainer] epoch #69 | Saving snapshot...
2025-03-30 13:37:46 | [maml_trainer] epoch #69 | Saved
2025-03-30 13:37:46 | [maml_trainer] epoch #69 | Time 84567.55 s
2025-03-30 13:37:46 | [maml_trainer] epoch #69 | EpochTime 1240.20 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.2248
Average/AverageReturn                              -65.1432
Average/Iteration                                   69
Average/MaxReturn                                  -50.1863
Average/MinReturn                                  -89.5186
Average/NumEpisodes                                 80
Average/StdReturn                                    8.73927
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93695
GaussianMLPPolicy/KLAfter                            0.00330125
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000103825
GaussianMLPPolicy/LossBefore                         8.04663e-10
GaussianMLPPolicy/dLoss                              0.000103826
Iteration                                           69
MetaTest/Average/AverageDiscountedReturn           -64.7955
MetaTest/Average/AverageReturn                     -64.7955
MetaTest/Average/Iteration                          69
MetaTest/Average/MaxReturn                         -54.049
MetaTest/Average/MinReturn                         -74.3904
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.4348
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -64.7955
MetaTest/__unnamed_task__/AverageReturn            -64.7955
MetaTest/__unnamed_task__/Iteration                 69
MetaTest/__unnamed_task__/MaxReturn                -54.049
MetaTest/__unnamed_task__/MinReturn                -74.3904
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.4348
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.24e+06
__unnamed_task__/AverageDiscountedReturn           -34.2248
__unnamed_task__/AverageReturn                     -65.1432
__unnamed_task__/Iteration                          69
__unnamed_task__/MaxReturn                         -50.1863
__unnamed_task__/MinReturn                         -89.5186
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.73927
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 13:54:11 | [maml_trainer] epoch #70 | Sampling for adapation and meta-testing...
2025-03-30 13:58:20 | [maml_trainer] epoch #70 | Finished meta-testing...
2025-03-30 13:58:20 | [maml_trainer] epoch #70 | Saving snapshot...
2025-03-30 13:58:41 | [maml_trainer] epoch #70 | Saved
2025-03-30 13:58:41 | [maml_trainer] epoch #70 | Time 85822.05 s
2025-03-30 13:58:41 | [maml_trainer] epoch #70 | EpochTime 1254.49 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -34.1954
Average/AverageReturn                              -64.6576
Average/Iteration                                   70
Average/MaxReturn                                  -50.4498
Average/MinReturn                                  -95.1104
Average/NumEpisodes                                 80
Average/StdReturn                                    9.37763
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93732
GaussianMLPPolicy/KLAfter                            0.00492415
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.90012e-05
GaussianMLPPolicy/LossBefore                        -6.25849e-09
GaussianMLPPolicy/dLoss                             -9.90074e-05
Iteration                                           70
MetaTest/Average/AverageDiscountedReturn           -63.7613
MetaTest/Average/AverageReturn                     -63.7613
MetaTest/Average/Iteration                          70
MetaTest/Average/MaxReturn                         -46.34
MetaTest/Average/MinReturn                         -83.7508
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.86334
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -63.7613
MetaTest/__unnamed_task__/AverageReturn            -63.7613
MetaTest/__unnamed_task__/Iteration                 70
MetaTest/__unnamed_task__/MaxReturn                -46.34
MetaTest/__unnamed_task__/MinReturn                -83.7508
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.86334
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.272e+06
__unnamed_task__/AverageDiscountedReturn           -34.1954
__unnamed_task__/AverageReturn                     -64.6576
__unnamed_task__/Iteration                          70
__unnamed_task__/MaxReturn                         -50.4498
__unnamed_task__/MinReturn                         -95.1104
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.37763
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 14:14:47 | [maml_trainer] epoch #71 | Sampling for adapation and meta-testing...
2025-03-30 14:18:42 | [maml_trainer] epoch #71 | Finished meta-testing...
2025-03-30 14:18:42 | [maml_trainer] epoch #71 | Saving snapshot...
2025-03-30 14:19:02 | [maml_trainer] epoch #71 | Saved
2025-03-30 14:19:02 | [maml_trainer] epoch #71 | Time 87043.21 s
2025-03-30 14:19:02 | [maml_trainer] epoch #71 | EpochTime 1221.16 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.1689
Average/AverageReturn                              -61.9819
Average/Iteration                                   71
Average/MaxReturn                                  -49.1487
Average/MinReturn                                  -82.5284
Average/NumEpisodes                                 80
Average/StdReturn                                    6.9291
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93799
GaussianMLPPolicy/KLAfter                            0.00438343
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000176979
GaussianMLPPolicy/LossBefore                         5.42402e-09
GaussianMLPPolicy/dLoss                              0.000176984
Iteration                                           71
MetaTest/Average/AverageDiscountedReturn           -66.6126
MetaTest/Average/AverageReturn                     -66.6126
MetaTest/Average/Iteration                          71
MetaTest/Average/MaxReturn                         -49.9948
MetaTest/Average/MinReturn                         -93.0298
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.01812
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -66.6126
MetaTest/__unnamed_task__/AverageReturn            -66.6126
MetaTest/__unnamed_task__/Iteration                 71
MetaTest/__unnamed_task__/MaxReturn                -49.9948
MetaTest/__unnamed_task__/MinReturn                -93.0298
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.01812
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.304e+06
__unnamed_task__/AverageDiscountedReturn           -33.1689
__unnamed_task__/AverageReturn                     -61.9819
__unnamed_task__/Iteration                          71
__unnamed_task__/MaxReturn                         -49.1487
__unnamed_task__/MinReturn                         -82.5284
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.9291
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 14:34:42 | [maml_trainer] epoch #72 | Sampling for adapation and meta-testing...
2025-03-30 14:38:42 | [maml_trainer] epoch #72 | Finished meta-testing...
2025-03-30 14:38:42 | [maml_trainer] epoch #72 | Saving snapshot...
2025-03-30 14:39:03 | [maml_trainer] epoch #72 | Saved
2025-03-30 14:39:03 | [maml_trainer] epoch #72 | Time 88244.90 s
2025-03-30 14:39:03 | [maml_trainer] epoch #72 | EpochTime 1201.68 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.8457
Average/AverageReturn                              -63.4193
Average/Iteration                                   72
Average/MaxReturn                                  -49.5346
Average/MinReturn                                  -83.2256
Average/NumEpisodes                                 80
Average/StdReturn                                    7.91745
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94029
GaussianMLPPolicy/KLAfter                            0.00359485
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.7039e-05
GaussianMLPPolicy/LossBefore                        -5.54323e-09
GaussianMLPPolicy/dLoss                              6.70334e-05
Iteration                                           72
MetaTest/Average/AverageDiscountedReturn           -61.7612
MetaTest/Average/AverageReturn                     -61.7612
MetaTest/Average/Iteration                          72
MetaTest/Average/MaxReturn                         -55.0847
MetaTest/Average/MinReturn                         -72.0559
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.94522
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.7612
MetaTest/__unnamed_task__/AverageReturn            -61.7612
MetaTest/__unnamed_task__/Iteration                 72
MetaTest/__unnamed_task__/MaxReturn                -55.0847
MetaTest/__unnamed_task__/MinReturn                -72.0559
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.94522
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.336e+06
__unnamed_task__/AverageDiscountedReturn           -33.8457
__unnamed_task__/AverageReturn                     -63.4193
__unnamed_task__/Iteration                          72
__unnamed_task__/MaxReturn                         -49.5346
__unnamed_task__/MinReturn                         -83.2256
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.91745
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 14:55:19 | [maml_trainer] epoch #73 | Sampling for adapation and meta-testing...
2025-03-30 14:59:30 | [maml_trainer] epoch #73 | Finished meta-testing...
2025-03-30 14:59:30 | [maml_trainer] epoch #73 | Saving snapshot...
2025-03-30 14:59:51 | [maml_trainer] epoch #73 | Saved
2025-03-30 14:59:51 | [maml_trainer] epoch #73 | Time 89492.32 s
2025-03-30 14:59:51 | [maml_trainer] epoch #73 | EpochTime 1247.42 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.9808
Average/AverageReturn                              -64.3584
Average/Iteration                                   73
Average/MaxReturn                                  -50.1435
Average/MinReturn                                  -82.0638
Average/NumEpisodes                                 80
Average/StdReturn                                    7.73637
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94258
GaussianMLPPolicy/KLAfter                            0.00340006
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000127603
GaussianMLPPolicy/LossBefore                         2.5034e-09
GaussianMLPPolicy/dLoss                             -0.0001276
Iteration                                           73
MetaTest/Average/AverageDiscountedReturn           -61.5196
MetaTest/Average/AverageReturn                     -61.5196
MetaTest/Average/Iteration                          73
MetaTest/Average/MaxReturn                         -52.8053
MetaTest/Average/MinReturn                         -78.7406
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.51418
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.5196
MetaTest/__unnamed_task__/AverageReturn            -61.5196
MetaTest/__unnamed_task__/Iteration                 73
MetaTest/__unnamed_task__/MaxReturn                -52.8053
MetaTest/__unnamed_task__/MinReturn                -78.7406
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.51418
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.368e+06
__unnamed_task__/AverageDiscountedReturn           -33.9808
__unnamed_task__/AverageReturn                     -64.3584
__unnamed_task__/Iteration                          73
__unnamed_task__/MaxReturn                         -50.1435
__unnamed_task__/MinReturn                         -82.0638
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.73637
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 15:16:20 | [maml_trainer] epoch #74 | Sampling for adapation and meta-testing...
2025-03-30 15:20:32 | [maml_trainer] epoch #74 | Finished meta-testing...
2025-03-30 15:20:32 | [maml_trainer] epoch #74 | Saving snapshot...
2025-03-30 15:20:54 | [maml_trainer] epoch #74 | Saved
2025-03-30 15:20:54 | [maml_trainer] epoch #74 | Time 90755.03 s
2025-03-30 15:20:54 | [maml_trainer] epoch #74 | EpochTime 1262.70 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.6857
Average/AverageReturn                              -60.9396
Average/Iteration                                   74
Average/MaxReturn                                  -48.9403
Average/MinReturn                                  -76.2946
Average/NumEpisodes                                 80
Average/StdReturn                                    6.42624
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94528
GaussianMLPPolicy/KLAfter                            0.00527487
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000125901
GaussianMLPPolicy/LossBefore                        -6.4671e-09
GaussianMLPPolicy/dLoss                              0.000125895
Iteration                                           74
MetaTest/Average/AverageDiscountedReturn           -63.5884
MetaTest/Average/AverageReturn                     -63.5884
MetaTest/Average/Iteration                          74
MetaTest/Average/MaxReturn                         -50.6763
MetaTest/Average/MinReturn                         -83.4865
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.75213
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -63.5884
MetaTest/__unnamed_task__/AverageReturn            -63.5884
MetaTest/__unnamed_task__/Iteration                 74
MetaTest/__unnamed_task__/MaxReturn                -50.6763
MetaTest/__unnamed_task__/MinReturn                -83.4865
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.75213
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.4e+06
__unnamed_task__/AverageDiscountedReturn           -32.6857
__unnamed_task__/AverageReturn                     -60.9396
__unnamed_task__/Iteration                          74
__unnamed_task__/MaxReturn                         -48.9403
__unnamed_task__/MinReturn                         -76.2946
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.42624
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 15:37:41 | [maml_trainer] epoch #75 | Sampling for adapation and meta-testing...
2025-03-30 15:41:36 | [maml_trainer] epoch #75 | Finished meta-testing...
2025-03-30 15:41:36 | [maml_trainer] epoch #75 | Saving snapshot...
2025-03-30 15:41:56 | [maml_trainer] epoch #75 | Saved
2025-03-30 15:41:56 | [maml_trainer] epoch #75 | Time 92017.90 s
2025-03-30 15:41:56 | [maml_trainer] epoch #75 | EpochTime 1262.87 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.1432
Average/AverageReturn                              -61.8696
Average/Iteration                                   75
Average/MaxReturn                                  -49.543
Average/MinReturn                                  -83.5658
Average/NumEpisodes                                 80
Average/StdReturn                                    7.23785
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9489
GaussianMLPPolicy/KLAfter                            0.00469652
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.93866e-05
GaussianMLPPolicy/LossBefore                        -6.28829e-09
GaussianMLPPolicy/dLoss                              3.93803e-05
Iteration                                           75
MetaTest/Average/AverageDiscountedReturn           -61.9759
MetaTest/Average/AverageReturn                     -61.9759
MetaTest/Average/Iteration                          75
MetaTest/Average/MaxReturn                         -51.1832
MetaTest/Average/MinReturn                         -79.6995
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.65275
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.9759
MetaTest/__unnamed_task__/AverageReturn            -61.9759
MetaTest/__unnamed_task__/Iteration                 75
MetaTest/__unnamed_task__/MaxReturn                -51.1832
MetaTest/__unnamed_task__/MinReturn                -79.6995
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.65275
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.432e+06
__unnamed_task__/AverageDiscountedReturn           -33.1432
__unnamed_task__/AverageReturn                     -61.8696
__unnamed_task__/Iteration                          75
__unnamed_task__/MaxReturn                         -49.543
__unnamed_task__/MinReturn                         -83.5658
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.23785
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 15:58:20 | [maml_trainer] epoch #76 | Sampling for adapation and meta-testing...
2025-03-30 16:02:32 | [maml_trainer] epoch #76 | Finished meta-testing...
2025-03-30 16:02:32 | [maml_trainer] epoch #76 | Saving snapshot...
2025-03-30 16:02:53 | [maml_trainer] epoch #76 | Saved
2025-03-30 16:02:53 | [maml_trainer] epoch #76 | Time 93274.72 s
2025-03-30 16:02:53 | [maml_trainer] epoch #76 | EpochTime 1256.81 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.0204
Average/AverageReturn                              -61.4188
Average/Iteration                                   76
Average/MaxReturn                                  -47.174
Average/MinReturn                                  -83.6685
Average/NumEpisodes                                 80
Average/StdReturn                                    6.24937
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95326
GaussianMLPPolicy/KLAfter                            0.00414861
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.85423e-05
GaussianMLPPolicy/LossBefore                        -4.17232e-10
GaussianMLPPolicy/dLoss                              1.85418e-05
Iteration                                           76
MetaTest/Average/AverageDiscountedReturn           -61.6905
MetaTest/Average/AverageReturn                     -61.6905
MetaTest/Average/Iteration                          76
MetaTest/Average/MaxReturn                         -51.3162
MetaTest/Average/MinReturn                         -73.6799
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.27246
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.6905
MetaTest/__unnamed_task__/AverageReturn            -61.6905
MetaTest/__unnamed_task__/Iteration                 76
MetaTest/__unnamed_task__/MaxReturn                -51.3162
MetaTest/__unnamed_task__/MinReturn                -73.6799
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.27246
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.464e+06
__unnamed_task__/AverageDiscountedReturn           -33.0204
__unnamed_task__/AverageReturn                     -61.4188
__unnamed_task__/Iteration                          76
__unnamed_task__/MaxReturn                         -47.174
__unnamed_task__/MinReturn                         -83.6685
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.24937
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 16:19:37 | [maml_trainer] epoch #77 | Sampling for adapation and meta-testing...
2025-03-30 16:23:44 | [maml_trainer] epoch #77 | Finished meta-testing...
2025-03-30 16:23:44 | [maml_trainer] epoch #77 | Saving snapshot...
2025-03-30 16:24:03 | [maml_trainer] epoch #77 | Saved
2025-03-30 16:24:03 | [maml_trainer] epoch #77 | Time 94544.78 s
2025-03-30 16:24:03 | [maml_trainer] epoch #77 | EpochTime 1270.06 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.1265
Average/AverageReturn                              -61.5727
Average/Iteration                                   77
Average/MaxReturn                                  -50.6495
Average/MinReturn                                  -99.6623
Average/NumEpisodes                                 80
Average/StdReturn                                    8.17349
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95794
GaussianMLPPolicy/KLAfter                            0.00274956
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.88505e-05
GaussianMLPPolicy/LossBefore                        -6.61612e-09
GaussianMLPPolicy/dLoss                             -3.88572e-05
Iteration                                           77
MetaTest/Average/AverageDiscountedReturn           -59.6188
MetaTest/Average/AverageReturn                     -59.6188
MetaTest/Average/Iteration                          77
MetaTest/Average/MaxReturn                         -49.7942
MetaTest/Average/MinReturn                         -69.9023
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.60876
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -59.6188
MetaTest/__unnamed_task__/AverageReturn            -59.6188
MetaTest/__unnamed_task__/Iteration                 77
MetaTest/__unnamed_task__/MaxReturn                -49.7942
MetaTest/__unnamed_task__/MinReturn                -69.9023
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.60876
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.496e+06
__unnamed_task__/AverageDiscountedReturn           -33.1265
__unnamed_task__/AverageReturn                     -61.5727
__unnamed_task__/Iteration                          77
__unnamed_task__/MaxReturn                         -50.6495
__unnamed_task__/MinReturn                         -99.6623
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.17349
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 16:40:53 | [maml_trainer] epoch #78 | Sampling for adapation and meta-testing...
2025-03-30 16:45:06 | [maml_trainer] epoch #78 | Finished meta-testing...
2025-03-30 16:45:06 | [maml_trainer] epoch #78 | Saving snapshot...
2025-03-30 16:45:27 | [maml_trainer] epoch #78 | Saved
2025-03-30 16:45:27 | [maml_trainer] epoch #78 | Time 95828.48 s
2025-03-30 16:45:27 | [maml_trainer] epoch #78 | EpochTime 1283.69 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.6466
Average/AverageReturn                              -60.2834
Average/Iteration                                   78
Average/MaxReturn                                  -49.1154
Average/MinReturn                                  -81.8633
Average/NumEpisodes                                 80
Average/StdReturn                                    7.3201
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96257
GaussianMLPPolicy/KLAfter                            0.00293399
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.20849e-05
GaussianMLPPolicy/LossBefore                        -7.74861e-10
GaussianMLPPolicy/dLoss                              5.20841e-05
Iteration                                           78
MetaTest/Average/AverageDiscountedReturn           -62.9608
MetaTest/Average/AverageReturn                     -62.9608
MetaTest/Average/Iteration                          78
MetaTest/Average/MaxReturn                         -49.9984
MetaTest/Average/MinReturn                         -75.3052
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.07686
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -62.9608
MetaTest/__unnamed_task__/AverageReturn            -62.9608
MetaTest/__unnamed_task__/Iteration                 78
MetaTest/__unnamed_task__/MaxReturn                -49.9984
MetaTest/__unnamed_task__/MinReturn                -75.3052
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.07686
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.528e+06
__unnamed_task__/AverageDiscountedReturn           -32.6466
__unnamed_task__/AverageReturn                     -60.2834
__unnamed_task__/Iteration                          78
__unnamed_task__/MaxReturn                         -49.1154
__unnamed_task__/MinReturn                         -81.8633
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.3201
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 17:02:18 | [maml_trainer] epoch #79 | Sampling for adapation and meta-testing...
2025-03-30 17:06:34 | [maml_trainer] epoch #79 | Finished meta-testing...
2025-03-30 17:06:34 | [maml_trainer] epoch #79 | Saving snapshot...
2025-03-30 17:06:56 | [maml_trainer] epoch #79 | Saved
2025-03-30 17:06:56 | [maml_trainer] epoch #79 | Time 97117.46 s
2025-03-30 17:06:56 | [maml_trainer] epoch #79 | EpochTime 1288.97 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.7902
Average/AverageReturn                              -60.5687
Average/Iteration                                   79
Average/MaxReturn                                  -47.7739
Average/MinReturn                                  -77.1387
Average/NumEpisodes                                 80
Average/StdReturn                                    5.69763
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96649
GaussianMLPPolicy/KLAfter                            0.00257219
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.38006e-05
GaussianMLPPolicy/LossBefore                        -2.6226e-09
GaussianMLPPolicy/dLoss                              2.3798e-05
Iteration                                           79
MetaTest/Average/AverageDiscountedReturn           -58.477
MetaTest/Average/AverageReturn                     -58.477
MetaTest/Average/Iteration                          79
MetaTest/Average/MaxReturn                         -50.0316
MetaTest/Average/MinReturn                         -69.832
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.21383
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -58.477
MetaTest/__unnamed_task__/AverageReturn            -58.477
MetaTest/__unnamed_task__/Iteration                 79
MetaTest/__unnamed_task__/MaxReturn                -50.0316
MetaTest/__unnamed_task__/MinReturn                -69.832
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.21383
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.56e+06
__unnamed_task__/AverageDiscountedReturn           -32.7902
__unnamed_task__/AverageReturn                     -60.5687
__unnamed_task__/Iteration                          79
__unnamed_task__/MaxReturn                         -47.7739
__unnamed_task__/MinReturn                         -77.1387
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.69763
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 17:24:12 | [maml_trainer] epoch #80 | Sampling for adapation and meta-testing...
2025-03-30 17:28:32 | [maml_trainer] epoch #80 | Finished meta-testing...
2025-03-30 17:28:32 | [maml_trainer] epoch #80 | Saving snapshot...
2025-03-30 17:28:54 | [maml_trainer] epoch #80 | Saved
2025-03-30 17:28:54 | [maml_trainer] epoch #80 | Time 98435.35 s
2025-03-30 17:28:54 | [maml_trainer] epoch #80 | EpochTime 1317.89 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -32.9693
Average/AverageReturn                               -61.9965
Average/Iteration                                    80
Average/MaxReturn                                   -50.8572
Average/MinReturn                                  -152.702
Average/NumEpisodes                                  80
Average/StdReturn                                    12.0068
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97064
GaussianMLPPolicy/KLAfter                             0.0012685
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.31344e-06
GaussianMLPPolicy/LossBefore                         -1.23084e-08
GaussianMLPPolicy/dLoss                              -4.32575e-06
Iteration                                            80
MetaTest/Average/AverageDiscountedReturn            -61.7784
MetaTest/Average/AverageReturn                      -61.7784
MetaTest/Average/Iteration                           80
MetaTest/Average/MaxReturn                          -52.2634
MetaTest/Average/MinReturn                          -70.3841
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.45006
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.7784
MetaTest/__unnamed_task__/AverageReturn             -61.7784
MetaTest/__unnamed_task__/Iteration                  80
MetaTest/__unnamed_task__/MaxReturn                 -52.2634
MetaTest/__unnamed_task__/MinReturn                 -70.3841
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.45006
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.592e+06
__unnamed_task__/AverageDiscountedReturn            -32.9693
__unnamed_task__/AverageReturn                      -61.9965
__unnamed_task__/Iteration                           80
__unnamed_task__/MaxReturn                          -50.8572
__unnamed_task__/MinReturn                         -152.702
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.0068
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 17:45:28 | [maml_trainer] epoch #81 | Sampling for adapation and meta-testing...
2025-03-30 17:49:26 | [maml_trainer] epoch #81 | Finished meta-testing...
2025-03-30 17:49:26 | [maml_trainer] epoch #81 | Saving snapshot...
2025-03-30 17:49:46 | [maml_trainer] epoch #81 | Saved
2025-03-30 17:49:46 | [maml_trainer] epoch #81 | Time 99687.21 s
2025-03-30 17:49:46 | [maml_trainer] epoch #81 | EpochTime 1251.85 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -32.205
Average/AverageReturn                               -60.7222
Average/Iteration                                    81
Average/MaxReturn                                   -47.4544
Average/MinReturn                                  -191.529
Average/NumEpisodes                                  80
Average/StdReturn                                    16.8669
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97521
GaussianMLPPolicy/KLAfter                             0.00140527
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.1204e-05
GaussianMLPPolicy/LossBefore                          6.04987e-09
GaussianMLPPolicy/dLoss                               3.121e-05
Iteration                                            81
MetaTest/Average/AverageDiscountedReturn            -57.4348
MetaTest/Average/AverageReturn                      -57.4348
MetaTest/Average/Iteration                           81
MetaTest/Average/MaxReturn                          -49.1327
MetaTest/Average/MinReturn                          -67.9705
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            4.77576
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.4348
MetaTest/__unnamed_task__/AverageReturn             -57.4348
MetaTest/__unnamed_task__/Iteration                  81
MetaTest/__unnamed_task__/MaxReturn                 -49.1327
MetaTest/__unnamed_task__/MinReturn                 -67.9705
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   4.77576
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.624e+06
__unnamed_task__/AverageDiscountedReturn            -32.205
__unnamed_task__/AverageReturn                      -60.7222
__unnamed_task__/Iteration                           81
__unnamed_task__/MaxReturn                          -47.4544
__unnamed_task__/MinReturn                         -191.529
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           16.8669
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 18:06:27 | [maml_trainer] epoch #82 | Sampling for adapation and meta-testing...
2025-03-30 18:10:28 | [maml_trainer] epoch #82 | Finished meta-testing...
2025-03-30 18:10:28 | [maml_trainer] epoch #82 | Saving snapshot...
2025-03-30 18:10:48 | [maml_trainer] epoch #82 | Saved
2025-03-30 18:10:48 | [maml_trainer] epoch #82 | Time 100949.67 s
2025-03-30 18:10:48 | [maml_trainer] epoch #82 | EpochTime 1262.46 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.002
Average/AverageReturn                              -58.4809
Average/Iteration                                   82
Average/MaxReturn                                  -48.1626
Average/MinReturn                                  -73.3478
Average/NumEpisodes                                 80
Average/StdReturn                                    5.23677
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98002
GaussianMLPPolicy/KLAfter                            0.00142698
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.35533e-05
GaussianMLPPolicy/LossBefore                        -3.21865e-09
GaussianMLPPolicy/dLoss                              2.35501e-05
Iteration                                           82
MetaTest/Average/AverageDiscountedReturn           -60.544
MetaTest/Average/AverageReturn                     -60.544
MetaTest/Average/Iteration                          82
MetaTest/Average/MaxReturn                         -47.9726
MetaTest/Average/MinReturn                         -74.5236
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.318
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -60.544
MetaTest/__unnamed_task__/AverageReturn            -60.544
MetaTest/__unnamed_task__/Iteration                 82
MetaTest/__unnamed_task__/MaxReturn                -47.9726
MetaTest/__unnamed_task__/MinReturn                -74.5236
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.318
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.656e+06
__unnamed_task__/AverageDiscountedReturn           -32.002
__unnamed_task__/AverageReturn                     -58.4809
__unnamed_task__/Iteration                          82
__unnamed_task__/MaxReturn                         -48.1626
__unnamed_task__/MinReturn                         -73.3478
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.23677
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 18:27:48 | [maml_trainer] epoch #83 | Sampling for adapation and meta-testing...
2025-03-30 18:32:02 | [maml_trainer] epoch #83 | Finished meta-testing...
2025-03-30 18:32:02 | [maml_trainer] epoch #83 | Saving snapshot...
2025-03-30 18:32:24 | [maml_trainer] epoch #83 | Saved
2025-03-30 18:32:24 | [maml_trainer] epoch #83 | Time 102245.60 s
2025-03-30 18:32:24 | [maml_trainer] epoch #83 | EpochTime 1295.93 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -32.9434
Average/AverageReturn                               -61.6929
Average/Iteration                                    83
Average/MaxReturn                                   -47.8508
Average/MinReturn                                  -116.948
Average/NumEpisodes                                  80
Average/StdReturn                                    10.0472
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98392
GaussianMLPPolicy/KLAfter                             0.00221333
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.02207e-06
GaussianMLPPolicy/LossBefore                          2.41399e-09
GaussianMLPPolicy/dLoss                              -6.01965e-06
Iteration                                            83
MetaTest/Average/AverageDiscountedReturn            -57.0571
MetaTest/Average/AverageReturn                      -57.0571
MetaTest/Average/Iteration                           83
MetaTest/Average/MaxReturn                          -48.0341
MetaTest/Average/MinReturn                          -67.7459
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.02884
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.0571
MetaTest/__unnamed_task__/AverageReturn             -57.0571
MetaTest/__unnamed_task__/Iteration                  83
MetaTest/__unnamed_task__/MaxReturn                 -48.0341
MetaTest/__unnamed_task__/MinReturn                 -67.7459
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.02884
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.688e+06
__unnamed_task__/AverageDiscountedReturn            -32.9434
__unnamed_task__/AverageReturn                      -61.6929
__unnamed_task__/Iteration                           83
__unnamed_task__/MaxReturn                          -47.8508
__unnamed_task__/MinReturn                         -116.948
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.0472
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 18:49:00 | [maml_trainer] epoch #84 | Sampling for adapation and meta-testing...
2025-03-30 18:53:15 | [maml_trainer] epoch #84 | Finished meta-testing...
2025-03-30 18:53:15 | [maml_trainer] epoch #84 | Saving snapshot...
2025-03-30 18:53:36 | [maml_trainer] epoch #84 | Saved
2025-03-30 18:53:36 | [maml_trainer] epoch #84 | Time 103517.68 s
2025-03-30 18:53:36 | [maml_trainer] epoch #84 | EpochTime 1272.08 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.9231
Average/AverageReturn                               -58.9367
Average/Iteration                                    84
Average/MaxReturn                                   -47.0715
Average/MinReturn                                  -100.457
Average/NumEpisodes                                  80
Average/StdReturn                                     7.9777
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9865
GaussianMLPPolicy/KLAfter                             0.00169647
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -4.97684e-05
GaussianMLPPolicy/LossBefore                          6.67572e-09
GaussianMLPPolicy/dLoss                               4.97751e-05
Iteration                                            84
MetaTest/Average/AverageDiscountedReturn            -70.4637
MetaTest/Average/AverageReturn                      -70.4637
MetaTest/Average/Iteration                           84
MetaTest/Average/MaxReturn                          -48.9245
MetaTest/Average/MinReturn                         -135.352
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           25.0467
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -70.4637
MetaTest/__unnamed_task__/AverageReturn             -70.4637
MetaTest/__unnamed_task__/Iteration                  84
MetaTest/__unnamed_task__/MaxReturn                 -48.9245
MetaTest/__unnamed_task__/MinReturn                -135.352
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  25.0467
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.72e+06
__unnamed_task__/AverageDiscountedReturn            -31.9231
__unnamed_task__/AverageReturn                      -58.9367
__unnamed_task__/Iteration                           84
__unnamed_task__/MaxReturn                          -47.0715
__unnamed_task__/MinReturn                         -100.457
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            7.9777
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 19:10:33 | [maml_trainer] epoch #85 | Sampling for adapation and meta-testing...
2025-03-30 19:14:39 | [maml_trainer] epoch #85 | Finished meta-testing...
2025-03-30 19:14:39 | [maml_trainer] epoch #85 | Saving snapshot...
2025-03-30 19:14:59 | [maml_trainer] epoch #85 | Saved
2025-03-30 19:14:59 | [maml_trainer] epoch #85 | Time 104800.37 s
2025-03-30 19:14:59 | [maml_trainer] epoch #85 | EpochTime 1282.68 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -32.6483
Average/AverageReturn                               -63.2898
Average/Iteration                                    85
Average/MaxReturn                                   -46.2128
Average/MinReturn                                  -120.302
Average/NumEpisodes                                  80
Average/StdReturn                                    15.0633
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98844
GaussianMLPPolicy/KLAfter                             0.00111315
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -8.42917e-06
GaussianMLPPolicy/LossBefore                          2.05636e-09
GaussianMLPPolicy/dLoss                               8.43123e-06
Iteration                                            85
MetaTest/Average/AverageDiscountedReturn            -63.8157
MetaTest/Average/AverageReturn                      -63.8157
MetaTest/Average/Iteration                           85
MetaTest/Average/MaxReturn                          -48.0983
MetaTest/Average/MinReturn                         -143.11
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           19.3101
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -63.8157
MetaTest/__unnamed_task__/AverageReturn             -63.8157
MetaTest/__unnamed_task__/Iteration                  85
MetaTest/__unnamed_task__/MaxReturn                 -48.0983
MetaTest/__unnamed_task__/MinReturn                -143.11
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  19.3101
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.752e+06
__unnamed_task__/AverageDiscountedReturn            -32.6483
__unnamed_task__/AverageReturn                      -63.2898
__unnamed_task__/Iteration                           85
__unnamed_task__/MaxReturn                          -46.2128
__unnamed_task__/MinReturn                         -120.302
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.0633
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 19:31:26 | [maml_trainer] epoch #86 | Sampling for adapation and meta-testing...
2025-03-30 19:35:29 | [maml_trainer] epoch #86 | Finished meta-testing...
2025-03-30 19:35:29 | [maml_trainer] epoch #86 | Saving snapshot...
2025-03-30 19:35:50 | [maml_trainer] epoch #86 | Saved
2025-03-30 19:35:50 | [maml_trainer] epoch #86 | Time 106051.24 s
2025-03-30 19:35:50 | [maml_trainer] epoch #86 | EpochTime 1250.87 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.2819
Average/AverageReturn                               -65.372
Average/Iteration                                    86
Average/MaxReturn                                   -46.4866
Average/MinReturn                                  -166.869
Average/NumEpisodes                                  80
Average/StdReturn                                    20.0159
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99138
GaussianMLPPolicy/KLAfter                             0.00246301
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.68141e-05
GaussianMLPPolicy/LossBefore                         -2.92063e-09
GaussianMLPPolicy/dLoss                               5.68112e-05
Iteration                                            86
MetaTest/Average/AverageDiscountedReturn            -60.0029
MetaTest/Average/AverageReturn                      -60.0029
MetaTest/Average/Iteration                           86
MetaTest/Average/MaxReturn                          -50.0357
MetaTest/Average/MinReturn                          -80.9241
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.00107
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -60.0029
MetaTest/__unnamed_task__/AverageReturn             -60.0029
MetaTest/__unnamed_task__/Iteration                  86
MetaTest/__unnamed_task__/MaxReturn                 -50.0357
MetaTest/__unnamed_task__/MinReturn                 -80.9241
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.00107
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.784e+06
__unnamed_task__/AverageDiscountedReturn            -33.2819
__unnamed_task__/AverageReturn                      -65.372
__unnamed_task__/Iteration                           86
__unnamed_task__/MaxReturn                          -46.4866
__unnamed_task__/MinReturn                         -166.869
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           20.0159
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 19:52:42 | [maml_trainer] epoch #87 | Sampling for adapation and meta-testing...
2025-03-30 19:56:47 | [maml_trainer] epoch #87 | Finished meta-testing...
2025-03-30 19:56:47 | [maml_trainer] epoch #87 | Saving snapshot...
2025-03-30 19:57:07 | [maml_trainer] epoch #87 | Saved
2025-03-30 19:57:07 | [maml_trainer] epoch #87 | Time 107328.41 s
2025-03-30 19:57:07 | [maml_trainer] epoch #87 | EpochTime 1277.17 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -34.5858
Average/AverageReturn                               -70.9394
Average/Iteration                                    87
Average/MaxReturn                                   -49.6997
Average/MinReturn                                  -160.068
Average/NumEpisodes                                  80
Average/StdReturn                                    26.2002
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99314
GaussianMLPPolicy/KLAfter                             0.00292993
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           7.0321e-05
GaussianMLPPolicy/LossBefore                          9.53674e-10
GaussianMLPPolicy/dLoss                              -7.032e-05
Iteration                                            87
MetaTest/Average/AverageDiscountedReturn            -65.9769
MetaTest/Average/AverageReturn                      -65.9769
MetaTest/Average/Iteration                           87
MetaTest/Average/MaxReturn                          -52.8243
MetaTest/Average/MinReturn                         -107.228
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.6411
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -65.9769
MetaTest/__unnamed_task__/AverageReturn             -65.9769
MetaTest/__unnamed_task__/Iteration                  87
MetaTest/__unnamed_task__/MaxReturn                 -52.8243
MetaTest/__unnamed_task__/MinReturn                -107.228
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.6411
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.816e+06
__unnamed_task__/AverageDiscountedReturn            -34.5858
__unnamed_task__/AverageReturn                      -70.9394
__unnamed_task__/Iteration                           87
__unnamed_task__/MaxReturn                          -49.6997
__unnamed_task__/MinReturn                         -160.068
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           26.2002
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 20:13:48 | [maml_trainer] epoch #88 | Sampling for adapation and meta-testing...
2025-03-30 20:17:59 | [maml_trainer] epoch #88 | Finished meta-testing...
2025-03-30 20:17:59 | [maml_trainer] epoch #88 | Saving snapshot...
2025-03-30 20:18:20 | [maml_trainer] epoch #88 | Saved
2025-03-30 20:18:20 | [maml_trainer] epoch #88 | Time 108601.85 s
2025-03-30 20:18:20 | [maml_trainer] epoch #88 | EpochTime 1273.44 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.1352
Average/AverageReturn                               -66.0887
Average/Iteration                                    88
Average/MaxReturn                                   -46.5394
Average/MinReturn                                  -134.249
Average/NumEpisodes                                  80
Average/StdReturn                                    18.5318
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99426
GaussianMLPPolicy/KLAfter                             0.00377027
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.16556e-05
GaussianMLPPolicy/LossBefore                          3.27826e-10
GaussianMLPPolicy/dLoss                               5.1656e-05
Iteration                                            88
MetaTest/Average/AverageDiscountedReturn            -61.5005
MetaTest/Average/AverageReturn                      -61.5005
MetaTest/Average/Iteration                           88
MetaTest/Average/MaxReturn                          -50.4571
MetaTest/Average/MinReturn                          -88.969
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.18976
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.5005
MetaTest/__unnamed_task__/AverageReturn             -61.5005
MetaTest/__unnamed_task__/Iteration                  88
MetaTest/__unnamed_task__/MaxReturn                 -50.4571
MetaTest/__unnamed_task__/MinReturn                 -88.969
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.18976
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.848e+06
__unnamed_task__/AverageDiscountedReturn            -33.1352
__unnamed_task__/AverageReturn                      -66.0887
__unnamed_task__/Iteration                           88
__unnamed_task__/MaxReturn                          -46.5394
__unnamed_task__/MinReturn                         -134.249
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           18.5318
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 20:34:54 | [maml_trainer] epoch #89 | Sampling for adapation and meta-testing...
2025-03-30 20:39:01 | [maml_trainer] epoch #89 | Finished meta-testing...
2025-03-30 20:39:01 | [maml_trainer] epoch #89 | Saving snapshot...
2025-03-30 20:39:22 | [maml_trainer] epoch #89 | Saved
2025-03-30 20:39:22 | [maml_trainer] epoch #89 | Time 109863.98 s
2025-03-30 20:39:22 | [maml_trainer] epoch #89 | EpochTime 1262.13 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.5394
Average/AverageReturn                               -64.8683
Average/Iteration                                    89
Average/MaxReturn                                   -47.7871
Average/MinReturn                                  -137.678
Average/NumEpisodes                                  80
Average/StdReturn                                    16.5197
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99498
GaussianMLPPolicy/KLAfter                             0.00374035
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.34201e-05
GaussianMLPPolicy/LossBefore                         -3.33786e-09
GaussianMLPPolicy/dLoss                               3.34167e-05
Iteration                                            89
MetaTest/Average/AverageDiscountedReturn            -59.9501
MetaTest/Average/AverageReturn                      -59.9501
MetaTest/Average/Iteration                           89
MetaTest/Average/MaxReturn                          -48.6437
MetaTest/Average/MinReturn                          -75.2688
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            6.80408
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -59.9501
MetaTest/__unnamed_task__/AverageReturn             -59.9501
MetaTest/__unnamed_task__/Iteration                  89
MetaTest/__unnamed_task__/MaxReturn                 -48.6437
MetaTest/__unnamed_task__/MinReturn                 -75.2688
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   6.80408
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.88e+06
__unnamed_task__/AverageDiscountedReturn            -33.5394
__unnamed_task__/AverageReturn                      -64.8683
__unnamed_task__/Iteration                           89
__unnamed_task__/MaxReturn                          -47.7871
__unnamed_task__/MinReturn                         -137.678
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           16.5197
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 20:55:40 | [maml_trainer] epoch #90 | Sampling for adapation and meta-testing...
2025-03-30 20:59:48 | [maml_trainer] epoch #90 | Finished meta-testing...
2025-03-30 20:59:48 | [maml_trainer] epoch #90 | Saving snapshot...
2025-03-30 21:00:09 | [maml_trainer] epoch #90 | Saved
2025-03-30 21:00:09 | [maml_trainer] epoch #90 | Time 111110.28 s
2025-03-30 21:00:09 | [maml_trainer] epoch #90 | EpochTime 1246.29 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.8698
Average/AverageReturn                               -64.9173
Average/Iteration                                    90
Average/MaxReturn                                   -48.1625
Average/MinReturn                                  -156.449
Average/NumEpisodes                                  80
Average/StdReturn                                    17.0611
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99648
GaussianMLPPolicy/KLAfter                             0.00533717
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.02373e-05
GaussianMLPPolicy/LossBefore                         -8.16584e-09
GaussianMLPPolicy/dLoss                              -2.02454e-05
Iteration                                            90
MetaTest/Average/AverageDiscountedReturn            -63.1649
MetaTest/Average/AverageReturn                      -63.1649
MetaTest/Average/Iteration                           90
MetaTest/Average/MaxReturn                          -47.984
MetaTest/Average/MinReturn                         -148.942
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           20.2514
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -63.1649
MetaTest/__unnamed_task__/AverageReturn             -63.1649
MetaTest/__unnamed_task__/Iteration                  90
MetaTest/__unnamed_task__/MaxReturn                 -47.984
MetaTest/__unnamed_task__/MinReturn                -148.942
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  20.2514
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.912e+06
__unnamed_task__/AverageDiscountedReturn            -33.8698
__unnamed_task__/AverageReturn                      -64.9173
__unnamed_task__/Iteration                           90
__unnamed_task__/MaxReturn                          -48.1625
__unnamed_task__/MinReturn                         -156.449
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           17.0611
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 21:16:59 | [maml_trainer] epoch #91 | Sampling for adapation and meta-testing...
2025-03-30 21:21:06 | [maml_trainer] epoch #91 | Finished meta-testing...
2025-03-30 21:21:06 | [maml_trainer] epoch #91 | Saving snapshot...
2025-03-30 21:21:25 | [maml_trainer] epoch #91 | Saved
2025-03-30 21:21:25 | [maml_trainer] epoch #91 | Time 112386.99 s
2025-03-30 21:21:25 | [maml_trainer] epoch #91 | EpochTime 1276.71 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.2643
Average/AverageReturn                               -62.8693
Average/Iteration                                    91
Average/MaxReturn                                   -46.8029
Average/MinReturn                                  -149.349
Average/NumEpisodes                                  80
Average/StdReturn                                    13.9933
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99891
GaussianMLPPolicy/KLAfter                             0.00567162
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.02651e-05
GaussianMLPPolicy/LossBefore                          9.0003e-09
GaussianMLPPolicy/dLoss                               5.02741e-05
Iteration                                            91
MetaTest/Average/AverageDiscountedReturn            -61.2505
MetaTest/Average/AverageReturn                      -61.2505
MetaTest/Average/Iteration                           91
MetaTest/Average/MaxReturn                          -48.1212
MetaTest/Average/MinReturn                         -121.517
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.3515
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.2505
MetaTest/__unnamed_task__/AverageReturn             -61.2505
MetaTest/__unnamed_task__/Iteration                  91
MetaTest/__unnamed_task__/MaxReturn                 -48.1212
MetaTest/__unnamed_task__/MinReturn                -121.517
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.3515
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.944e+06
__unnamed_task__/AverageDiscountedReturn            -33.2643
__unnamed_task__/AverageReturn                      -62.8693
__unnamed_task__/Iteration                           91
__unnamed_task__/MaxReturn                          -46.8029
__unnamed_task__/MinReturn                         -149.349
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.9933
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 21:37:07 | [maml_trainer] epoch #92 | Sampling for adapation and meta-testing...
2025-03-30 21:41:00 | [maml_trainer] epoch #92 | Finished meta-testing...
2025-03-30 21:41:00 | [maml_trainer] epoch #92 | Saving snapshot...
2025-03-30 21:41:21 | [maml_trainer] epoch #92 | Saved
2025-03-30 21:41:21 | [maml_trainer] epoch #92 | Time 113582.50 s
2025-03-30 21:41:21 | [maml_trainer] epoch #92 | EpochTime 1195.50 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -32.743
Average/AverageReturn                               -60.3513
Average/Iteration                                    92
Average/MaxReturn                                   -48.61
Average/MinReturn                                  -127.803
Average/NumEpisodes                                  80
Average/StdReturn                                    10.5106
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0019
GaussianMLPPolicy/KLAfter                             0.00654462
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -8.97858e-05
GaussianMLPPolicy/LossBefore                          2.29478e-09
GaussianMLPPolicy/dLoss                               8.97881e-05
Iteration                                            92
MetaTest/Average/AverageDiscountedReturn            -63.53
MetaTest/Average/AverageReturn                      -63.53
MetaTest/Average/Iteration                           92
MetaTest/Average/MaxReturn                          -50.8272
MetaTest/Average/MinReturn                         -112.538
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           12.6552
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -63.53
MetaTest/__unnamed_task__/AverageReturn             -63.53
MetaTest/__unnamed_task__/Iteration                  92
MetaTest/__unnamed_task__/MaxReturn                 -50.8272
MetaTest/__unnamed_task__/MinReturn                -112.538
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  12.6552
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         2.976e+06
__unnamed_task__/AverageDiscountedReturn            -32.743
__unnamed_task__/AverageReturn                      -60.3513
__unnamed_task__/Iteration                           92
__unnamed_task__/MaxReturn                          -48.61
__unnamed_task__/MinReturn                         -127.803
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.5106
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 21:57:50 | [maml_trainer] epoch #93 | Sampling for adapation and meta-testing...
2025-03-30 22:01:51 | [maml_trainer] epoch #93 | Finished meta-testing...
2025-03-30 22:01:51 | [maml_trainer] epoch #93 | Saving snapshot...
2025-03-30 22:02:13 | [maml_trainer] epoch #93 | Saved
2025-03-30 22:02:13 | [maml_trainer] epoch #93 | Time 114834.24 s
2025-03-30 22:02:13 | [maml_trainer] epoch #93 | EpochTime 1251.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.8443
Average/AverageReturn                              -59.9444
Average/Iteration                                   93
Average/MaxReturn                                  -48.6933
Average/MinReturn                                  -98.1658
Average/NumEpisodes                                 80
Average/StdReturn                                    8.11988
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0031
GaussianMLPPolicy/KLAfter                            0.0055757
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.60056e-05
GaussianMLPPolicy/LossBefore                         1.90735e-09
GaussianMLPPolicy/dLoss                              7.60075e-05
Iteration                                           93
MetaTest/Average/AverageDiscountedReturn           -61.5513
MetaTest/Average/AverageReturn                     -61.5513
MetaTest/Average/Iteration                          93
MetaTest/Average/MaxReturn                         -50.4304
MetaTest/Average/MinReturn                         -74.9423
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.92278
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.5513
MetaTest/__unnamed_task__/AverageReturn            -61.5513
MetaTest/__unnamed_task__/Iteration                 93
MetaTest/__unnamed_task__/MaxReturn                -50.4304
MetaTest/__unnamed_task__/MinReturn                -74.9423
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.92278
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.008e+06
__unnamed_task__/AverageDiscountedReturn           -32.8443
__unnamed_task__/AverageReturn                     -59.9444
__unnamed_task__/Iteration                          93
__unnamed_task__/MaxReturn                         -48.6933
__unnamed_task__/MinReturn                         -98.1658
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.11988
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 22:17:58 | [maml_trainer] epoch #94 | Sampling for adapation and meta-testing...
2025-03-30 22:21:53 | [maml_trainer] epoch #94 | Finished meta-testing...
2025-03-30 22:21:53 | [maml_trainer] epoch #94 | Saving snapshot...
2025-03-30 22:22:13 | [maml_trainer] epoch #94 | Saved
2025-03-30 22:22:13 | [maml_trainer] epoch #94 | Time 116034.97 s
2025-03-30 22:22:13 | [maml_trainer] epoch #94 | EpochTime 1200.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.0831
Average/AverageReturn                              -59.9715
Average/Iteration                                   94
Average/MaxReturn                                  -47.611
Average/MinReturn                                  -76.6539
Average/NumEpisodes                                 80
Average/StdReturn                                    6.57087
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0039
GaussianMLPPolicy/KLAfter                            0.00516804
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.76329e-05
GaussianMLPPolicy/LossBefore                        -2.25306e-08
GaussianMLPPolicy/dLoss                              5.76104e-05
Iteration                                           94
MetaTest/Average/AverageDiscountedReturn           -59.8715
MetaTest/Average/AverageReturn                     -59.8715
MetaTest/Average/Iteration                          94
MetaTest/Average/MaxReturn                         -50.7538
MetaTest/Average/MinReturn                         -68.1227
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.85746
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -59.8715
MetaTest/__unnamed_task__/AverageReturn            -59.8715
MetaTest/__unnamed_task__/Iteration                 94
MetaTest/__unnamed_task__/MaxReturn                -50.7538
MetaTest/__unnamed_task__/MinReturn                -68.1227
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.85746
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.04e+06
__unnamed_task__/AverageDiscountedReturn           -33.0831
__unnamed_task__/AverageReturn                     -59.9715
__unnamed_task__/Iteration                          94
__unnamed_task__/MaxReturn                         -47.611
__unnamed_task__/MinReturn                         -76.6539
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.57087
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 22:37:55 | [maml_trainer] epoch #95 | Sampling for adapation and meta-testing...
2025-03-30 22:41:45 | [maml_trainer] epoch #95 | Finished meta-testing...
2025-03-30 22:41:45 | [maml_trainer] epoch #95 | Saving snapshot...
2025-03-30 22:42:05 | [maml_trainer] epoch #95 | Saved
2025-03-30 22:42:05 | [maml_trainer] epoch #95 | Time 117226.30 s
2025-03-30 22:42:05 | [maml_trainer] epoch #95 | EpochTime 1191.33 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -33.289
Average/AverageReturn                               -60.5218
Average/Iteration                                    95
Average/MaxReturn                                   -48.4199
Average/MinReturn                                  -114.438
Average/NumEpisodes                                  80
Average/StdReturn                                     8.67208
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0048
GaussianMLPPolicy/KLAfter                             0.00450262
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.79842e-05
GaussianMLPPolicy/LossBefore                         -4.35114e-09
GaussianMLPPolicy/dLoss                              -2.79886e-05
Iteration                                            95
MetaTest/Average/AverageDiscountedReturn            -56.898
MetaTest/Average/AverageReturn                      -56.898
MetaTest/Average/Iteration                           95
MetaTest/Average/MaxReturn                          -48.6497
MetaTest/Average/MinReturn                          -65.3212
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.18784
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.898
MetaTest/__unnamed_task__/AverageReturn             -56.898
MetaTest/__unnamed_task__/Iteration                  95
MetaTest/__unnamed_task__/MaxReturn                 -48.6497
MetaTest/__unnamed_task__/MinReturn                 -65.3212
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.18784
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.072e+06
__unnamed_task__/AverageDiscountedReturn            -33.289
__unnamed_task__/AverageReturn                      -60.5218
__unnamed_task__/Iteration                           95
__unnamed_task__/MaxReturn                          -48.4199
__unnamed_task__/MinReturn                         -114.438
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.67208
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-30 22:57:38 | [maml_trainer] epoch #96 | Sampling for adapation and meta-testing...
2025-03-30 23:01:39 | [maml_trainer] epoch #96 | Finished meta-testing...
2025-03-30 23:01:39 | [maml_trainer] epoch #96 | Saving snapshot...
2025-03-30 23:02:00 | [maml_trainer] epoch #96 | Saved
2025-03-30 23:02:00 | [maml_trainer] epoch #96 | Time 118421.53 s
2025-03-30 23:02:00 | [maml_trainer] epoch #96 | EpochTime 1195.23 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.3962
Average/AverageReturn                              -59.811
Average/Iteration                                   96
Average/MaxReturn                                  -49.5033
Average/MinReturn                                  -74.5205
Average/NumEpisodes                                 80
Average/StdReturn                                    5.09586
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.005
GaussianMLPPolicy/KLAfter                            0.00556933
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.02635e-09
GaussianMLPPolicy/LossBefore                        -7.30157e-09
GaussianMLPPolicy/dLoss                             -5.27521e-09
Iteration                                           96
MetaTest/Average/AverageDiscountedReturn           -58.3035
MetaTest/Average/AverageReturn                     -58.3035
MetaTest/Average/Iteration                          96
MetaTest/Average/MaxReturn                         -50.7544
MetaTest/Average/MinReturn                         -67.2571
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.5005
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -58.3035
MetaTest/__unnamed_task__/AverageReturn            -58.3035
MetaTest/__unnamed_task__/Iteration                 96
MetaTest/__unnamed_task__/MaxReturn                -50.7544
MetaTest/__unnamed_task__/MinReturn                -67.2571
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.5005
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.104e+06
__unnamed_task__/AverageDiscountedReturn           -33.3962
__unnamed_task__/AverageReturn                     -59.811
__unnamed_task__/Iteration                          96
__unnamed_task__/MaxReturn                         -49.5033
__unnamed_task__/MinReturn                         -74.5205
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.09586
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 23:17:42 | [maml_trainer] epoch #97 | Sampling for adapation and meta-testing...
2025-03-30 23:21:44 | [maml_trainer] epoch #97 | Finished meta-testing...
2025-03-30 23:21:44 | [maml_trainer] epoch #97 | Saving snapshot...
2025-03-30 23:22:06 | [maml_trainer] epoch #97 | Saved
2025-03-30 23:22:06 | [maml_trainer] epoch #97 | Time 119627.70 s
2025-03-30 23:22:06 | [maml_trainer] epoch #97 | EpochTime 1206.17 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.0911
Average/AverageReturn                              -59.2275
Average/Iteration                                   97
Average/MaxReturn                                  -48.5314
Average/MinReturn                                  -72.8643
Average/NumEpisodes                                 80
Average/StdReturn                                    5.03644
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0043
GaussianMLPPolicy/KLAfter                            0.00483779
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.59798e-05
GaussianMLPPolicy/LossBefore                         0
GaussianMLPPolicy/dLoss                              3.59798e-05
Iteration                                           97
MetaTest/Average/AverageDiscountedReturn           -57.8807
MetaTest/Average/AverageReturn                     -57.8807
MetaTest/Average/Iteration                          97
MetaTest/Average/MaxReturn                         -49.1117
MetaTest/Average/MinReturn                         -65.6147
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.56347
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.8807
MetaTest/__unnamed_task__/AverageReturn            -57.8807
MetaTest/__unnamed_task__/Iteration                 97
MetaTest/__unnamed_task__/MaxReturn                -49.1117
MetaTest/__unnamed_task__/MinReturn                -65.6147
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.56347
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.136e+06
__unnamed_task__/AverageDiscountedReturn           -33.0911
__unnamed_task__/AverageReturn                     -59.2275
__unnamed_task__/Iteration                          97
__unnamed_task__/MaxReturn                         -48.5314
__unnamed_task__/MinReturn                         -72.8643
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.03644
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 23:38:09 | [maml_trainer] epoch #98 | Sampling for adapation and meta-testing...
2025-03-30 23:42:07 | [maml_trainer] epoch #98 | Finished meta-testing...
2025-03-30 23:42:08 | [maml_trainer] epoch #98 | Saving snapshot...
2025-03-30 23:42:28 | [maml_trainer] epoch #98 | Saved
2025-03-30 23:42:28 | [maml_trainer] epoch #98 | Time 120849.37 s
2025-03-30 23:42:28 | [maml_trainer] epoch #98 | EpochTime 1221.66 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.6942
Average/AverageReturn                              -60.415
Average/Iteration                                   98
Average/MaxReturn                                  -50.8753
Average/MinReturn                                  -76.603
Average/NumEpisodes                                 80
Average/StdReturn                                    5.45924
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0029
GaussianMLPPolicy/KLAfter                            0.0037817
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.85218e-05
GaussianMLPPolicy/LossBefore                         4.23193e-09
GaussianMLPPolicy/dLoss                              4.85261e-05
Iteration                                           98
MetaTest/Average/AverageDiscountedReturn           -59.0688
MetaTest/Average/AverageReturn                     -59.0688
MetaTest/Average/Iteration                          98
MetaTest/Average/MaxReturn                         -50.1187
MetaTest/Average/MinReturn                         -64.8993
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.89567
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -59.0688
MetaTest/__unnamed_task__/AverageReturn            -59.0688
MetaTest/__unnamed_task__/Iteration                 98
MetaTest/__unnamed_task__/MaxReturn                -50.1187
MetaTest/__unnamed_task__/MinReturn                -64.8993
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.89567
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.168e+06
__unnamed_task__/AverageDiscountedReturn           -33.6942
__unnamed_task__/AverageReturn                     -60.415
__unnamed_task__/Iteration                          98
__unnamed_task__/MaxReturn                         -50.8753
__unnamed_task__/MinReturn                         -76.603
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.45924
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-30 23:58:42 | [maml_trainer] epoch #99 | Sampling for adapation and meta-testing...
2025-03-31 00:02:33 | [maml_trainer] epoch #99 | Finished meta-testing...
2025-03-31 00:02:33 | [maml_trainer] epoch #99 | Saving snapshot...
2025-03-31 00:02:53 | [maml_trainer] epoch #99 | Saved
2025-03-31 00:02:53 | [maml_trainer] epoch #99 | Time 122074.16 s
2025-03-31 00:02:53 | [maml_trainer] epoch #99 | EpochTime 1224.79 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.9079
Average/AverageReturn                              -61.1038
Average/Iteration                                   99
Average/MaxReturn                                  -50.614
Average/MinReturn                                  -76.679
Average/NumEpisodes                                 80
Average/StdReturn                                    5.61037
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.001
GaussianMLPPolicy/KLAfter                            0.0040729
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000158534
GaussianMLPPolicy/LossBefore                        -1.72853e-09
GaussianMLPPolicy/dLoss                             -0.000158536
Iteration                                           99
MetaTest/Average/AverageDiscountedReturn           -59.9088
MetaTest/Average/AverageReturn                     -59.9088
MetaTest/Average/Iteration                          99
MetaTest/Average/MaxReturn                         -51.1586
MetaTest/Average/MinReturn                         -72.7763
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.80584
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -59.9088
MetaTest/__unnamed_task__/AverageReturn            -59.9088
MetaTest/__unnamed_task__/Iteration                 99
MetaTest/__unnamed_task__/MaxReturn                -51.1586
MetaTest/__unnamed_task__/MinReturn                -72.7763
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.80584
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.2e+06
__unnamed_task__/AverageDiscountedReturn           -33.9079
__unnamed_task__/AverageReturn                     -61.1038
__unnamed_task__/Iteration                          99
__unnamed_task__/MaxReturn                         -50.614
__unnamed_task__/MinReturn                         -76.679
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.61037
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 00:18:04 | [maml_trainer] epoch #100 | Sampling for adapation and meta-testing...
2025-03-31 00:21:56 | [maml_trainer] epoch #100 | Finished meta-testing...
2025-03-31 00:21:56 | [maml_trainer] epoch #100 | Saving snapshot...
2025-03-31 00:22:15 | [maml_trainer] epoch #100 | Saved
2025-03-31 00:22:15 | [maml_trainer] epoch #100 | Time 123236.83 s
2025-03-31 00:22:15 | [maml_trainer] epoch #100 | EpochTime 1162.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.7014
Average/AverageReturn                              -60.8137
Average/Iteration                                  100
Average/MaxReturn                                  -49.4321
Average/MinReturn                                  -76.0383
Average/NumEpisodes                                 80
Average/StdReturn                                    5.41829
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99951
GaussianMLPPolicy/KLAfter                            0.0027839
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.63873e-06
GaussianMLPPolicy/LossBefore                         6.49691e-09
GaussianMLPPolicy/dLoss                             -4.63223e-06
Iteration                                          100
MetaTest/Average/AverageDiscountedReturn           -62.2424
MetaTest/Average/AverageReturn                     -62.2424
MetaTest/Average/Iteration                         100
MetaTest/Average/MaxReturn                         -51.9816
MetaTest/Average/MinReturn                         -78.5556
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.71901
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -62.2424
MetaTest/__unnamed_task__/AverageReturn            -62.2424
MetaTest/__unnamed_task__/Iteration                100
MetaTest/__unnamed_task__/MaxReturn                -51.9816
MetaTest/__unnamed_task__/MinReturn                -78.5556
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.71901
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.232e+06
__unnamed_task__/AverageDiscountedReturn           -33.7014
__unnamed_task__/AverageReturn                     -60.8137
__unnamed_task__/Iteration                         100
__unnamed_task__/MaxReturn                         -49.4321
__unnamed_task__/MinReturn                         -76.0383
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.41829
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 00:38:15 | [maml_trainer] epoch #101 | Sampling for adapation and meta-testing...
2025-03-31 00:42:12 | [maml_trainer] epoch #101 | Finished meta-testing...
2025-03-31 00:42:12 | [maml_trainer] epoch #101 | Saving snapshot...
2025-03-31 00:42:33 | [maml_trainer] epoch #101 | Saved
2025-03-31 00:42:33 | [maml_trainer] epoch #101 | Time 124454.50 s
2025-03-31 00:42:33 | [maml_trainer] epoch #101 | EpochTime 1217.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.6795
Average/AverageReturn                              -60.5684
Average/Iteration                                  101
Average/MaxReturn                                  -48.6668
Average/MinReturn                                  -74.9351
Average/NumEpisodes                                 80
Average/StdReturn                                    5.4781
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99819
GaussianMLPPolicy/KLAfter                            0.00214203
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.73421e-05
GaussianMLPPolicy/LossBefore                         2.5332e-09
GaussianMLPPolicy/dLoss                             -5.73396e-05
Iteration                                          101
MetaTest/Average/AverageDiscountedReturn           -59.163
MetaTest/Average/AverageReturn                     -59.163
MetaTest/Average/Iteration                         101
MetaTest/Average/MaxReturn                         -50.0384
MetaTest/Average/MinReturn                         -68.7049
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.33282
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -59.163
MetaTest/__unnamed_task__/AverageReturn            -59.163
MetaTest/__unnamed_task__/Iteration                101
MetaTest/__unnamed_task__/MaxReturn                -50.0384
MetaTest/__unnamed_task__/MinReturn                -68.7049
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.33282
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.264e+06
__unnamed_task__/AverageDiscountedReturn           -33.6795
__unnamed_task__/AverageReturn                     -60.5684
__unnamed_task__/Iteration                         101
__unnamed_task__/MaxReturn                         -48.6668
__unnamed_task__/MinReturn                         -74.9351
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.4781
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 00:58:31 | [maml_trainer] epoch #102 | Sampling for adapation and meta-testing...
2025-03-31 01:02:34 | [maml_trainer] epoch #102 | Finished meta-testing...
2025-03-31 01:02:34 | [maml_trainer] epoch #102 | Saving snapshot...
2025-03-31 01:02:56 | [maml_trainer] epoch #102 | Saved
2025-03-31 01:02:56 | [maml_trainer] epoch #102 | Time 125677.06 s
2025-03-31 01:02:56 | [maml_trainer] epoch #102 | EpochTime 1222.55 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.6925
Average/AverageReturn                              -60.7592
Average/Iteration                                  102
Average/MaxReturn                                  -46.1892
Average/MinReturn                                  -77.4712
Average/NumEpisodes                                 80
Average/StdReturn                                    5.52341
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99641
GaussianMLPPolicy/KLAfter                            0.00254313
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.2582e-05
GaussianMLPPolicy/LossBefore                        -1.72853e-09
GaussianMLPPolicy/dLoss                              5.25803e-05
Iteration                                          102
MetaTest/Average/AverageDiscountedReturn           -61.0978
MetaTest/Average/AverageReturn                     -61.0978
MetaTest/Average/Iteration                         102
MetaTest/Average/MaxReturn                         -51.6704
MetaTest/Average/MinReturn                         -71.5775
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.50088
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.0978
MetaTest/__unnamed_task__/AverageReturn            -61.0978
MetaTest/__unnamed_task__/Iteration                102
MetaTest/__unnamed_task__/MaxReturn                -51.6704
MetaTest/__unnamed_task__/MinReturn                -71.5775
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.50088
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.296e+06
__unnamed_task__/AverageDiscountedReturn           -33.6925
__unnamed_task__/AverageReturn                     -60.7592
__unnamed_task__/Iteration                         102
__unnamed_task__/MaxReturn                         -46.1892
__unnamed_task__/MinReturn                         -77.4712
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.52341
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 01:19:10 | [maml_trainer] epoch #103 | Sampling for adapation and meta-testing...
2025-03-31 01:23:09 | [maml_trainer] epoch #103 | Finished meta-testing...
2025-03-31 01:23:09 | [maml_trainer] epoch #103 | Saving snapshot...
2025-03-31 01:23:30 | [maml_trainer] epoch #103 | Saved
2025-03-31 01:23:30 | [maml_trainer] epoch #103 | Time 126911.90 s
2025-03-31 01:23:30 | [maml_trainer] epoch #103 | EpochTime 1234.83 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.0613
Average/AverageReturn                              -59.7481
Average/Iteration                                  103
Average/MaxReturn                                  -48.1886
Average/MinReturn                                  -77.2302
Average/NumEpisodes                                 80
Average/StdReturn                                    6.32568
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99645
GaussianMLPPolicy/KLAfter                            0.00234109
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.45281e-07
GaussianMLPPolicy/LossBefore                        -6.07967e-09
GaussianMLPPolicy/dLoss                              8.39201e-07
Iteration                                          103
MetaTest/Average/AverageDiscountedReturn           -57.9208
MetaTest/Average/AverageReturn                     -57.9208
MetaTest/Average/Iteration                         103
MetaTest/Average/MaxReturn                         -48.9487
MetaTest/Average/MinReturn                         -79.785
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.54186
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.9208
MetaTest/__unnamed_task__/AverageReturn            -57.9208
MetaTest/__unnamed_task__/Iteration                103
MetaTest/__unnamed_task__/MaxReturn                -48.9487
MetaTest/__unnamed_task__/MinReturn                -79.785
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.54186
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.328e+06
__unnamed_task__/AverageDiscountedReturn           -33.0613
__unnamed_task__/AverageReturn                     -59.7481
__unnamed_task__/Iteration                         103
__unnamed_task__/MaxReturn                         -48.1886
__unnamed_task__/MinReturn                         -77.2302
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.32568
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 01:39:40 | [maml_trainer] epoch #104 | Sampling for adapation and meta-testing...
2025-03-31 01:43:32 | [maml_trainer] epoch #104 | Finished meta-testing...
2025-03-31 01:43:32 | [maml_trainer] epoch #104 | Saving snapshot...
2025-03-31 01:43:51 | [maml_trainer] epoch #104 | Saved
2025-03-31 01:43:51 | [maml_trainer] epoch #104 | Time 128133.00 s
2025-03-31 01:43:51 | [maml_trainer] epoch #104 | EpochTime 1221.10 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -33.3618
Average/AverageReturn                              -60.6831
Average/Iteration                                  104
Average/MaxReturn                                  -47.5005
Average/MinReturn                                  -75.635
Average/NumEpisodes                                 80
Average/StdReturn                                    5.7912
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99726
GaussianMLPPolicy/KLAfter                            0.00338631
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.13871e-05
GaussianMLPPolicy/LossBefore                        -1.96695e-09
GaussianMLPPolicy/dLoss                             -7.1389e-05
Iteration                                          104
MetaTest/Average/AverageDiscountedReturn           -57.6292
MetaTest/Average/AverageReturn                     -57.6292
MetaTest/Average/Iteration                         104
MetaTest/Average/MaxReturn                         -49.3253
MetaTest/Average/MinReturn                         -68.7617
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.08416
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.6292
MetaTest/__unnamed_task__/AverageReturn            -57.6292
MetaTest/__unnamed_task__/Iteration                104
MetaTest/__unnamed_task__/MaxReturn                -49.3253
MetaTest/__unnamed_task__/MinReturn                -68.7617
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.08416
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.36e+06
__unnamed_task__/AverageDiscountedReturn           -33.3618
__unnamed_task__/AverageReturn                     -60.6831
__unnamed_task__/Iteration                         104
__unnamed_task__/MaxReturn                         -47.5005
__unnamed_task__/MinReturn                         -75.635
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.7912
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 01:59:16 | [maml_trainer] epoch #105 | Sampling for adapation and meta-testing...
2025-03-31 02:03:07 | [maml_trainer] epoch #105 | Finished meta-testing...
2025-03-31 02:03:07 | [maml_trainer] epoch #105 | Saving snapshot...
2025-03-31 02:03:27 | [maml_trainer] epoch #105 | Saved
2025-03-31 02:03:27 | [maml_trainer] epoch #105 | Time 129308.66 s
2025-03-31 02:03:27 | [maml_trainer] epoch #105 | EpochTime 1175.65 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.7144
Average/AverageReturn                              -58.7893
Average/Iteration                                  105
Average/MaxReturn                                  -49.3036
Average/MinReturn                                  -77.1573
Average/NumEpisodes                                 80
Average/StdReturn                                    5.50073
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99846
GaussianMLPPolicy/KLAfter                            0.00363071
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.67721e-05
GaussianMLPPolicy/LossBefore                         3.93391e-09
GaussianMLPPolicy/dLoss                             -5.67682e-05
Iteration                                          105
MetaTest/Average/AverageDiscountedReturn           -60.7138
MetaTest/Average/AverageReturn                     -60.7138
MetaTest/Average/Iteration                         105
MetaTest/Average/MaxReturn                         -47.9613
MetaTest/Average/MinReturn                         -77.3246
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.45983
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -60.7138
MetaTest/__unnamed_task__/AverageReturn            -60.7138
MetaTest/__unnamed_task__/Iteration                105
MetaTest/__unnamed_task__/MaxReturn                -47.9613
MetaTest/__unnamed_task__/MinReturn                -77.3246
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.45983
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.392e+06
__unnamed_task__/AverageDiscountedReturn           -32.7144
__unnamed_task__/AverageReturn                     -58.7893
__unnamed_task__/Iteration                         105
__unnamed_task__/MaxReturn                         -49.3036
__unnamed_task__/MinReturn                         -77.1573
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.50073
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 02:18:52 | [maml_trainer] epoch #106 | Sampling for adapation and meta-testing...
2025-03-31 02:22:41 | [maml_trainer] epoch #106 | Finished meta-testing...
2025-03-31 02:22:41 | [maml_trainer] epoch #106 | Saving snapshot...
2025-03-31 02:23:01 | [maml_trainer] epoch #106 | Saved
2025-03-31 02:23:01 | [maml_trainer] epoch #106 | Time 130483.00 s
2025-03-31 02:23:01 | [maml_trainer] epoch #106 | EpochTime 1174.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.4919
Average/AverageReturn                              -58.6453
Average/Iteration                                  106
Average/MaxReturn                                  -48.7291
Average/MinReturn                                  -73.511
Average/NumEpisodes                                 80
Average/StdReturn                                    4.95747
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99918
GaussianMLPPolicy/KLAfter                            0.00362975
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.46854e-05
GaussianMLPPolicy/LossBefore                         2.98024e-11
GaussianMLPPolicy/dLoss                              3.46854e-05
Iteration                                          106
MetaTest/Average/AverageDiscountedReturn           -56.691
MetaTest/Average/AverageReturn                     -56.691
MetaTest/Average/Iteration                         106
MetaTest/Average/MaxReturn                         -44.8234
MetaTest/Average/MinReturn                         -68.2875
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.63638
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.691
MetaTest/__unnamed_task__/AverageReturn            -56.691
MetaTest/__unnamed_task__/Iteration                106
MetaTest/__unnamed_task__/MaxReturn                -44.8234
MetaTest/__unnamed_task__/MinReturn                -68.2875
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.63638
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.424e+06
__unnamed_task__/AverageDiscountedReturn           -32.4919
__unnamed_task__/AverageReturn                     -58.6453
__unnamed_task__/Iteration                         106
__unnamed_task__/MaxReturn                         -48.7291
__unnamed_task__/MinReturn                         -73.511
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.95747
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 02:38:29 | [maml_trainer] epoch #107 | Sampling for adapation and meta-testing...
2025-03-31 02:42:23 | [maml_trainer] epoch #107 | Finished meta-testing...
2025-03-31 02:42:23 | [maml_trainer] epoch #107 | Saving snapshot...
2025-03-31 02:42:44 | [maml_trainer] epoch #107 | Saved
2025-03-31 02:42:44 | [maml_trainer] epoch #107 | Time 131665.65 s
2025-03-31 02:42:44 | [maml_trainer] epoch #107 | EpochTime 1182.64 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -31.8945
Average/AverageReturn                              -57.9532
Average/Iteration                                  107
Average/MaxReturn                                  -48.7458
Average/MinReturn                                  -75.8799
Average/NumEpisodes                                 80
Average/StdReturn                                    5.66345
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99966
GaussianMLPPolicy/KLAfter                            0.0038089
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.00098e-05
GaussianMLPPolicy/LossBefore                         4.70877e-09
GaussianMLPPolicy/dLoss                              9.00145e-05
Iteration                                          107
MetaTest/Average/AverageDiscountedReturn           -57.0124
MetaTest/Average/AverageReturn                     -57.0124
MetaTest/Average/Iteration                         107
MetaTest/Average/MaxReturn                         -50.181
MetaTest/Average/MinReturn                         -65.6047
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.42772
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.0124
MetaTest/__unnamed_task__/AverageReturn            -57.0124
MetaTest/__unnamed_task__/Iteration                107
MetaTest/__unnamed_task__/MaxReturn                -50.181
MetaTest/__unnamed_task__/MinReturn                -65.6047
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.42772
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.456e+06
__unnamed_task__/AverageDiscountedReturn           -31.8945
__unnamed_task__/AverageReturn                     -57.9532
__unnamed_task__/Iteration                         107
__unnamed_task__/MaxReturn                         -48.7458
__unnamed_task__/MinReturn                         -75.8799
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.66345
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 02:58:14 | [maml_trainer] epoch #108 | Sampling for adapation and meta-testing...
2025-03-31 03:02:06 | [maml_trainer] epoch #108 | Finished meta-testing...
2025-03-31 03:02:06 | [maml_trainer] epoch #108 | Saving snapshot...
2025-03-31 03:02:25 | [maml_trainer] epoch #108 | Saved
2025-03-31 03:02:25 | [maml_trainer] epoch #108 | Time 132846.72 s
2025-03-31 03:02:25 | [maml_trainer] epoch #108 | EpochTime 1181.07 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -32.2743
Average/AverageReturn                              -58.7632
Average/Iteration                                  108
Average/MaxReturn                                  -47.9669
Average/MinReturn                                  -70.3042
Average/NumEpisodes                                 80
Average/StdReturn                                    5.7748
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99863
GaussianMLPPolicy/KLAfter                            0.00312719
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.40975e-05
GaussianMLPPolicy/LossBefore                         8.16584e-09
GaussianMLPPolicy/dLoss                              2.41056e-05
Iteration                                          108
MetaTest/Average/AverageDiscountedReturn           -57.2583
MetaTest/Average/AverageReturn                     -57.2583
MetaTest/Average/Iteration                         108
MetaTest/Average/MaxReturn                         -49.4222
MetaTest/Average/MinReturn                         -68.2349
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.71808
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.2583
MetaTest/__unnamed_task__/AverageReturn            -57.2583
MetaTest/__unnamed_task__/Iteration                108
MetaTest/__unnamed_task__/MaxReturn                -49.4222
MetaTest/__unnamed_task__/MinReturn                -68.2349
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.71808
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.488e+06
__unnamed_task__/AverageDiscountedReturn           -32.2743
__unnamed_task__/AverageReturn                     -58.7632
__unnamed_task__/Iteration                         108
__unnamed_task__/MaxReturn                         -47.9669
__unnamed_task__/MinReturn                         -70.3042
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.7748
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 03:18:00 | [maml_trainer] epoch #109 | Sampling for adapation and meta-testing...
2025-03-31 03:21:52 | [maml_trainer] epoch #109 | Finished meta-testing...
2025-03-31 03:21:52 | [maml_trainer] epoch #109 | Saving snapshot...
2025-03-31 03:22:11 | [maml_trainer] epoch #109 | Saved
2025-03-31 03:22:11 | [maml_trainer] epoch #109 | Time 134032.59 s
2025-03-31 03:22:11 | [maml_trainer] epoch #109 | EpochTime 1185.87 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -31.3909
Average/AverageReturn                              -56.6542
Average/Iteration                                  109
Average/MaxReturn                                  -45.8041
Average/MinReturn                                  -73.5472
Average/NumEpisodes                                 80
Average/StdReturn                                    5.93844
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9977
GaussianMLPPolicy/KLAfter                            0.00314899
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.11373e-06
GaussianMLPPolicy/LossBefore                         6.25849e-09
GaussianMLPPolicy/dLoss                             -2.10747e-06
Iteration                                          109
MetaTest/Average/AverageDiscountedReturn           -57.7754
MetaTest/Average/AverageReturn                     -57.7754
MetaTest/Average/Iteration                         109
MetaTest/Average/MaxReturn                         -49.0403
MetaTest/Average/MinReturn                         -73.6763
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.07114
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.7754
MetaTest/__unnamed_task__/AverageReturn            -57.7754
MetaTest/__unnamed_task__/Iteration                109
MetaTest/__unnamed_task__/MaxReturn                -49.0403
MetaTest/__unnamed_task__/MinReturn                -73.6763
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.07114
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.52e+06
__unnamed_task__/AverageDiscountedReturn           -31.3909
__unnamed_task__/AverageReturn                     -56.6542
__unnamed_task__/Iteration                         109
__unnamed_task__/MaxReturn                         -45.8041
__unnamed_task__/MinReturn                         -73.5472
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.93844
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 03:37:42 | [maml_trainer] epoch #110 | Sampling for adapation and meta-testing...
2025-03-31 03:41:35 | [maml_trainer] epoch #110 | Finished meta-testing...
2025-03-31 03:41:35 | [maml_trainer] epoch #110 | Saving snapshot...
2025-03-31 03:41:55 | [maml_trainer] epoch #110 | Saved
2025-03-31 03:41:55 | [maml_trainer] epoch #110 | Time 135216.42 s
2025-03-31 03:41:55 | [maml_trainer] epoch #110 | EpochTime 1183.83 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -31.103
Average/AverageReturn                              -56.0484
Average/Iteration                                  110
Average/MaxReturn                                  -43.023
Average/MinReturn                                  -74.3782
Average/NumEpisodes                                 80
Average/StdReturn                                    5.57314
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9959
GaussianMLPPolicy/KLAfter                            0.00304184
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.53524e-06
GaussianMLPPolicy/LossBefore                        -6.85453e-09
GaussianMLPPolicy/dLoss                             -5.5421e-06
Iteration                                          110
MetaTest/Average/AverageDiscountedReturn           -55.1345
MetaTest/Average/AverageReturn                     -55.1345
MetaTest/Average/Iteration                         110
MetaTest/Average/MaxReturn                         -47.1278
MetaTest/Average/MinReturn                         -67.7522
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.33502
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.1345
MetaTest/__unnamed_task__/AverageReturn            -55.1345
MetaTest/__unnamed_task__/Iteration                110
MetaTest/__unnamed_task__/MaxReturn                -47.1278
MetaTest/__unnamed_task__/MinReturn                -67.7522
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.33502
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.552e+06
__unnamed_task__/AverageDiscountedReturn           -31.103
__unnamed_task__/AverageReturn                     -56.0484
__unnamed_task__/Iteration                         110
__unnamed_task__/MaxReturn                         -43.023
__unnamed_task__/MinReturn                         -74.3782
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.57314
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 03:57:30 | [maml_trainer] epoch #111 | Sampling for adapation and meta-testing...
2025-03-31 04:01:23 | [maml_trainer] epoch #111 | Finished meta-testing...
2025-03-31 04:01:23 | [maml_trainer] epoch #111 | Saving snapshot...
2025-03-31 04:01:43 | [maml_trainer] epoch #111 | Saved
2025-03-31 04:01:43 | [maml_trainer] epoch #111 | Time 136404.74 s
2025-03-31 04:01:43 | [maml_trainer] epoch #111 | EpochTime 1188.32 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -31.3798
Average/AverageReturn                              -56.8278
Average/Iteration                                  111
Average/MaxReturn                                  -47.2578
Average/MinReturn                                  -69.5726
Average/NumEpisodes                                 80
Average/StdReturn                                    5.73885
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99379
GaussianMLPPolicy/KLAfter                            0.00226838
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.06611e-06
GaussianMLPPolicy/LossBefore                        -1.51992e-09
GaussianMLPPolicy/dLoss                              4.06459e-06
Iteration                                          111
MetaTest/Average/AverageDiscountedReturn           -57.166
MetaTest/Average/AverageReturn                     -57.166
MetaTest/Average/Iteration                         111
MetaTest/Average/MaxReturn                         -48.72
MetaTest/Average/MinReturn                         -65.9552
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.64011
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.166
MetaTest/__unnamed_task__/AverageReturn            -57.166
MetaTest/__unnamed_task__/Iteration                111
MetaTest/__unnamed_task__/MaxReturn                -48.72
MetaTest/__unnamed_task__/MinReturn                -65.9552
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.64011
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.584e+06
__unnamed_task__/AverageDiscountedReturn           -31.3798
__unnamed_task__/AverageReturn                     -56.8278
__unnamed_task__/Iteration                         111
__unnamed_task__/MaxReturn                         -47.2578
__unnamed_task__/MinReturn                         -69.5726
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.73885
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 04:17:21 | [maml_trainer] epoch #112 | Sampling for adapation and meta-testing...
2025-03-31 04:21:14 | [maml_trainer] epoch #112 | Finished meta-testing...
2025-03-31 04:21:14 | [maml_trainer] epoch #112 | Saving snapshot...
2025-03-31 04:21:34 | [maml_trainer] epoch #112 | Saved
2025-03-31 04:21:34 | [maml_trainer] epoch #112 | Time 137595.68 s
2025-03-31 04:21:34 | [maml_trainer] epoch #112 | EpochTime 1190.93 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -31.2815
Average/AverageReturn                              -56.7889
Average/Iteration                                  112
Average/MaxReturn                                  -47.3338
Average/MinReturn                                  -76.186
Average/NumEpisodes                                 80
Average/StdReturn                                    5.92595
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99141
GaussianMLPPolicy/KLAfter                            0.00244361
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.29131e-05
GaussianMLPPolicy/LossBefore                         3.57628e-10
GaussianMLPPolicy/dLoss                             -3.29127e-05
Iteration                                          112
MetaTest/Average/AverageDiscountedReturn           -56.3317
MetaTest/Average/AverageReturn                     -56.3317
MetaTest/Average/Iteration                         112
MetaTest/Average/MaxReturn                         -45.6918
MetaTest/Average/MinReturn                         -65.58
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.02312
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.3317
MetaTest/__unnamed_task__/AverageReturn            -56.3317
MetaTest/__unnamed_task__/Iteration                112
MetaTest/__unnamed_task__/MaxReturn                -45.6918
MetaTest/__unnamed_task__/MinReturn                -65.58
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.02312
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.616e+06
__unnamed_task__/AverageDiscountedReturn           -31.2815
__unnamed_task__/AverageReturn                     -56.7889
__unnamed_task__/Iteration                         112
__unnamed_task__/MaxReturn                         -47.3338
__unnamed_task__/MinReturn                         -76.186
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.92595
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 04:37:13 | [maml_trainer] epoch #113 | Sampling for adapation and meta-testing...
2025-03-31 04:41:08 | [maml_trainer] epoch #113 | Finished meta-testing...
2025-03-31 04:41:08 | [maml_trainer] epoch #113 | Saving snapshot...
2025-03-31 04:41:27 | [maml_trainer] epoch #113 | Saved
2025-03-31 04:41:27 | [maml_trainer] epoch #113 | Time 138788.82 s
2025-03-31 04:41:27 | [maml_trainer] epoch #113 | EpochTime 1193.13 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.8106
Average/AverageReturn                              -55.3793
Average/Iteration                                  113
Average/MaxReturn                                  -44.0285
Average/MinReturn                                  -71.7904
Average/NumEpisodes                                 80
Average/StdReturn                                    5.92676
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98803
GaussianMLPPolicy/KLAfter                            0.00255879
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000179373
GaussianMLPPolicy/LossBefore                        -6.67572e-09
GaussianMLPPolicy/dLoss                              0.000179366
Iteration                                          113
MetaTest/Average/AverageDiscountedReturn           -58.6012
MetaTest/Average/AverageReturn                     -58.6012
MetaTest/Average/Iteration                         113
MetaTest/Average/MaxReturn                         -45.9849
MetaTest/Average/MinReturn                         -96.561
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.3492
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -58.6012
MetaTest/__unnamed_task__/AverageReturn            -58.6012
MetaTest/__unnamed_task__/Iteration                113
MetaTest/__unnamed_task__/MaxReturn                -45.9849
MetaTest/__unnamed_task__/MinReturn                -96.561
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.3492
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.648e+06
__unnamed_task__/AverageDiscountedReturn           -30.8106
__unnamed_task__/AverageReturn                     -55.3793
__unnamed_task__/Iteration                         113
__unnamed_task__/MaxReturn                         -44.0285
__unnamed_task__/MinReturn                         -71.7904
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.92676
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 04:57:02 | [maml_trainer] epoch #114 | Sampling for adapation and meta-testing...
2025-03-31 05:00:56 | [maml_trainer] epoch #114 | Finished meta-testing...
2025-03-31 05:00:56 | [maml_trainer] epoch #114 | Saving snapshot...
2025-03-31 05:01:16 | [maml_trainer] epoch #114 | Saved
2025-03-31 05:01:16 | [maml_trainer] epoch #114 | Time 139977.50 s
2025-03-31 05:01:16 | [maml_trainer] epoch #114 | EpochTime 1188.68 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.4744
Average/AverageReturn                              -55.0577
Average/Iteration                                  114
Average/MaxReturn                                  -44.668
Average/MinReturn                                  -68.4873
Average/NumEpisodes                                 80
Average/StdReturn                                    5.86901
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98661
GaussianMLPPolicy/KLAfter                            0.00389353
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000125983
GaussianMLPPolicy/LossBefore                        -3.75509e-09
GaussianMLPPolicy/dLoss                              0.000125979
Iteration                                          114
MetaTest/Average/AverageDiscountedReturn           -53.3399
MetaTest/Average/AverageReturn                     -53.3399
MetaTest/Average/Iteration                         114
MetaTest/Average/MaxReturn                         -43.7244
MetaTest/Average/MinReturn                         -64.2744
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.00237
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -53.3399
MetaTest/__unnamed_task__/AverageReturn            -53.3399
MetaTest/__unnamed_task__/Iteration                114
MetaTest/__unnamed_task__/MaxReturn                -43.7244
MetaTest/__unnamed_task__/MinReturn                -64.2744
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.00237
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.68e+06
__unnamed_task__/AverageDiscountedReturn           -30.4744
__unnamed_task__/AverageReturn                     -55.0577
__unnamed_task__/Iteration                         114
__unnamed_task__/MaxReturn                         -44.668
__unnamed_task__/MinReturn                         -68.4873
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.86901
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 05:16:47 | [maml_trainer] epoch #115 | Sampling for adapation and meta-testing...
2025-03-31 05:20:39 | [maml_trainer] epoch #115 | Finished meta-testing...
2025-03-31 05:20:39 | [maml_trainer] epoch #115 | Saving snapshot...
2025-03-31 05:20:59 | [maml_trainer] epoch #115 | Saved
2025-03-31 05:20:59 | [maml_trainer] epoch #115 | Time 141161.00 s
2025-03-31 05:20:59 | [maml_trainer] epoch #115 | EpochTime 1183.49 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.8196
Average/AverageReturn                               -52.9255
Average/Iteration                                   115
Average/MaxReturn                                    -9.84989
Average/MinReturn                                   -88.7872
Average/NumEpisodes                                  80
Average/StdReturn                                     8.66277
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98554
GaussianMLPPolicy/KLAfter                             0.00332509
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000106326
GaussianMLPPolicy/LossBefore                         -7.89762e-09
GaussianMLPPolicy/dLoss                               0.000106318
Iteration                                           115
MetaTest/Average/AverageDiscountedReturn            -47.3155
MetaTest/Average/AverageReturn                      -47.3155
MetaTest/Average/Iteration                          115
MetaTest/Average/MaxReturn                          200.335
MetaTest/Average/MinReturn                         -140.043
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           61.4836
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.3155
MetaTest/__unnamed_task__/AverageReturn             -47.3155
MetaTest/__unnamed_task__/Iteration                 115
MetaTest/__unnamed_task__/MaxReturn                 200.335
MetaTest/__unnamed_task__/MinReturn                -140.043
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  61.4836
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.712e+06
__unnamed_task__/AverageDiscountedReturn            -29.8196
__unnamed_task__/AverageReturn                      -52.9255
__unnamed_task__/Iteration                          115
__unnamed_task__/MaxReturn                           -9.84989
__unnamed_task__/MinReturn                          -88.7872
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.66277
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 05:36:27 | [maml_trainer] epoch #116 | Sampling for adapation and meta-testing...
2025-03-31 05:40:20 | [maml_trainer] epoch #116 | Finished meta-testing...
2025-03-31 05:40:20 | [maml_trainer] epoch #116 | Saving snapshot...
2025-03-31 05:40:40 | [maml_trainer] epoch #116 | Saved
2025-03-31 05:40:40 | [maml_trainer] epoch #116 | Time 142341.95 s
2025-03-31 05:40:40 | [maml_trainer] epoch #116 | EpochTime 1180.95 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.8571
Average/AverageReturn                               -54.4146
Average/Iteration                                   116
Average/MaxReturn                                   -42.7041
Average/MinReturn                                  -105.429
Average/NumEpisodes                                  80
Average/StdReturn                                     9.3702
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98323
GaussianMLPPolicy/KLAfter                             0.00284398
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000100237
GaussianMLPPolicy/LossBefore                         -1.37091e-09
GaussianMLPPolicy/dLoss                               0.000100236
Iteration                                           116
MetaTest/Average/AverageDiscountedReturn            -58.2101
MetaTest/Average/AverageReturn                      -58.2101
MetaTest/Average/Iteration                          116
MetaTest/Average/MaxReturn                          -43.3344
MetaTest/Average/MinReturn                         -138.385
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           19.8702
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.2101
MetaTest/__unnamed_task__/AverageReturn             -58.2101
MetaTest/__unnamed_task__/Iteration                 116
MetaTest/__unnamed_task__/MaxReturn                 -43.3344
MetaTest/__unnamed_task__/MinReturn                -138.385
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  19.8702
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.744e+06
__unnamed_task__/AverageDiscountedReturn            -29.8571
__unnamed_task__/AverageReturn                      -54.4146
__unnamed_task__/Iteration                          116
__unnamed_task__/MaxReturn                          -42.7041
__unnamed_task__/MinReturn                         -105.429
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.3702
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 05:56:29 | [maml_trainer] epoch #117 | Sampling for adapation and meta-testing...
2025-03-31 06:00:29 | [maml_trainer] epoch #117 | Finished meta-testing...
2025-03-31 06:00:29 | [maml_trainer] epoch #117 | Saving snapshot...
2025-03-31 06:00:48 | [maml_trainer] epoch #117 | Saved
2025-03-31 06:00:48 | [maml_trainer] epoch #117 | Time 143549.91 s
2025-03-31 06:00:48 | [maml_trainer] epoch #117 | EpochTime 1207.96 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.1649
Average/AverageReturn                               -57.4228
Average/Iteration                                   117
Average/MaxReturn                                   -43.0728
Average/MinReturn                                  -136.417
Average/NumEpisodes                                  80
Average/StdReturn                                    15.7214
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98327
GaussianMLPPolicy/KLAfter                             0.00213764
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           0.000100912
GaussianMLPPolicy/LossBefore                         -2.74181e-09
GaussianMLPPolicy/dLoss                              -0.000100915
Iteration                                           117
MetaTest/Average/AverageDiscountedReturn            -59.3084
MetaTest/Average/AverageReturn                      -59.3084
MetaTest/Average/Iteration                          117
MetaTest/Average/MaxReturn                          -44.6451
MetaTest/Average/MinReturn                         -120.232
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           17.9727
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -59.3084
MetaTest/__unnamed_task__/AverageReturn             -59.3084
MetaTest/__unnamed_task__/Iteration                 117
MetaTest/__unnamed_task__/MaxReturn                 -44.6451
MetaTest/__unnamed_task__/MinReturn                -120.232
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  17.9727
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.776e+06
__unnamed_task__/AverageDiscountedReturn            -30.1649
__unnamed_task__/AverageReturn                      -57.4228
__unnamed_task__/Iteration                          117
__unnamed_task__/MaxReturn                          -43.0728
__unnamed_task__/MinReturn                         -136.417
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.7214
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 06:16:38 | [maml_trainer] epoch #118 | Sampling for adapation and meta-testing...
2025-03-31 06:20:34 | [maml_trainer] epoch #118 | Finished meta-testing...
2025-03-31 06:20:34 | [maml_trainer] epoch #118 | Saving snapshot...
2025-03-31 06:20:53 | [maml_trainer] epoch #118 | Saved
2025-03-31 06:20:53 | [maml_trainer] epoch #118 | Time 144754.93 s
2025-03-31 06:20:53 | [maml_trainer] epoch #118 | EpochTime 1205.01 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.2783
Average/AverageReturn                               -65.5746
Average/Iteration                                   118
Average/MaxReturn                                    -9.14816
Average/MinReturn                                  -169.065
Average/NumEpisodes                                  80
Average/StdReturn                                    28.3323
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98255
GaussianMLPPolicy/KLAfter                             0.00163972
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.08152e-05
GaussianMLPPolicy/LossBefore                          7.82311e-09
GaussianMLPPolicy/dLoss                              -2.08074e-05
Iteration                                           118
MetaTest/Average/AverageDiscountedReturn            -67.1822
MetaTest/Average/AverageReturn                      -67.1822
MetaTest/Average/Iteration                          118
MetaTest/Average/MaxReturn                          -42.3109
MetaTest/Average/MinReturn                         -147.828
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           29.8596
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -67.1822
MetaTest/__unnamed_task__/AverageReturn             -67.1822
MetaTest/__unnamed_task__/Iteration                 118
MetaTest/__unnamed_task__/MaxReturn                 -42.3109
MetaTest/__unnamed_task__/MinReturn                -147.828
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  29.8596
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.808e+06
__unnamed_task__/AverageDiscountedReturn            -31.2783
__unnamed_task__/AverageReturn                      -65.5746
__unnamed_task__/Iteration                          118
__unnamed_task__/MaxReturn                           -9.14816
__unnamed_task__/MinReturn                         -169.065
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           28.3323
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 06:36:37 | [maml_trainer] epoch #119 | Sampling for adapation and meta-testing...
2025-03-31 06:40:36 | [maml_trainer] epoch #119 | Finished meta-testing...
2025-03-31 06:40:36 | [maml_trainer] epoch #119 | Saving snapshot...
2025-03-31 06:40:57 | [maml_trainer] epoch #119 | Saved
2025-03-31 06:40:57 | [maml_trainer] epoch #119 | Time 145958.57 s
2025-03-31 06:40:57 | [maml_trainer] epoch #119 | EpochTime 1203.63 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.5451
Average/AverageReturn                               -59.5985
Average/Iteration                                   119
Average/MaxReturn                                   -43.8182
Average/MinReturn                                  -143.531
Average/NumEpisodes                                  80
Average/StdReturn                                    18.3729
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98174
GaussianMLPPolicy/KLAfter                             0.00139101
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.151e-06
GaussianMLPPolicy/LossBefore                          5.24521e-09
GaussianMLPPolicy/dLoss                               3.15624e-06
Iteration                                           119
MetaTest/Average/AverageDiscountedReturn            -69.2156
MetaTest/Average/AverageReturn                      -69.2156
MetaTest/Average/Iteration                          119
MetaTest/Average/MaxReturn                          -44.6082
MetaTest/Average/MinReturn                         -163.069
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           33.5967
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -69.2156
MetaTest/__unnamed_task__/AverageReturn             -69.2156
MetaTest/__unnamed_task__/Iteration                 119
MetaTest/__unnamed_task__/MaxReturn                 -44.6082
MetaTest/__unnamed_task__/MinReturn                -163.069
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  33.5967
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.84e+06
__unnamed_task__/AverageDiscountedReturn            -30.5451
__unnamed_task__/AverageReturn                      -59.5985
__unnamed_task__/Iteration                          119
__unnamed_task__/MaxReturn                          -43.8182
__unnamed_task__/MinReturn                         -143.531
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           18.3729
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 06:57:02 | [maml_trainer] epoch #120 | Sampling for adapation and meta-testing...
2025-03-31 07:01:00 | [maml_trainer] epoch #120 | Finished meta-testing...
2025-03-31 07:01:00 | [maml_trainer] epoch #120 | Saving snapshot...
2025-03-31 07:01:20 | [maml_trainer] epoch #120 | Saved
2025-03-31 07:01:20 | [maml_trainer] epoch #120 | Time 147181.67 s
2025-03-31 07:01:20 | [maml_trainer] epoch #120 | EpochTime 1223.10 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.3201
Average/AverageReturn                               -60.0864
Average/Iteration                                   120
Average/MaxReturn                                   220.486
Average/MinReturn                                  -166.273
Average/NumEpisodes                                  80
Average/StdReturn                                    41.6817
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98166
GaussianMLPPolicy/KLAfter                             0.00180094
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.00246e-05
GaussianMLPPolicy/LossBefore                          1.06543e-09
GaussianMLPPolicy/dLoss                               1.00257e-05
Iteration                                           120
MetaTest/Average/AverageDiscountedReturn            -80.3433
MetaTest/Average/AverageReturn                      -80.3433
MetaTest/Average/Iteration                          120
MetaTest/Average/MaxReturn                          -43.5447
MetaTest/Average/MinReturn                         -159.158
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           40.0463
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -80.3433
MetaTest/__unnamed_task__/AverageReturn             -80.3433
MetaTest/__unnamed_task__/Iteration                 120
MetaTest/__unnamed_task__/MaxReturn                 -43.5447
MetaTest/__unnamed_task__/MinReturn                -159.158
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  40.0463
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.872e+06
__unnamed_task__/AverageDiscountedReturn            -30.3201
__unnamed_task__/AverageReturn                      -60.0864
__unnamed_task__/Iteration                          120
__unnamed_task__/MaxReturn                          220.486
__unnamed_task__/MinReturn                         -166.273
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           41.6817
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 07:17:01 | [maml_trainer] epoch #121 | Sampling for adapation and meta-testing...
2025-03-31 07:20:53 | [maml_trainer] epoch #121 | Finished meta-testing...
2025-03-31 07:20:53 | [maml_trainer] epoch #121 | Saving snapshot...
2025-03-31 07:21:13 | [maml_trainer] epoch #121 | Saved
2025-03-31 07:21:13 | [maml_trainer] epoch #121 | Time 148374.95 s
2025-03-31 07:21:13 | [maml_trainer] epoch #121 | EpochTime 1193.28 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.7503
Average/AverageReturn                               -62.0271
Average/Iteration                                   121
Average/MaxReturn                                    14.9394
Average/MinReturn                                  -152.324
Average/NumEpisodes                                  80
Average/StdReturn                                    25.5698
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98162
GaussianMLPPolicy/KLAfter                             0.00118199
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.30071e-05
GaussianMLPPolicy/LossBefore                          4.96209e-09
GaussianMLPPolicy/dLoss                               5.30121e-05
Iteration                                           121
MetaTest/Average/AverageDiscountedReturn            -79.4441
MetaTest/Average/AverageReturn                      -79.4441
MetaTest/Average/Iteration                          121
MetaTest/Average/MaxReturn                          -43.5404
MetaTest/Average/MinReturn                         -163.342
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           46.2436
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -79.4441
MetaTest/__unnamed_task__/AverageReturn             -79.4441
MetaTest/__unnamed_task__/Iteration                 121
MetaTest/__unnamed_task__/MaxReturn                 -43.5404
MetaTest/__unnamed_task__/MinReturn                -163.342
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  46.2436
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.904e+06
__unnamed_task__/AverageDiscountedReturn            -30.7503
__unnamed_task__/AverageReturn                      -62.0271
__unnamed_task__/Iteration                          121
__unnamed_task__/MaxReturn                           14.9394
__unnamed_task__/MinReturn                         -152.324
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           25.5698
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 07:36:54 | [maml_trainer] epoch #122 | Sampling for adapation and meta-testing...
2025-03-31 07:40:50 | [maml_trainer] epoch #122 | Finished meta-testing...
2025-03-31 07:40:50 | [maml_trainer] epoch #122 | Saving snapshot...
2025-03-31 07:41:10 | [maml_trainer] epoch #122 | Saved
2025-03-31 07:41:10 | [maml_trainer] epoch #122 | Time 149571.02 s
2025-03-31 07:41:10 | [maml_trainer] epoch #122 | EpochTime 1196.07 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.7524
Average/AverageReturn                               -68.5954
Average/Iteration                                   122
Average/MaxReturn                                   -42.3746
Average/MinReturn                                  -167.514
Average/NumEpisodes                                  80
Average/StdReturn                                    31.5689
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.98069
GaussianMLPPolicy/KLAfter                             0.0015793
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -2.36951e-05
GaussianMLPPolicy/LossBefore                         -6.85453e-09
GaussianMLPPolicy/dLoss                               2.36883e-05
Iteration                                           122
MetaTest/Average/AverageDiscountedReturn            -56.7805
MetaTest/Average/AverageReturn                      -56.7805
MetaTest/Average/Iteration                          122
MetaTest/Average/MaxReturn                          -41.9141
MetaTest/Average/MinReturn                          -73.7327
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.83677
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.7805
MetaTest/__unnamed_task__/AverageReturn             -56.7805
MetaTest/__unnamed_task__/Iteration                 122
MetaTest/__unnamed_task__/MaxReturn                 -41.9141
MetaTest/__unnamed_task__/MinReturn                 -73.7327
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.83677
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.936e+06
__unnamed_task__/AverageDiscountedReturn            -31.7524
__unnamed_task__/AverageReturn                      -68.5954
__unnamed_task__/Iteration                          122
__unnamed_task__/MaxReturn                          -42.3746
__unnamed_task__/MinReturn                         -167.514
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           31.5689
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 07:57:07 | [maml_trainer] epoch #123 | Sampling for adapation and meta-testing...
2025-03-31 08:01:04 | [maml_trainer] epoch #123 | Finished meta-testing...
2025-03-31 08:01:04 | [maml_trainer] epoch #123 | Saving snapshot...
2025-03-31 08:01:25 | [maml_trainer] epoch #123 | Saved
2025-03-31 08:01:25 | [maml_trainer] epoch #123 | Time 150786.39 s
2025-03-31 08:01:25 | [maml_trainer] epoch #123 | EpochTime 1215.37 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.7952
Average/AverageReturn                               -61.9762
Average/Iteration                                   123
Average/MaxReturn                                   -42.2467
Average/MinReturn                                  -174.447
Average/NumEpisodes                                  80
Average/StdReturn                                    22.7125
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97981
GaussianMLPPolicy/KLAfter                             0.00134545
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.18604e-05
GaussianMLPPolicy/LossBefore                          5.2005e-09
GaussianMLPPolicy/dLoss                               3.18656e-05
Iteration                                           123
MetaTest/Average/AverageDiscountedReturn            -63.233
MetaTest/Average/AverageReturn                      -63.233
MetaTest/Average/Iteration                          123
MetaTest/Average/MaxReturn                          -48.0512
MetaTest/Average/MinReturn                         -138.286
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           21.5712
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -63.233
MetaTest/__unnamed_task__/AverageReturn             -63.233
MetaTest/__unnamed_task__/Iteration                 123
MetaTest/__unnamed_task__/MaxReturn                 -48.0512
MetaTest/__unnamed_task__/MinReturn                -138.286
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  21.5712
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         3.968e+06
__unnamed_task__/AverageDiscountedReturn            -30.7952
__unnamed_task__/AverageReturn                      -61.9762
__unnamed_task__/Iteration                          123
__unnamed_task__/MaxReturn                          -42.2467
__unnamed_task__/MinReturn                         -174.447
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           22.7125
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 08:17:01 | [maml_trainer] epoch #124 | Sampling for adapation and meta-testing...
2025-03-31 08:20:57 | [maml_trainer] epoch #124 | Finished meta-testing...
2025-03-31 08:20:57 | [maml_trainer] epoch #124 | Saving snapshot...
2025-03-31 08:21:18 | [maml_trainer] epoch #124 | Saved
2025-03-31 08:21:18 | [maml_trainer] epoch #124 | Time 151979.17 s
2025-03-31 08:21:18 | [maml_trainer] epoch #124 | EpochTime 1192.78 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.0511
Average/AverageReturn                               -61.9413
Average/Iteration                                   124
Average/MaxReturn                                   -45.5598
Average/MinReturn                                  -144.409
Average/NumEpisodes                                  80
Average/StdReturn                                    20.9883
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97966
GaussianMLPPolicy/KLAfter                             0.00108865
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.22206e-05
GaussianMLPPolicy/LossBefore                          3.57628e-09
GaussianMLPPolicy/dLoss                               9.22241e-05
Iteration                                           124
MetaTest/Average/AverageDiscountedReturn            -54.9094
MetaTest/Average/AverageReturn                      -54.9094
MetaTest/Average/Iteration                          124
MetaTest/Average/MaxReturn                          -42.3374
MetaTest/Average/MinReturn                          -97.7727
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           11.3829
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.9094
MetaTest/__unnamed_task__/AverageReturn             -54.9094
MetaTest/__unnamed_task__/Iteration                 124
MetaTest/__unnamed_task__/MaxReturn                 -42.3374
MetaTest/__unnamed_task__/MinReturn                 -97.7727
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  11.3829
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4e+06
__unnamed_task__/AverageDiscountedReturn            -31.0511
__unnamed_task__/AverageReturn                      -61.9413
__unnamed_task__/Iteration                          124
__unnamed_task__/MaxReturn                          -45.5598
__unnamed_task__/MinReturn                         -144.409
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           20.9883
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 08:36:58 | [maml_trainer] epoch #125 | Sampling for adapation and meta-testing...
2025-03-31 08:40:50 | [maml_trainer] epoch #125 | Finished meta-testing...
2025-03-31 08:40:50 | [maml_trainer] epoch #125 | Saving snapshot...
2025-03-31 08:41:11 | [maml_trainer] epoch #125 | Saved
2025-03-31 08:41:11 | [maml_trainer] epoch #125 | Time 153172.23 s
2025-03-31 08:41:11 | [maml_trainer] epoch #125 | EpochTime 1193.05 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.6731
Average/AverageReturn                               -53.3879
Average/Iteration                                   125
Average/MaxReturn                                   199.308
Average/MinReturn                                  -104.649
Average/NumEpisodes                                  80
Average/StdReturn                                    30.7855
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9792
GaussianMLPPolicy/KLAfter                             0.000983339
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           8.33164e-05
GaussianMLPPolicy/LossBefore                          8.41916e-09
GaussianMLPPolicy/dLoss                              -8.3308e-05
Iteration                                           125
MetaTest/Average/AverageDiscountedReturn            -54.0034
MetaTest/Average/AverageReturn                      -54.0034
MetaTest/Average/Iteration                          125
MetaTest/Average/MaxReturn                          -44.415
MetaTest/Average/MinReturn                          -66.1736
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.96843
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.0034
MetaTest/__unnamed_task__/AverageReturn             -54.0034
MetaTest/__unnamed_task__/Iteration                 125
MetaTest/__unnamed_task__/MaxReturn                 -44.415
MetaTest/__unnamed_task__/MinReturn                 -66.1736
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.96843
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.032e+06
__unnamed_task__/AverageDiscountedReturn            -29.6731
__unnamed_task__/AverageReturn                      -53.3879
__unnamed_task__/Iteration                          125
__unnamed_task__/MaxReturn                          199.308
__unnamed_task__/MinReturn                         -104.649
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           30.7855
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 08:56:55 | [maml_trainer] epoch #126 | Sampling for adapation and meta-testing...
2025-03-31 09:00:48 | [maml_trainer] epoch #126 | Finished meta-testing...
2025-03-31 09:00:48 | [maml_trainer] epoch #126 | Saving snapshot...
2025-03-31 09:01:08 | [maml_trainer] epoch #126 | Saved
2025-03-31 09:01:08 | [maml_trainer] epoch #126 | Time 154369.07 s
2025-03-31 09:01:08 | [maml_trainer] epoch #126 | EpochTime 1196.84 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.3521
Average/AverageReturn                               -58.0427
Average/Iteration                                   126
Average/MaxReturn                                   -42.6793
Average/MinReturn                                  -112.12
Average/NumEpisodes                                  80
Average/StdReturn                                    13.2248
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97904
GaussianMLPPolicy/KLAfter                             0.00115785
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           5.74439e-05
GaussianMLPPolicy/LossBefore                         -2.83122e-09
GaussianMLPPolicy/dLoss                              -5.74467e-05
Iteration                                           126
MetaTest/Average/AverageDiscountedReturn            -55.2901
MetaTest/Average/AverageReturn                      -55.2901
MetaTest/Average/Iteration                          126
MetaTest/Average/MaxReturn                          -44.6718
MetaTest/Average/MinReturn                          -71.1036
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.02065
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -55.2901
MetaTest/__unnamed_task__/AverageReturn             -55.2901
MetaTest/__unnamed_task__/Iteration                 126
MetaTest/__unnamed_task__/MaxReturn                 -44.6718
MetaTest/__unnamed_task__/MinReturn                 -71.1036
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.02065
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.064e+06
__unnamed_task__/AverageDiscountedReturn            -30.3521
__unnamed_task__/AverageReturn                      -58.0427
__unnamed_task__/Iteration                          126
__unnamed_task__/MaxReturn                          -42.6793
__unnamed_task__/MinReturn                         -112.12
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.2248
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 09:16:41 | [maml_trainer] epoch #127 | Sampling for adapation and meta-testing...
2025-03-31 09:20:37 | [maml_trainer] epoch #127 | Finished meta-testing...
2025-03-31 09:20:37 | [maml_trainer] epoch #127 | Saving snapshot...
2025-03-31 09:20:58 | [maml_trainer] epoch #127 | Saved
2025-03-31 09:20:58 | [maml_trainer] epoch #127 | Time 155559.15 s
2025-03-31 09:20:58 | [maml_trainer] epoch #127 | EpochTime 1190.08 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.4531
Average/AverageReturn                               -56.5341
Average/Iteration                                   127
Average/MaxReturn                                   -41.8727
Average/MinReturn                                  -110.381
Average/NumEpisodes                                  80
Average/StdReturn                                    10.0282
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.97844
GaussianMLPPolicy/KLAfter                             0.00126258
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -8.13294e-06
GaussianMLPPolicy/LossBefore                          6.88434e-09
GaussianMLPPolicy/dLoss                               8.13982e-06
Iteration                                           127
MetaTest/Average/AverageDiscountedReturn            -56.6858
MetaTest/Average/AverageReturn                      -56.6858
MetaTest/Average/Iteration                          127
MetaTest/Average/MaxReturn                          -46.1969
MetaTest/Average/MinReturn                          -72.8412
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.80377
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.6858
MetaTest/__unnamed_task__/AverageReturn             -56.6858
MetaTest/__unnamed_task__/Iteration                 127
MetaTest/__unnamed_task__/MaxReturn                 -46.1969
MetaTest/__unnamed_task__/MinReturn                 -72.8412
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.80377
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.096e+06
__unnamed_task__/AverageDiscountedReturn            -30.4531
__unnamed_task__/AverageReturn                      -56.5341
__unnamed_task__/Iteration                          127
__unnamed_task__/MaxReturn                          -41.8727
__unnamed_task__/MinReturn                         -110.381
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.0282
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 09:36:38 | [maml_trainer] epoch #128 | Sampling for adapation and meta-testing...
2025-03-31 09:40:30 | [maml_trainer] epoch #128 | Finished meta-testing...
2025-03-31 09:40:30 | [maml_trainer] epoch #128 | Saving snapshot...
2025-03-31 09:40:51 | [maml_trainer] epoch #128 | Saved
2025-03-31 09:40:51 | [maml_trainer] epoch #128 | Time 156752.10 s
2025-03-31 09:40:51 | [maml_trainer] epoch #128 | EpochTime 1192.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.5382
Average/AverageReturn                              -56.3445
Average/Iteration                                  128
Average/MaxReturn                                  -41.5494
Average/MinReturn                                  -82.7473
Average/NumEpisodes                                 80
Average/StdReturn                                    9.40918
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97974
GaussianMLPPolicy/KLAfter                            0.00238186
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.58707e-05
GaussianMLPPolicy/LossBefore                         2.17557e-09
GaussianMLPPolicy/dLoss                              1.58729e-05
Iteration                                          128
MetaTest/Average/AverageDiscountedReturn           -55.1845
MetaTest/Average/AverageReturn                     -55.1845
MetaTest/Average/Iteration                         128
MetaTest/Average/MaxReturn                         -46.0313
MetaTest/Average/MinReturn                         -75.9331
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.18228
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.1845
MetaTest/__unnamed_task__/AverageReturn            -55.1845
MetaTest/__unnamed_task__/Iteration                128
MetaTest/__unnamed_task__/MaxReturn                -46.0313
MetaTest/__unnamed_task__/MinReturn                -75.9331
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.18228
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.128e+06
__unnamed_task__/AverageDiscountedReturn           -30.5382
__unnamed_task__/AverageReturn                     -56.3445
__unnamed_task__/Iteration                         128
__unnamed_task__/MaxReturn                         -41.5494
__unnamed_task__/MinReturn                         -82.7473
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.40918
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 09:56:24 | [maml_trainer] epoch #129 | Sampling for adapation and meta-testing...
2025-03-31 10:00:19 | [maml_trainer] epoch #129 | Finished meta-testing...
2025-03-31 10:00:19 | [maml_trainer] epoch #129 | Saving snapshot...
2025-03-31 10:00:40 | [maml_trainer] epoch #129 | Saved
2025-03-31 10:00:40 | [maml_trainer] epoch #129 | Time 157941.58 s
2025-03-31 10:00:40 | [maml_trainer] epoch #129 | EpochTime 1189.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.2141
Average/AverageReturn                              -55.5359
Average/Iteration                                  129
Average/MaxReturn                                  -43.7317
Average/MinReturn                                  -78.6447
Average/NumEpisodes                                 80
Average/StdReturn                                    7.22188
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98115
GaussianMLPPolicy/KLAfter                            0.00236486
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.78683e-05
GaussianMLPPolicy/LossBefore                         1.07288e-08
GaussianMLPPolicy/dLoss                              2.78791e-05
Iteration                                          129
MetaTest/Average/AverageDiscountedReturn           -56.9728
MetaTest/Average/AverageReturn                     -56.9728
MetaTest/Average/Iteration                         129
MetaTest/Average/MaxReturn                         -46.8602
MetaTest/Average/MinReturn                         -71.7306
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.93662
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.9728
MetaTest/__unnamed_task__/AverageReturn            -56.9728
MetaTest/__unnamed_task__/Iteration                129
MetaTest/__unnamed_task__/MaxReturn                -46.8602
MetaTest/__unnamed_task__/MinReturn                -71.7306
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.93662
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.16e+06
__unnamed_task__/AverageDiscountedReturn           -30.2141
__unnamed_task__/AverageReturn                     -55.5359
__unnamed_task__/Iteration                         129
__unnamed_task__/MaxReturn                         -43.7317
__unnamed_task__/MinReturn                         -78.6447
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.22188
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 10:16:17 | [maml_trainer] epoch #130 | Sampling for adapation and meta-testing...
2025-03-31 10:20:11 | [maml_trainer] epoch #130 | Finished meta-testing...
2025-03-31 10:20:11 | [maml_trainer] epoch #130 | Saving snapshot...
2025-03-31 10:20:31 | [maml_trainer] epoch #130 | Saved
2025-03-31 10:20:31 | [maml_trainer] epoch #130 | Time 159132.49 s
2025-03-31 10:20:31 | [maml_trainer] epoch #130 | EpochTime 1190.91 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.8996
Average/AverageReturn                              -57.1669
Average/Iteration                                  130
Average/MaxReturn                                  -45.273
Average/MinReturn                                  -79.4622
Average/NumEpisodes                                 80
Average/StdReturn                                    8.66978
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98382
GaussianMLPPolicy/KLAfter                            0.00258327
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.80748e-05
GaussianMLPPolicy/LossBefore                         1.34706e-08
GaussianMLPPolicy/dLoss                             -3.80614e-05
Iteration                                          130
MetaTest/Average/AverageDiscountedReturn           -56.3021
MetaTest/Average/AverageReturn                     -56.3021
MetaTest/Average/Iteration                         130
MetaTest/Average/MaxReturn                         -44.5081
MetaTest/Average/MinReturn                         -75.9675
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.20776
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.3021
MetaTest/__unnamed_task__/AverageReturn            -56.3021
MetaTest/__unnamed_task__/Iteration                130
MetaTest/__unnamed_task__/MaxReturn                -44.5081
MetaTest/__unnamed_task__/MinReturn                -75.9675
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.20776
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.192e+06
__unnamed_task__/AverageDiscountedReturn           -30.8996
__unnamed_task__/AverageReturn                     -57.1669
__unnamed_task__/Iteration                         130
__unnamed_task__/MaxReturn                         -45.273
__unnamed_task__/MinReturn                         -79.4622
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.66978
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 10:36:19 | [maml_trainer] epoch #131 | Sampling for adapation and meta-testing...
2025-03-31 10:40:13 | [maml_trainer] epoch #131 | Finished meta-testing...
2025-03-31 10:40:13 | [maml_trainer] epoch #131 | Saving snapshot...
2025-03-31 10:40:33 | [maml_trainer] epoch #131 | Saved
2025-03-31 10:40:33 | [maml_trainer] epoch #131 | Time 160334.45 s
2025-03-31 10:40:33 | [maml_trainer] epoch #131 | EpochTime 1201.97 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -31.0427
Average/AverageReturn                              -57.7813
Average/Iteration                                  131
Average/MaxReturn                                  -44.709
Average/MinReturn                                  -75.0056
Average/NumEpisodes                                 80
Average/StdReturn                                    7.69824
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98659
GaussianMLPPolicy/KLAfter                            0.00240422
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.36844e-05
GaussianMLPPolicy/LossBefore                         1.48416e-08
GaussianMLPPolicy/dLoss                              4.36993e-05
Iteration                                          131
MetaTest/Average/AverageDiscountedReturn           -57.564
MetaTest/Average/AverageReturn                     -57.564
MetaTest/Average/Iteration                         131
MetaTest/Average/MaxReturn                         -49.8674
MetaTest/Average/MinReturn                         -76.889
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.1348
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.564
MetaTest/__unnamed_task__/AverageReturn            -57.564
MetaTest/__unnamed_task__/Iteration                131
MetaTest/__unnamed_task__/MaxReturn                -49.8674
MetaTest/__unnamed_task__/MinReturn                -76.889
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.1348
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.224e+06
__unnamed_task__/AverageDiscountedReturn           -31.0427
__unnamed_task__/AverageReturn                     -57.7813
__unnamed_task__/Iteration                         131
__unnamed_task__/MaxReturn                         -44.709
__unnamed_task__/MinReturn                         -75.0056
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.69824
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 10:57:08 | [maml_trainer] epoch #132 | Sampling for adapation and meta-testing...
2025-03-31 11:01:11 | [maml_trainer] epoch #132 | Finished meta-testing...
2025-03-31 11:01:11 | [maml_trainer] epoch #132 | Saving snapshot...
2025-03-31 11:01:31 | [maml_trainer] epoch #132 | Saved
2025-03-31 11:01:31 | [maml_trainer] epoch #132 | Time 161592.99 s
2025-03-31 11:01:31 | [maml_trainer] epoch #132 | EpochTime 1258.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.8012
Average/AverageReturn                              -56.4995
Average/Iteration                                  132
Average/MaxReturn                                  -44.2868
Average/MinReturn                                  -78.3547
Average/NumEpisodes                                 80
Average/StdReturn                                    6.20999
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98947
GaussianMLPPolicy/KLAfter                            0.00340467
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.04474e-05
GaussianMLPPolicy/LossBefore                        -9.17912e-09
GaussianMLPPolicy/dLoss                              8.04382e-05
Iteration                                          132
MetaTest/Average/AverageDiscountedReturn           -56.212
MetaTest/Average/AverageReturn                     -56.212
MetaTest/Average/Iteration                         132
MetaTest/Average/MaxReturn                         -46.7243
MetaTest/Average/MinReturn                         -63.5036
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.23357
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.212
MetaTest/__unnamed_task__/AverageReturn            -56.212
MetaTest/__unnamed_task__/Iteration                132
MetaTest/__unnamed_task__/MaxReturn                -46.7243
MetaTest/__unnamed_task__/MinReturn                -63.5036
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.23357
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.256e+06
__unnamed_task__/AverageDiscountedReturn           -30.8012
__unnamed_task__/AverageReturn                     -56.4995
__unnamed_task__/Iteration                         132
__unnamed_task__/MaxReturn                         -44.2868
__unnamed_task__/MinReturn                         -78.3547
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.20999
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 11:17:44 | [maml_trainer] epoch #133 | Sampling for adapation and meta-testing...
2025-03-31 11:21:53 | [maml_trainer] epoch #133 | Finished meta-testing...
2025-03-31 11:21:53 | [maml_trainer] epoch #133 | Saving snapshot...
2025-03-31 11:22:14 | [maml_trainer] epoch #133 | Saved
2025-03-31 11:22:14 | [maml_trainer] epoch #133 | Time 162835.88 s
2025-03-31 11:22:14 | [maml_trainer] epoch #133 | EpochTime 1242.88 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.3461
Average/AverageReturn                              -55.1036
Average/Iteration                                  133
Average/MaxReturn                                  -45.7137
Average/MinReturn                                  -69.8459
Average/NumEpisodes                                 80
Average/StdReturn                                    5.58086
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99185
GaussianMLPPolicy/KLAfter                            0.0026655
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000138067
GaussianMLPPolicy/LossBefore                        -7.09295e-09
GaussianMLPPolicy/dLoss                              0.00013806
Iteration                                          133
MetaTest/Average/AverageDiscountedReturn           -55.4968
MetaTest/Average/AverageReturn                     -55.4968
MetaTest/Average/Iteration                         133
MetaTest/Average/MaxReturn                         -48.3581
MetaTest/Average/MinReturn                         -63.969
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.25868
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.4968
MetaTest/__unnamed_task__/AverageReturn            -55.4968
MetaTest/__unnamed_task__/Iteration                133
MetaTest/__unnamed_task__/MaxReturn                -48.3581
MetaTest/__unnamed_task__/MinReturn                -63.969
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.25868
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.288e+06
__unnamed_task__/AverageDiscountedReturn           -30.3461
__unnamed_task__/AverageReturn                     -55.1036
__unnamed_task__/Iteration                         133
__unnamed_task__/MaxReturn                         -45.7137
__unnamed_task__/MinReturn                         -69.8459
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.58086
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 11:38:39 | [maml_trainer] epoch #134 | Sampling for adapation and meta-testing...
2025-03-31 11:42:44 | [maml_trainer] epoch #134 | Finished meta-testing...
2025-03-31 11:42:44 | [maml_trainer] epoch #134 | Saving snapshot...
2025-03-31 11:43:05 | [maml_trainer] epoch #134 | Saved
2025-03-31 11:43:05 | [maml_trainer] epoch #134 | Time 164086.24 s
2025-03-31 11:43:05 | [maml_trainer] epoch #134 | EpochTime 1250.36 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.3853
Average/AverageReturn                              -55.5234
Average/Iteration                                  134
Average/MaxReturn                                  -44.8553
Average/MinReturn                                  -76.7504
Average/NumEpisodes                                 80
Average/StdReturn                                    5.86414
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99387
GaussianMLPPolicy/KLAfter                            0.00200854
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.09762e-08
GaussianMLPPolicy/LossBefore                         5.96046e-09
GaussianMLPPolicy/dLoss                             -5.50157e-08
Iteration                                          134
MetaTest/Average/AverageDiscountedReturn           -55.5751
MetaTest/Average/AverageReturn                     -55.5751
MetaTest/Average/Iteration                         134
MetaTest/Average/MaxReturn                         -43.9624
MetaTest/Average/MinReturn                         -69.8897
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.17789
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.5751
MetaTest/__unnamed_task__/AverageReturn            -55.5751
MetaTest/__unnamed_task__/Iteration                134
MetaTest/__unnamed_task__/MaxReturn                -43.9624
MetaTest/__unnamed_task__/MinReturn                -69.8897
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.17789
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.32e+06
__unnamed_task__/AverageDiscountedReturn           -30.3853
__unnamed_task__/AverageReturn                     -55.5234
__unnamed_task__/Iteration                         134
__unnamed_task__/MaxReturn                         -44.8553
__unnamed_task__/MinReturn                         -76.7504
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.86414
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 11:59:35 | [maml_trainer] epoch #135 | Sampling for adapation and meta-testing...
2025-03-31 12:03:46 | [maml_trainer] epoch #135 | Finished meta-testing...
2025-03-31 12:03:46 | [maml_trainer] epoch #135 | Saving snapshot...
2025-03-31 12:04:07 | [maml_trainer] epoch #135 | Saved
2025-03-31 12:04:07 | [maml_trainer] epoch #135 | Time 165348.25 s
2025-03-31 12:04:07 | [maml_trainer] epoch #135 | EpochTime 1262.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.6629
Average/AverageReturn                              -56.1984
Average/Iteration                                  135
Average/MaxReturn                                  -45.9453
Average/MinReturn                                  -74.0996
Average/NumEpisodes                                 80
Average/StdReturn                                    6.0864
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99689
GaussianMLPPolicy/KLAfter                            0.00132602
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.51695e-05
GaussianMLPPolicy/LossBefore                         2.98023e-10
GaussianMLPPolicy/dLoss                              5.51698e-05
Iteration                                          135
MetaTest/Average/AverageDiscountedReturn           -55.5416
MetaTest/Average/AverageReturn                     -55.5416
MetaTest/Average/Iteration                         135
MetaTest/Average/MaxReturn                         -47.4994
MetaTest/Average/MinReturn                         -63.8326
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.82702
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.5416
MetaTest/__unnamed_task__/AverageReturn            -55.5416
MetaTest/__unnamed_task__/Iteration                135
MetaTest/__unnamed_task__/MaxReturn                -47.4994
MetaTest/__unnamed_task__/MinReturn                -63.8326
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.82702
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.352e+06
__unnamed_task__/AverageDiscountedReturn           -30.6629
__unnamed_task__/AverageReturn                     -56.1984
__unnamed_task__/Iteration                         135
__unnamed_task__/MaxReturn                         -45.9453
__unnamed_task__/MinReturn                         -74.0996
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.0864
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 12:20:48 | [maml_trainer] epoch #136 | Sampling for adapation and meta-testing...
2025-03-31 12:25:00 | [maml_trainer] epoch #136 | Finished meta-testing...
2025-03-31 12:25:00 | [maml_trainer] epoch #136 | Saving snapshot...
2025-03-31 12:25:21 | [maml_trainer] epoch #136 | Saved
2025-03-31 12:25:21 | [maml_trainer] epoch #136 | Time 166622.15 s
2025-03-31 12:25:21 | [maml_trainer] epoch #136 | EpochTime 1273.90 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.131
Average/AverageReturn                              -54.5284
Average/Iteration                                  136
Average/MaxReturn                                  -46.1178
Average/MinReturn                                  -65.7533
Average/NumEpisodes                                 80
Average/StdReturn                                    4.8794
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0009
GaussianMLPPolicy/KLAfter                            0.00184021
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.96563e-06
GaussianMLPPolicy/LossBefore                         1.18613e-08
GaussianMLPPolicy/dLoss                             -2.95377e-06
Iteration                                          136
MetaTest/Average/AverageDiscountedReturn           -55.2044
MetaTest/Average/AverageReturn                     -55.2044
MetaTest/Average/Iteration                         136
MetaTest/Average/MaxReturn                         -45.9629
MetaTest/Average/MinReturn                         -68.8696
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.84897
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.2044
MetaTest/__unnamed_task__/AverageReturn            -55.2044
MetaTest/__unnamed_task__/Iteration                136
MetaTest/__unnamed_task__/MaxReturn                -45.9629
MetaTest/__unnamed_task__/MinReturn                -68.8696
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.84897
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.384e+06
__unnamed_task__/AverageDiscountedReturn           -30.131
__unnamed_task__/AverageReturn                     -54.5284
__unnamed_task__/Iteration                         136
__unnamed_task__/MaxReturn                         -46.1178
__unnamed_task__/MinReturn                         -65.7533
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.8794
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 12:42:13 | [maml_trainer] epoch #137 | Sampling for adapation and meta-testing...
2025-03-31 12:46:26 | [maml_trainer] epoch #137 | Finished meta-testing...
2025-03-31 12:46:26 | [maml_trainer] epoch #137 | Saving snapshot...
2025-03-31 12:46:48 | [maml_trainer] epoch #137 | Saved
2025-03-31 12:46:48 | [maml_trainer] epoch #137 | Time 167909.83 s
2025-03-31 12:46:48 | [maml_trainer] epoch #137 | EpochTime 1287.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.584
Average/AverageReturn                              -53.732
Average/Iteration                                  137
Average/MaxReturn                                  -44.2093
Average/MinReturn                                  -74.9944
Average/NumEpisodes                                 80
Average/StdReturn                                    5.66253
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0027
GaussianMLPPolicy/KLAfter                            0.00424394
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.0133e-05
GaussianMLPPolicy/LossBefore                        -1.32918e-08
GaussianMLPPolicy/dLoss                              8.01197e-05
Iteration                                          137
MetaTest/Average/AverageDiscountedReturn           -52.5807
MetaTest/Average/AverageReturn                     -52.5807
MetaTest/Average/Iteration                         137
MetaTest/Average/MaxReturn                         -41.9142
MetaTest/Average/MinReturn                         -66.9019
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.52918
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -52.5807
MetaTest/__unnamed_task__/AverageReturn            -52.5807
MetaTest/__unnamed_task__/Iteration                137
MetaTest/__unnamed_task__/MaxReturn                -41.9142
MetaTest/__unnamed_task__/MinReturn                -66.9019
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.52918
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.416e+06
__unnamed_task__/AverageDiscountedReturn           -29.584
__unnamed_task__/AverageReturn                     -53.732
__unnamed_task__/Iteration                         137
__unnamed_task__/MaxReturn                         -44.2093
__unnamed_task__/MinReturn                         -74.9944
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.66253
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 13:03:45 | [maml_trainer] epoch #138 | Sampling for adapation and meta-testing...
2025-03-31 13:08:00 | [maml_trainer] epoch #138 | Finished meta-testing...
2025-03-31 13:08:00 | [maml_trainer] epoch #138 | Saving snapshot...
2025-03-31 13:08:22 | [maml_trainer] epoch #138 | Saved
2025-03-31 13:08:22 | [maml_trainer] epoch #138 | Time 169203.29 s
2025-03-31 13:08:22 | [maml_trainer] epoch #138 | EpochTime 1293.46 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.8211
Average/AverageReturn                              -53.7042
Average/Iteration                                  138
Average/MaxReturn                                  -42.8562
Average/MinReturn                                  -68.4297
Average/NumEpisodes                                 80
Average/StdReturn                                    5.38064
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0036
GaussianMLPPolicy/KLAfter                            0.00379348
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.53909e-05
GaussianMLPPolicy/LossBefore                        -2.02656e-09
GaussianMLPPolicy/dLoss                              9.53889e-05
Iteration                                          138
MetaTest/Average/AverageDiscountedReturn           -53.506
MetaTest/Average/AverageReturn                     -53.506
MetaTest/Average/Iteration                         138
MetaTest/Average/MaxReturn                         -44.6166
MetaTest/Average/MinReturn                         -63.1568
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.12775
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -53.506
MetaTest/__unnamed_task__/AverageReturn            -53.506
MetaTest/__unnamed_task__/Iteration                138
MetaTest/__unnamed_task__/MaxReturn                -44.6166
MetaTest/__unnamed_task__/MinReturn                -63.1568
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.12775
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.448e+06
__unnamed_task__/AverageDiscountedReturn           -29.8211
__unnamed_task__/AverageReturn                     -53.7042
__unnamed_task__/Iteration                         138
__unnamed_task__/MaxReturn                         -42.8562
__unnamed_task__/MinReturn                         -68.4297
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.38064
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 13:25:09 | [maml_trainer] epoch #139 | Sampling for adapation and meta-testing...
2025-03-31 13:29:24 | [maml_trainer] epoch #139 | Finished meta-testing...
2025-03-31 13:29:24 | [maml_trainer] epoch #139 | Saving snapshot...
2025-03-31 13:29:46 | [maml_trainer] epoch #139 | Saved
2025-03-31 13:29:46 | [maml_trainer] epoch #139 | Time 170487.38 s
2025-03-31 13:29:46 | [maml_trainer] epoch #139 | EpochTime 1284.09 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.8036
Average/AverageReturn                              -54.0624
Average/Iteration                                  139
Average/MaxReturn                                  -46.9613
Average/MinReturn                                  -71.8368
Average/NumEpisodes                                 80
Average/StdReturn                                    4.8546
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0042
GaussianMLPPolicy/KLAfter                            0.00258849
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.30501e-06
GaussianMLPPolicy/LossBefore                        -1.44243e-08
GaussianMLPPolicy/dLoss                             -6.31943e-06
Iteration                                          139
MetaTest/Average/AverageDiscountedReturn           -54.8498
MetaTest/Average/AverageReturn                     -54.8498
MetaTest/Average/Iteration                         139
MetaTest/Average/MaxReturn                         -46.7028
MetaTest/Average/MinReturn                         -62.2744
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.95894
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.8498
MetaTest/__unnamed_task__/AverageReturn            -54.8498
MetaTest/__unnamed_task__/Iteration                139
MetaTest/__unnamed_task__/MaxReturn                -46.7028
MetaTest/__unnamed_task__/MinReturn                -62.2744
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.95894
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.48e+06
__unnamed_task__/AverageDiscountedReturn           -29.8036
__unnamed_task__/AverageReturn                     -54.0624
__unnamed_task__/Iteration                         139
__unnamed_task__/MaxReturn                         -46.9613
__unnamed_task__/MinReturn                         -71.8368
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.8546
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 13:46:24 | [maml_trainer] epoch #140 | Sampling for adapation and meta-testing...
2025-03-31 13:50:31 | [maml_trainer] epoch #140 | Finished meta-testing...
2025-03-31 13:50:31 | [maml_trainer] epoch #140 | Saving snapshot...
2025-03-31 13:50:51 | [maml_trainer] epoch #140 | Saved
2025-03-31 13:50:51 | [maml_trainer] epoch #140 | Time 171752.39 s
2025-03-31 13:50:51 | [maml_trainer] epoch #140 | EpochTime 1265.01 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.7557
Average/AverageReturn                               -54.8166
Average/Iteration                                   140
Average/MaxReturn                                   -44.1742
Average/MinReturn                                  -153.152
Average/NumEpisodes                                  80
Average/StdReturn                                    12.3342
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0047
GaussianMLPPolicy/KLAfter                             0.00452673
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.17381e-05
GaussianMLPPolicy/LossBefore                         -1.30832e-08
GaussianMLPPolicy/dLoss                               1.1725e-05
Iteration                                           140
MetaTest/Average/AverageDiscountedReturn            -54.8738
MetaTest/Average/AverageReturn                      -54.8738
MetaTest/Average/Iteration                          140
MetaTest/Average/MaxReturn                          -46.6272
MetaTest/Average/MinReturn                          -66.0891
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.81834
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.8738
MetaTest/__unnamed_task__/AverageReturn             -54.8738
MetaTest/__unnamed_task__/Iteration                 140
MetaTest/__unnamed_task__/MaxReturn                 -46.6272
MetaTest/__unnamed_task__/MinReturn                 -66.0891
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.81834
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.512e+06
__unnamed_task__/AverageDiscountedReturn            -29.7557
__unnamed_task__/AverageReturn                      -54.8166
__unnamed_task__/Iteration                          140
__unnamed_task__/MaxReturn                          -44.1742
__unnamed_task__/MinReturn                         -153.152
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.3342
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 14:07:07 | [maml_trainer] epoch #141 | Sampling for adapation and meta-testing...
2025-03-31 14:11:03 | [maml_trainer] epoch #141 | Finished meta-testing...
2025-03-31 14:11:03 | [maml_trainer] epoch #141 | Saving snapshot...
2025-03-31 14:11:24 | [maml_trainer] epoch #141 | Saved
2025-03-31 14:11:24 | [maml_trainer] epoch #141 | Time 172985.59 s
2025-03-31 14:11:24 | [maml_trainer] epoch #141 | EpochTime 1233.19 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.0074
Average/AverageReturn                               -55.9807
Average/Iteration                                   141
Average/MaxReturn                                   -44.7899
Average/MinReturn                                  -121.363
Average/NumEpisodes                                  80
Average/StdReturn                                    11.4744
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.004
GaussianMLPPolicy/KLAfter                             0.00222979
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.32005e-05
GaussianMLPPolicy/LossBefore                         -4.79817e-09
GaussianMLPPolicy/dLoss                              -2.32053e-05
Iteration                                           141
MetaTest/Average/AverageDiscountedReturn            -59.6494
MetaTest/Average/AverageReturn                      -59.6494
MetaTest/Average/Iteration                          141
MetaTest/Average/MaxReturn                          -45.6615
MetaTest/Average/MinReturn                          -81.3912
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.8379
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -59.6494
MetaTest/__unnamed_task__/AverageReturn             -59.6494
MetaTest/__unnamed_task__/Iteration                 141
MetaTest/__unnamed_task__/MaxReturn                 -45.6615
MetaTest/__unnamed_task__/MinReturn                 -81.3912
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.8379
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.544e+06
__unnamed_task__/AverageDiscountedReturn            -30.0074
__unnamed_task__/AverageReturn                      -55.9807
__unnamed_task__/Iteration                          141
__unnamed_task__/MaxReturn                          -44.7899
__unnamed_task__/MinReturn                         -121.363
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.4744
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 14:27:51 | [maml_trainer] epoch #142 | Sampling for adapation and meta-testing...
2025-03-31 14:31:59 | [maml_trainer] epoch #142 | Finished meta-testing...
2025-03-31 14:31:59 | [maml_trainer] epoch #142 | Saving snapshot...
2025-03-31 14:32:21 | [maml_trainer] epoch #142 | Saved
2025-03-31 14:32:21 | [maml_trainer] epoch #142 | Time 174242.06 s
2025-03-31 14:32:21 | [maml_trainer] epoch #142 | EpochTime 1256.46 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.3288
Average/AverageReturn                               -56.6117
Average/Iteration                                   142
Average/MaxReturn                                   -43.3121
Average/MinReturn                                  -162.318
Average/NumEpisodes                                  80
Average/StdReturn                                    15.083
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0035
GaussianMLPPolicy/KLAfter                             0.00127895
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.48068e-05
GaussianMLPPolicy/LossBefore                          1.3113e-09
GaussianMLPPolicy/dLoss                               1.48081e-05
Iteration                                           142
MetaTest/Average/AverageDiscountedReturn            -58.3207
MetaTest/Average/AverageReturn                      -58.3207
MetaTest/Average/Iteration                          142
MetaTest/Average/MaxReturn                          -47.2678
MetaTest/Average/MinReturn                          -82.0205
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.6635
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.3207
MetaTest/__unnamed_task__/AverageReturn             -58.3207
MetaTest/__unnamed_task__/Iteration                 142
MetaTest/__unnamed_task__/MaxReturn                 -47.2678
MetaTest/__unnamed_task__/MinReturn                 -82.0205
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.6635
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.576e+06
__unnamed_task__/AverageDiscountedReturn            -30.3288
__unnamed_task__/AverageReturn                      -56.6117
__unnamed_task__/Iteration                          142
__unnamed_task__/MaxReturn                          -43.3121
__unnamed_task__/MinReturn                         -162.318
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.083
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 14:48:58 | [maml_trainer] epoch #143 | Sampling for adapation and meta-testing...
2025-03-31 14:53:08 | [maml_trainer] epoch #143 | Finished meta-testing...
2025-03-31 14:53:08 | [maml_trainer] epoch #143 | Saving snapshot...
2025-03-31 14:53:30 | [maml_trainer] epoch #143 | Saved
2025-03-31 14:53:30 | [maml_trainer] epoch #143 | Time 175511.61 s
2025-03-31 14:53:30 | [maml_trainer] epoch #143 | EpochTime 1269.55 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.1595
Average/AverageReturn                               -60.1134
Average/Iteration                                   143
Average/MaxReturn                                   -46.7118
Average/MinReturn                                  -149.931
Average/NumEpisodes                                  80
Average/StdReturn                                    13.8988
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0029
GaussianMLPPolicy/KLAfter                             0.00187098
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -4.05787e-05
GaussianMLPPolicy/LossBefore                         -8.37445e-09
GaussianMLPPolicy/dLoss                               4.05703e-05
Iteration                                           143
MetaTest/Average/AverageDiscountedReturn            -55.3508
MetaTest/Average/AverageReturn                      -55.3508
MetaTest/Average/Iteration                          143
MetaTest/Average/MaxReturn                          -44.9229
MetaTest/Average/MinReturn                          -68.5838
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.41303
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -55.3508
MetaTest/__unnamed_task__/AverageReturn             -55.3508
MetaTest/__unnamed_task__/Iteration                 143
MetaTest/__unnamed_task__/MaxReturn                 -44.9229
MetaTest/__unnamed_task__/MinReturn                 -68.5838
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.41303
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.608e+06
__unnamed_task__/AverageDiscountedReturn            -31.1595
__unnamed_task__/AverageReturn                      -60.1134
__unnamed_task__/Iteration                          143
__unnamed_task__/MaxReturn                          -46.7118
__unnamed_task__/MinReturn                         -149.931
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.8988
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 15:10:05 | [maml_trainer] epoch #144 | Sampling for adapation and meta-testing...
2025-03-31 15:14:11 | [maml_trainer] epoch #144 | Finished meta-testing...
2025-03-31 15:14:11 | [maml_trainer] epoch #144 | Saving snapshot...
2025-03-31 15:14:31 | [maml_trainer] epoch #144 | Saved
2025-03-31 15:14:31 | [maml_trainer] epoch #144 | Time 176772.70 s
2025-03-31 15:14:31 | [maml_trainer] epoch #144 | EpochTime 1261.08 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.1916
Average/AverageReturn                               -56.1338
Average/Iteration                                   144
Average/MaxReturn                                   -42.1121
Average/MinReturn                                  -116.882
Average/NumEpisodes                                  80
Average/StdReturn                                    11.7776
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0026
GaussianMLPPolicy/KLAfter                             0.00184954
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.0946e-05
GaussianMLPPolicy/LossBefore                          7.27177e-09
GaussianMLPPolicy/dLoss                              -4.09387e-05
Iteration                                           144
MetaTest/Average/AverageDiscountedReturn            -58.0884
MetaTest/Average/AverageReturn                      -58.0884
MetaTest/Average/Iteration                          144
MetaTest/Average/MaxReturn                          -45.114
MetaTest/Average/MinReturn                          -83.829
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.3012
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.0884
MetaTest/__unnamed_task__/AverageReturn             -58.0884
MetaTest/__unnamed_task__/Iteration                 144
MetaTest/__unnamed_task__/MaxReturn                 -45.114
MetaTest/__unnamed_task__/MinReturn                 -83.829
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.3012
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.64e+06
__unnamed_task__/AverageDiscountedReturn            -30.1916
__unnamed_task__/AverageReturn                      -56.1338
__unnamed_task__/Iteration                          144
__unnamed_task__/MaxReturn                          -42.1121
__unnamed_task__/MinReturn                         -116.882
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.7776
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 15:31:01 | [maml_trainer] epoch #145 | Sampling for adapation and meta-testing...
2025-03-31 15:35:01 | [maml_trainer] epoch #145 | Finished meta-testing...
2025-03-31 15:35:01 | [maml_trainer] epoch #145 | Saving snapshot...
2025-03-31 15:35:23 | [maml_trainer] epoch #145 | Saved
2025-03-31 15:35:23 | [maml_trainer] epoch #145 | Time 178024.81 s
2025-03-31 15:35:23 | [maml_trainer] epoch #145 | EpochTime 1252.11 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.7392
Average/AverageReturn                               -59.2622
Average/Iteration                                   145
Average/MaxReturn                                   -42.8037
Average/MinReturn                                  -168.463
Average/NumEpisodes                                  80
Average/StdReturn                                    18.7362
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0021
GaussianMLPPolicy/KLAfter                             0.00150201
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           3.18027e-05
GaussianMLPPolicy/LossBefore                         -1.07288e-09
GaussianMLPPolicy/dLoss                              -3.18038e-05
Iteration                                           145
MetaTest/Average/AverageDiscountedReturn            -55.786
MetaTest/Average/AverageReturn                      -55.786
MetaTest/Average/Iteration                          145
MetaTest/Average/MaxReturn                          -46.3813
MetaTest/Average/MinReturn                          -74.9396
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.51438
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -55.786
MetaTest/__unnamed_task__/AverageReturn             -55.786
MetaTest/__unnamed_task__/Iteration                 145
MetaTest/__unnamed_task__/MaxReturn                 -46.3813
MetaTest/__unnamed_task__/MinReturn                 -74.9396
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.51438
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.672e+06
__unnamed_task__/AverageDiscountedReturn            -30.7392
__unnamed_task__/AverageReturn                      -59.2622
__unnamed_task__/Iteration                          145
__unnamed_task__/MaxReturn                          -42.8037
__unnamed_task__/MinReturn                         -168.463
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           18.7362
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 15:51:53 | [maml_trainer] epoch #146 | Sampling for adapation and meta-testing...
2025-03-31 15:56:02 | [maml_trainer] epoch #146 | Finished meta-testing...
2025-03-31 15:56:02 | [maml_trainer] epoch #146 | Saving snapshot...
2025-03-31 15:56:24 | [maml_trainer] epoch #146 | Saved
2025-03-31 15:56:24 | [maml_trainer] epoch #146 | Time 179285.49 s
2025-03-31 15:56:24 | [maml_trainer] epoch #146 | EpochTime 1260.68 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.3603
Average/AverageReturn                               -57.5738
Average/Iteration                                   146
Average/MaxReturn                                   -44.4484
Average/MinReturn                                  -136.304
Average/NumEpisodes                                  80
Average/StdReturn                                    13.0972
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0019
GaussianMLPPolicy/KLAfter                             0.00183678
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           3.67074e-05
GaussianMLPPolicy/LossBefore                          5.45382e-09
GaussianMLPPolicy/dLoss                              -3.6702e-05
Iteration                                           146
MetaTest/Average/AverageDiscountedReturn            -57.0871
MetaTest/Average/AverageReturn                      -57.0871
MetaTest/Average/Iteration                          146
MetaTest/Average/MaxReturn                          -47.6321
MetaTest/Average/MinReturn                          -74.5345
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.31645
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.0871
MetaTest/__unnamed_task__/AverageReturn             -57.0871
MetaTest/__unnamed_task__/Iteration                 146
MetaTest/__unnamed_task__/MaxReturn                 -47.6321
MetaTest/__unnamed_task__/MinReturn                 -74.5345
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.31645
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.704e+06
__unnamed_task__/AverageDiscountedReturn            -30.3603
__unnamed_task__/AverageReturn                      -57.5738
__unnamed_task__/Iteration                          146
__unnamed_task__/MaxReturn                          -44.4484
__unnamed_task__/MinReturn                         -136.304
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.0972
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 16:12:47 | [maml_trainer] epoch #147 | Sampling for adapation and meta-testing...
2025-03-31 16:16:51 | [maml_trainer] epoch #147 | Finished meta-testing...
2025-03-31 16:16:51 | [maml_trainer] epoch #147 | Saving snapshot...
2025-03-31 16:17:12 | [maml_trainer] epoch #147 | Saved
2025-03-31 16:17:12 | [maml_trainer] epoch #147 | Time 180533.80 s
2025-03-31 16:17:12 | [maml_trainer] epoch #147 | EpochTime 1248.30 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.2096
Average/AverageReturn                              -56.5039
Average/Iteration                                  147
Average/MaxReturn                                  -44.8826
Average/MinReturn                                  -95.127
Average/NumEpisodes                                 80
Average/StdReturn                                    7.9659
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0008
GaussianMLPPolicy/KLAfter                            0.00227442
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.60549e-05
GaussianMLPPolicy/LossBefore                         8.9407e-10
GaussianMLPPolicy/dLoss                              5.60558e-05
Iteration                                          147
MetaTest/Average/AverageDiscountedReturn           -56.8524
MetaTest/Average/AverageReturn                     -56.8524
MetaTest/Average/Iteration                         147
MetaTest/Average/MaxReturn                         -47.4025
MetaTest/Average/MinReturn                         -77.0528
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.85346
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.8524
MetaTest/__unnamed_task__/AverageReturn            -56.8524
MetaTest/__unnamed_task__/Iteration                147
MetaTest/__unnamed_task__/MaxReturn                -47.4025
MetaTest/__unnamed_task__/MinReturn                -77.0528
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.85346
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.736e+06
__unnamed_task__/AverageDiscountedReturn           -30.2096
__unnamed_task__/AverageReturn                     -56.5039
__unnamed_task__/Iteration                         147
__unnamed_task__/MaxReturn                         -44.8826
__unnamed_task__/MinReturn                         -95.127
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.9659
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 16:33:43 | [maml_trainer] epoch #148 | Sampling for adapation and meta-testing...
2025-03-31 16:37:51 | [maml_trainer] epoch #148 | Finished meta-testing...
2025-03-31 16:37:51 | [maml_trainer] epoch #148 | Saving snapshot...
2025-03-31 16:38:12 | [maml_trainer] epoch #148 | Saved
2025-03-31 16:38:12 | [maml_trainer] epoch #148 | Time 181793.37 s
2025-03-31 16:38:12 | [maml_trainer] epoch #148 | EpochTime 1259.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.9129
Average/AverageReturn                              -55.8069
Average/Iteration                                  148
Average/MaxReturn                                  -42.3303
Average/MinReturn                                  -89.901
Average/NumEpisodes                                 80
Average/StdReturn                                    9.28299
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0009
GaussianMLPPolicy/KLAfter                            0.00191894
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.02041e-05
GaussianMLPPolicy/LossBefore                         3.09944e-09
GaussianMLPPolicy/dLoss                             -8.0201e-05
Iteration                                          148
MetaTest/Average/AverageDiscountedReturn           -60.87
MetaTest/Average/AverageReturn                     -60.87
MetaTest/Average/Iteration                         148
MetaTest/Average/MaxReturn                         -45.5503
MetaTest/Average/MinReturn                         -97.305
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.6042
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -60.87
MetaTest/__unnamed_task__/AverageReturn            -60.87
MetaTest/__unnamed_task__/Iteration                148
MetaTest/__unnamed_task__/MaxReturn                -45.5503
MetaTest/__unnamed_task__/MinReturn                -97.305
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.6042
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.768e+06
__unnamed_task__/AverageDiscountedReturn           -29.9129
__unnamed_task__/AverageReturn                     -55.8069
__unnamed_task__/Iteration                         148
__unnamed_task__/MaxReturn                         -42.3303
__unnamed_task__/MinReturn                         -89.901
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.28299
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 16:54:35 | [maml_trainer] epoch #149 | Sampling for adapation and meta-testing...
2025-03-31 16:58:42 | [maml_trainer] epoch #149 | Finished meta-testing...
2025-03-31 16:58:42 | [maml_trainer] epoch #149 | Saving snapshot...
2025-03-31 16:59:04 | [maml_trainer] epoch #149 | Saved
2025-03-31 16:59:04 | [maml_trainer] epoch #149 | Time 183045.12 s
2025-03-31 16:59:04 | [maml_trainer] epoch #149 | EpochTime 1251.75 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.9953
Average/AverageReturn                              -55.7488
Average/Iteration                                  149
Average/MaxReturn                                  -44.9725
Average/MinReturn                                  -91.825
Average/NumEpisodes                                 80
Average/StdReturn                                    8.91751
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99998
GaussianMLPPolicy/KLAfter                            0.00151725
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.01274e-06
GaussianMLPPolicy/LossBefore                        -5.60284e-09
GaussianMLPPolicy/dLoss                              6.00714e-06
Iteration                                          149
MetaTest/Average/AverageDiscountedReturn           -57.887
MetaTest/Average/AverageReturn                     -57.887
MetaTest/Average/Iteration                         149
MetaTest/Average/MaxReturn                         -45.1582
MetaTest/Average/MinReturn                         -94.2217
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.5437
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.887
MetaTest/__unnamed_task__/AverageReturn            -57.887
MetaTest/__unnamed_task__/Iteration                149
MetaTest/__unnamed_task__/MaxReturn                -45.1582
MetaTest/__unnamed_task__/MinReturn                -94.2217
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.5437
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.8e+06
__unnamed_task__/AverageDiscountedReturn           -29.9953
__unnamed_task__/AverageReturn                     -55.7488
__unnamed_task__/Iteration                         149
__unnamed_task__/MaxReturn                         -44.9725
__unnamed_task__/MinReturn                         -91.825
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.91751
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 17:15:29 | [maml_trainer] epoch #150 | Sampling for adapation and meta-testing...
2025-03-31 17:19:41 | [maml_trainer] epoch #150 | Finished meta-testing...
2025-03-31 17:19:41 | [maml_trainer] epoch #150 | Saving snapshot...
2025-03-31 17:20:04 | [maml_trainer] epoch #150 | Saved
2025-03-31 17:20:04 | [maml_trainer] epoch #150 | Time 184305.04 s
2025-03-31 17:20:04 | [maml_trainer] epoch #150 | EpochTime 1259.91 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.6617
Average/AverageReturn                               -58.7106
Average/Iteration                                   150
Average/MaxReturn                                   -44.503
Average/MinReturn                                  -180.056
Average/NumEpisodes                                  80
Average/StdReturn                                    15.6979
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99967
GaussianMLPPolicy/KLAfter                             0.000978984
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.17238e-05
GaussianMLPPolicy/LossBefore                          3.57628e-10
GaussianMLPPolicy/dLoss                               1.17241e-05
Iteration                                           150
MetaTest/Average/AverageDiscountedReturn            -56.3186
MetaTest/Average/AverageReturn                      -56.3186
MetaTest/Average/Iteration                          150
MetaTest/Average/MaxReturn                          -45.7396
MetaTest/Average/MinReturn                          -70.6992
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.1462
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.3186
MetaTest/__unnamed_task__/AverageReturn             -56.3186
MetaTest/__unnamed_task__/Iteration                 150
MetaTest/__unnamed_task__/MaxReturn                 -45.7396
MetaTest/__unnamed_task__/MinReturn                 -70.6992
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.1462
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         4.832e+06
__unnamed_task__/AverageDiscountedReturn            -30.6617
__unnamed_task__/AverageReturn                      -58.7106
__unnamed_task__/Iteration                          150
__unnamed_task__/MaxReturn                          -44.503
__unnamed_task__/MinReturn                         -180.056
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.6979
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 17:35:58 | [maml_trainer] epoch #151 | Sampling for adapation and meta-testing...
2025-03-31 17:40:02 | [maml_trainer] epoch #151 | Finished meta-testing...
2025-03-31 17:40:02 | [maml_trainer] epoch #151 | Saving snapshot...
2025-03-31 17:40:23 | [maml_trainer] epoch #151 | Saved
2025-03-31 17:40:23 | [maml_trainer] epoch #151 | Time 185524.13 s
2025-03-31 17:40:23 | [maml_trainer] epoch #151 | EpochTime 1219.09 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.782
Average/AverageReturn                              -55.9642
Average/Iteration                                  151
Average/MaxReturn                                  -43.8696
Average/MinReturn                                  -84.7452
Average/NumEpisodes                                 80
Average/StdReturn                                    8.64659
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0009
GaussianMLPPolicy/KLAfter                            0.0021671
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.06652e-05
GaussianMLPPolicy/LossBefore                        -7.689e-09
GaussianMLPPolicy/dLoss                             -1.06729e-05
Iteration                                          151
MetaTest/Average/AverageDiscountedReturn           -57.2618
MetaTest/Average/AverageReturn                     -57.2618
MetaTest/Average/Iteration                         151
MetaTest/Average/MaxReturn                         -42.7871
MetaTest/Average/MinReturn                         -78.5821
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.0829
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.2618
MetaTest/__unnamed_task__/AverageReturn            -57.2618
MetaTest/__unnamed_task__/Iteration                151
MetaTest/__unnamed_task__/MaxReturn                -42.7871
MetaTest/__unnamed_task__/MinReturn                -78.5821
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.0829
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.864e+06
__unnamed_task__/AverageDiscountedReturn           -29.782
__unnamed_task__/AverageReturn                     -55.9642
__unnamed_task__/Iteration                         151
__unnamed_task__/MaxReturn                         -43.8696
__unnamed_task__/MinReturn                         -84.7452
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.64659
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 17:56:35 | [maml_trainer] epoch #152 | Sampling for adapation and meta-testing...
2025-03-31 18:00:44 | [maml_trainer] epoch #152 | Finished meta-testing...
2025-03-31 18:00:44 | [maml_trainer] epoch #152 | Saving snapshot...
2025-03-31 18:01:05 | [maml_trainer] epoch #152 | Saved
2025-03-31 18:01:05 | [maml_trainer] epoch #152 | Time 186767.02 s
2025-03-31 18:01:05 | [maml_trainer] epoch #152 | EpochTime 1242.89 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.5563
Average/AverageReturn                              -58.3877
Average/Iteration                                  152
Average/MaxReturn                                  -44.8451
Average/MinReturn                                  -92.1785
Average/NumEpisodes                                 80
Average/StdReturn                                    9.72725
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.002
GaussianMLPPolicy/KLAfter                            0.0020299
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.36855e-05
GaussianMLPPolicy/LossBefore                        -1.54078e-08
GaussianMLPPolicy/dLoss                              4.36701e-05
Iteration                                          152
MetaTest/Average/AverageDiscountedReturn           -58.3895
MetaTest/Average/AverageReturn                     -58.3895
MetaTest/Average/Iteration                         152
MetaTest/Average/MaxReturn                         -45.6877
MetaTest/Average/MinReturn                         -75.762
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.16092
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -58.3895
MetaTest/__unnamed_task__/AverageReturn            -58.3895
MetaTest/__unnamed_task__/Iteration                152
MetaTest/__unnamed_task__/MaxReturn                -45.6877
MetaTest/__unnamed_task__/MinReturn                -75.762
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.16092
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.896e+06
__unnamed_task__/AverageDiscountedReturn           -30.5563
__unnamed_task__/AverageReturn                     -58.3877
__unnamed_task__/Iteration                         152
__unnamed_task__/MaxReturn                         -44.8451
__unnamed_task__/MinReturn                         -92.1785
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.72725
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 18:17:21 | [maml_trainer] epoch #153 | Sampling for adapation and meta-testing...
2025-03-31 18:21:31 | [maml_trainer] epoch #153 | Finished meta-testing...
2025-03-31 18:21:31 | [maml_trainer] epoch #153 | Saving snapshot...
2025-03-31 18:21:53 | [maml_trainer] epoch #153 | Saved
2025-03-31 18:21:53 | [maml_trainer] epoch #153 | Time 188014.16 s
2025-03-31 18:21:53 | [maml_trainer] epoch #153 | EpochTime 1247.14 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.5955
Average/AverageReturn                              -57.7686
Average/Iteration                                  153
Average/MaxReturn                                  -43.0356
Average/MinReturn                                  -87.5091
Average/NumEpisodes                                 80
Average/StdReturn                                    9.4078
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0027
GaussianMLPPolicy/KLAfter                            0.00156781
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.91784e-05
GaussianMLPPolicy/LossBefore                        -5.63264e-09
GaussianMLPPolicy/dLoss                             -4.9184e-05
Iteration                                          153
MetaTest/Average/AverageDiscountedReturn           -53.16
MetaTest/Average/AverageReturn                     -53.16
MetaTest/Average/Iteration                         153
MetaTest/Average/MaxReturn                         -46.1446
MetaTest/Average/MinReturn                         -69.4524
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.58988
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -53.16
MetaTest/__unnamed_task__/AverageReturn            -53.16
MetaTest/__unnamed_task__/Iteration                153
MetaTest/__unnamed_task__/MaxReturn                -46.1446
MetaTest/__unnamed_task__/MinReturn                -69.4524
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.58988
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.928e+06
__unnamed_task__/AverageDiscountedReturn           -30.5955
__unnamed_task__/AverageReturn                     -57.7686
__unnamed_task__/Iteration                         153
__unnamed_task__/MaxReturn                         -43.0356
__unnamed_task__/MinReturn                         -87.5091
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.4078
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 18:38:00 | [maml_trainer] epoch #154 | Sampling for adapation and meta-testing...
2025-03-31 18:42:01 | [maml_trainer] epoch #154 | Finished meta-testing...
2025-03-31 18:42:01 | [maml_trainer] epoch #154 | Saving snapshot...
2025-03-31 18:42:22 | [maml_trainer] epoch #154 | Saved
2025-03-31 18:42:22 | [maml_trainer] epoch #154 | Time 189243.50 s
2025-03-31 18:42:22 | [maml_trainer] epoch #154 | EpochTime 1229.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.1203
Average/AverageReturn                              -56.5156
Average/Iteration                                  154
Average/MaxReturn                                  -44.9096
Average/MinReturn                                  -78.15
Average/NumEpisodes                                 80
Average/StdReturn                                    7.7975
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0041
GaussianMLPPolicy/KLAfter                            0.00271995
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.5396e-05
GaussianMLPPolicy/LossBefore                         5.78165e-09
GaussianMLPPolicy/dLoss                             -9.53903e-05
Iteration                                          154
MetaTest/Average/AverageDiscountedReturn           -54.7778
MetaTest/Average/AverageReturn                     -54.7778
MetaTest/Average/Iteration                         154
MetaTest/Average/MaxReturn                         -46.3168
MetaTest/Average/MinReturn                         -70.9584
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.71971
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.7778
MetaTest/__unnamed_task__/AverageReturn            -54.7778
MetaTest/__unnamed_task__/Iteration                154
MetaTest/__unnamed_task__/MaxReturn                -46.3168
MetaTest/__unnamed_task__/MinReturn                -70.9584
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.71971
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.96e+06
__unnamed_task__/AverageDiscountedReturn           -30.1203
__unnamed_task__/AverageReturn                     -56.5156
__unnamed_task__/Iteration                         154
__unnamed_task__/MaxReturn                         -44.9096
__unnamed_task__/MinReturn                         -78.15
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.7975
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 18:58:10 | [maml_trainer] epoch #155 | Sampling for adapation and meta-testing...
2025-03-31 19:02:07 | [maml_trainer] epoch #155 | Finished meta-testing...
2025-03-31 19:02:07 | [maml_trainer] epoch #155 | Saving snapshot...
2025-03-31 19:02:28 | [maml_trainer] epoch #155 | Saved
2025-03-31 19:02:28 | [maml_trainer] epoch #155 | Time 190449.63 s
2025-03-31 19:02:28 | [maml_trainer] epoch #155 | EpochTime 1206.13 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.7968
Average/AverageReturn                              -58.5163
Average/Iteration                                  155
Average/MaxReturn                                  -45.1409
Average/MinReturn                                  -88.7193
Average/NumEpisodes                                 80
Average/StdReturn                                    8.9566
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0062
GaussianMLPPolicy/KLAfter                            0.00330607
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.49981e-05
GaussianMLPPolicy/LossBefore                        -2.98024e-11
GaussianMLPPolicy/dLoss                              8.4998e-05
Iteration                                          155
MetaTest/Average/AverageDiscountedReturn           -58.6227
MetaTest/Average/AverageReturn                     -58.6227
MetaTest/Average/Iteration                         155
MetaTest/Average/MaxReturn                         -48.9226
MetaTest/Average/MinReturn                         -79.6395
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.52775
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -58.6227
MetaTest/__unnamed_task__/AverageReturn            -58.6227
MetaTest/__unnamed_task__/Iteration                155
MetaTest/__unnamed_task__/MaxReturn                -48.9226
MetaTest/__unnamed_task__/MinReturn                -79.6395
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.52775
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.992e+06
__unnamed_task__/AverageDiscountedReturn           -30.7968
__unnamed_task__/AverageReturn                     -58.5163
__unnamed_task__/Iteration                         155
__unnamed_task__/MaxReturn                         -45.1409
__unnamed_task__/MinReturn                         -88.7193
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.9566
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 19:18:48 | [maml_trainer] epoch #156 | Sampling for adapation and meta-testing...
2025-03-31 19:22:56 | [maml_trainer] epoch #156 | Finished meta-testing...
2025-03-31 19:22:56 | [maml_trainer] epoch #156 | Saving snapshot...
2025-03-31 19:23:17 | [maml_trainer] epoch #156 | Saved
2025-03-31 19:23:17 | [maml_trainer] epoch #156 | Time 191698.79 s
2025-03-31 19:23:17 | [maml_trainer] epoch #156 | EpochTime 1249.16 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.1756
Average/AverageReturn                               -58.3361
Average/Iteration                                   156
Average/MaxReturn                                   -43.3323
Average/MinReturn                                  -123.926
Average/NumEpisodes                                  80
Average/StdReturn                                    12.0731
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0083
GaussianMLPPolicy/KLAfter                             0.0028259
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           5.20564e-05
GaussianMLPPolicy/LossBefore                          1.99676e-09
GaussianMLPPolicy/dLoss                              -5.20544e-05
Iteration                                           156
MetaTest/Average/AverageDiscountedReturn            -58.2049
MetaTest/Average/AverageReturn                      -58.2049
MetaTest/Average/Iteration                          156
MetaTest/Average/MaxReturn                          -48.0671
MetaTest/Average/MinReturn                          -73.0003
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            6.60909
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.2049
MetaTest/__unnamed_task__/AverageReturn             -58.2049
MetaTest/__unnamed_task__/Iteration                 156
MetaTest/__unnamed_task__/MaxReturn                 -48.0671
MetaTest/__unnamed_task__/MinReturn                 -73.0003
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   6.60909
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.024e+06
__unnamed_task__/AverageDiscountedReturn            -30.1756
__unnamed_task__/AverageReturn                      -58.3361
__unnamed_task__/Iteration                          156
__unnamed_task__/MaxReturn                          -43.3323
__unnamed_task__/MinReturn                         -123.926
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.0731
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 19:39:41 | [maml_trainer] epoch #157 | Sampling for adapation and meta-testing...
2025-03-31 19:43:52 | [maml_trainer] epoch #157 | Finished meta-testing...
2025-03-31 19:43:52 | [maml_trainer] epoch #157 | Saving snapshot...
2025-03-31 19:44:14 | [maml_trainer] epoch #157 | Saved
2025-03-31 19:44:14 | [maml_trainer] epoch #157 | Time 192955.34 s
2025-03-31 19:44:14 | [maml_trainer] epoch #157 | EpochTime 1256.54 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.9151
Average/AverageReturn                              -56.8199
Average/Iteration                                  157
Average/MaxReturn                                  -44.6608
Average/MinReturn                                  -97.5582
Average/NumEpisodes                                 80
Average/StdReturn                                    8.82719
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0108
GaussianMLPPolicy/KLAfter                            0.00267995
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000101681
GaussianMLPPolicy/LossBefore                        -8.46386e-09
GaussianMLPPolicy/dLoss                              0.000101672
Iteration                                          157
MetaTest/Average/AverageDiscountedReturn           -57.823
MetaTest/Average/AverageReturn                     -57.823
MetaTest/Average/Iteration                         157
MetaTest/Average/MaxReturn                         -43.9207
MetaTest/Average/MinReturn                         -89.1133
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.7657
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.823
MetaTest/__unnamed_task__/AverageReturn            -57.823
MetaTest/__unnamed_task__/Iteration                157
MetaTest/__unnamed_task__/MaxReturn                -43.9207
MetaTest/__unnamed_task__/MinReturn                -89.1133
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.7657
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.056e+06
__unnamed_task__/AverageDiscountedReturn           -29.9151
__unnamed_task__/AverageReturn                     -56.8199
__unnamed_task__/Iteration                         157
__unnamed_task__/MaxReturn                         -44.6608
__unnamed_task__/MinReturn                         -97.5582
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.82719
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 20:00:48 | [maml_trainer] epoch #158 | Sampling for adapation and meta-testing...
2025-03-31 20:04:57 | [maml_trainer] epoch #158 | Finished meta-testing...
2025-03-31 20:04:57 | [maml_trainer] epoch #158 | Saving snapshot...
2025-03-31 20:05:22 | [maml_trainer] epoch #158 | Saved
2025-03-31 20:05:22 | [maml_trainer] epoch #158 | Time 194223.05 s
2025-03-31 20:05:22 | [maml_trainer] epoch #158 | EpochTime 1267.71 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.0799
Average/AverageReturn                              -57.3758
Average/Iteration                                  158
Average/MaxReturn                                  -43.9675
Average/MinReturn                                  -81.0494
Average/NumEpisodes                                 80
Average/StdReturn                                    8.85258
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0137
GaussianMLPPolicy/KLAfter                            0.00175047
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.06378e-05
GaussianMLPPolicy/LossBefore                         4.52995e-09
GaussianMLPPolicy/dLoss                             -4.06333e-05
Iteration                                          158
MetaTest/Average/AverageDiscountedReturn           -56.7606
MetaTest/Average/AverageReturn                     -56.7606
MetaTest/Average/Iteration                         158
MetaTest/Average/MaxReturn                         -42.6009
MetaTest/Average/MinReturn                         -76.1708
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.05777
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.7606
MetaTest/__unnamed_task__/AverageReturn            -56.7606
MetaTest/__unnamed_task__/Iteration                158
MetaTest/__unnamed_task__/MaxReturn                -42.6009
MetaTest/__unnamed_task__/MinReturn                -76.1708
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.05777
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.088e+06
__unnamed_task__/AverageDiscountedReturn           -30.0799
__unnamed_task__/AverageReturn                     -57.3758
__unnamed_task__/Iteration                         158
__unnamed_task__/MaxReturn                         -43.9675
__unnamed_task__/MinReturn                         -81.0494
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.85258
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 20:22:59 | [maml_trainer] epoch #159 | Sampling for adapation and meta-testing...
2025-03-31 20:27:20 | [maml_trainer] epoch #159 | Finished meta-testing...
2025-03-31 20:27:20 | [maml_trainer] epoch #159 | Saving snapshot...
2025-03-31 20:27:41 | [maml_trainer] epoch #159 | Saved
2025-03-31 20:27:41 | [maml_trainer] epoch #159 | Time 195562.61 s
2025-03-31 20:27:41 | [maml_trainer] epoch #159 | EpochTime 1339.55 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.9538
Average/AverageReturn                               -58.1711
Average/Iteration                                   159
Average/MaxReturn                                   -44.6238
Average/MinReturn                                  -149.083
Average/NumEpisodes                                  80
Average/StdReturn                                    12.9818
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0157
GaussianMLPPolicy/KLAfter                             0.000952404
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.85565e-05
GaussianMLPPolicy/LossBefore                         -1.54972e-09
GaussianMLPPolicy/dLoss                              -1.85581e-05
Iteration                                           159
MetaTest/Average/AverageDiscountedReturn            -61.2124
MetaTest/Average/AverageReturn                      -61.2124
MetaTest/Average/Iteration                          159
MetaTest/Average/MaxReturn                          -48.5356
MetaTest/Average/MinReturn                         -115.379
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.4335
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.2124
MetaTest/__unnamed_task__/AverageReturn             -61.2124
MetaTest/__unnamed_task__/Iteration                 159
MetaTest/__unnamed_task__/MaxReturn                 -48.5356
MetaTest/__unnamed_task__/MinReturn                -115.379
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.4335
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.12e+06
__unnamed_task__/AverageDiscountedReturn            -29.9538
__unnamed_task__/AverageReturn                      -58.1711
__unnamed_task__/Iteration                          159
__unnamed_task__/MaxReturn                          -44.6238
__unnamed_task__/MinReturn                         -149.083
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.9818
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 20:45:21 | [maml_trainer] epoch #160 | Sampling for adapation and meta-testing...
2025-03-31 20:49:32 | [maml_trainer] epoch #160 | Finished meta-testing...
2025-03-31 20:49:32 | [maml_trainer] epoch #160 | Saving snapshot...
2025-03-31 20:49:54 | [maml_trainer] epoch #160 | Saved
2025-03-31 20:49:54 | [maml_trainer] epoch #160 | Time 196895.08 s
2025-03-31 20:49:54 | [maml_trainer] epoch #160 | EpochTime 1332.46 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.2323
Average/AverageReturn                               -58.8543
Average/Iteration                                   160
Average/MaxReturn                                   -44.199
Average/MinReturn                                  -167.389
Average/NumEpisodes                                  80
Average/StdReturn                                    15.2007
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0186
GaussianMLPPolicy/KLAfter                             0.00245615
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -4.34488e-05
GaussianMLPPolicy/LossBefore                         -2.5928e-09
GaussianMLPPolicy/dLoss                               4.34462e-05
Iteration                                           160
MetaTest/Average/AverageDiscountedReturn            -58.6019
MetaTest/Average/AverageReturn                      -58.6019
MetaTest/Average/Iteration                          160
MetaTest/Average/MaxReturn                          -47.38
MetaTest/Average/MinReturn                          -81.729
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.23259
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.6019
MetaTest/__unnamed_task__/AverageReturn             -58.6019
MetaTest/__unnamed_task__/Iteration                 160
MetaTest/__unnamed_task__/MaxReturn                 -47.38
MetaTest/__unnamed_task__/MinReturn                 -81.729
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.23259
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.152e+06
__unnamed_task__/AverageDiscountedReturn            -30.2323
__unnamed_task__/AverageReturn                      -58.8543
__unnamed_task__/Iteration                          160
__unnamed_task__/MaxReturn                          -44.199
__unnamed_task__/MinReturn                         -167.389
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.2007
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 21:06:29 | [maml_trainer] epoch #161 | Sampling for adapation and meta-testing...
2025-03-31 21:10:38 | [maml_trainer] epoch #161 | Finished meta-testing...
2025-03-31 21:10:38 | [maml_trainer] epoch #161 | Saving snapshot...
2025-03-31 21:10:59 | [maml_trainer] epoch #161 | Saved
2025-03-31 21:10:59 | [maml_trainer] epoch #161 | Time 198160.21 s
2025-03-31 21:10:59 | [maml_trainer] epoch #161 | EpochTime 1265.13 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.1873
Average/AverageReturn                               -58.0196
Average/Iteration                                   161
Average/MaxReturn                                   -46.9473
Average/MinReturn                                  -117.13
Average/NumEpisodes                                  80
Average/StdReturn                                    12.4444
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0221
GaussianMLPPolicy/KLAfter                             0.00426771
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.35599e-05
GaussianMLPPolicy/LossBefore                         -2.98023e-10
GaussianMLPPolicy/dLoss                               3.35596e-05
Iteration                                           161
MetaTest/Average/AverageDiscountedReturn            -54.9828
MetaTest/Average/AverageReturn                      -54.9828
MetaTest/Average/Iteration                          161
MetaTest/Average/MaxReturn                          -43.3815
MetaTest/Average/MinReturn                          -65.1769
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.39847
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.9828
MetaTest/__unnamed_task__/AverageReturn             -54.9828
MetaTest/__unnamed_task__/Iteration                 161
MetaTest/__unnamed_task__/MaxReturn                 -43.3815
MetaTest/__unnamed_task__/MinReturn                 -65.1769
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.39847
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.184e+06
__unnamed_task__/AverageDiscountedReturn            -30.1873
__unnamed_task__/AverageReturn                      -58.0196
__unnamed_task__/Iteration                          161
__unnamed_task__/MaxReturn                          -46.9473
__unnamed_task__/MinReturn                         -117.13
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.4444
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 21:27:30 | [maml_trainer] epoch #162 | Sampling for adapation and meta-testing...
2025-03-31 21:31:39 | [maml_trainer] epoch #162 | Finished meta-testing...
2025-03-31 21:31:39 | [maml_trainer] epoch #162 | Saving snapshot...
2025-03-31 21:32:00 | [maml_trainer] epoch #162 | Saved
2025-03-31 21:32:00 | [maml_trainer] epoch #162 | Time 199421.16 s
2025-03-31 21:32:00 | [maml_trainer] epoch #162 | EpochTime 1260.94 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.7141
Average/AverageReturn                               -56.0226
Average/Iteration                                   162
Average/MaxReturn                                   -44.5928
Average/MinReturn                                  -133.956
Average/NumEpisodes                                  80
Average/StdReturn                                    10.697
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0261
GaussianMLPPolicy/KLAfter                             0.00340498
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           8.34919e-05
GaussianMLPPolicy/LossBefore                         -1.04308e-09
GaussianMLPPolicy/dLoss                              -8.34929e-05
Iteration                                           162
MetaTest/Average/AverageDiscountedReturn            -54.8744
MetaTest/Average/AverageReturn                      -54.8744
MetaTest/Average/Iteration                          162
MetaTest/Average/MaxReturn                          -47.5677
MetaTest/Average/MinReturn                          -70.3938
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            6.19286
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.8744
MetaTest/__unnamed_task__/AverageReturn             -54.8744
MetaTest/__unnamed_task__/Iteration                 162
MetaTest/__unnamed_task__/MaxReturn                 -47.5677
MetaTest/__unnamed_task__/MinReturn                 -70.3938
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   6.19286
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.216e+06
__unnamed_task__/AverageDiscountedReturn            -29.7141
__unnamed_task__/AverageReturn                      -56.0226
__unnamed_task__/Iteration                          162
__unnamed_task__/MaxReturn                          -44.5928
__unnamed_task__/MinReturn                         -133.956
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.697
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 21:48:21 | [maml_trainer] epoch #163 | Sampling for adapation and meta-testing...
2025-03-31 21:52:19 | [maml_trainer] epoch #163 | Finished meta-testing...
2025-03-31 21:52:19 | [maml_trainer] epoch #163 | Saving snapshot...
2025-03-31 21:52:40 | [maml_trainer] epoch #163 | Saved
2025-03-31 21:52:40 | [maml_trainer] epoch #163 | Time 200661.35 s
2025-03-31 21:52:40 | [maml_trainer] epoch #163 | EpochTime 1240.19 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.3245
Average/AverageReturn                              -55.7627
Average/Iteration                                  163
Average/MaxReturn                                  -43.7278
Average/MinReturn                                  -94.29
Average/NumEpisodes                                 80
Average/StdReturn                                    8.01543
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0292
GaussianMLPPolicy/KLAfter                            0.00208566
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000144961
GaussianMLPPolicy/LossBefore                        -7.15256e-10
GaussianMLPPolicy/dLoss                              0.00014496
Iteration                                          163
MetaTest/Average/AverageDiscountedReturn           -53.2153
MetaTest/Average/AverageReturn                     -53.2153
MetaTest/Average/Iteration                         163
MetaTest/Average/MaxReturn                         -43.0135
MetaTest/Average/MinReturn                         -60.7055
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.5526
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -53.2153
MetaTest/__unnamed_task__/AverageReturn            -53.2153
MetaTest/__unnamed_task__/Iteration                163
MetaTest/__unnamed_task__/MaxReturn                -43.0135
MetaTest/__unnamed_task__/MinReturn                -60.7055
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.5526
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.248e+06
__unnamed_task__/AverageDiscountedReturn           -29.3245
__unnamed_task__/AverageReturn                     -55.7627
__unnamed_task__/Iteration                         163
__unnamed_task__/MaxReturn                         -43.7278
__unnamed_task__/MinReturn                         -94.29
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.01543
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 22:09:50 | [maml_trainer] epoch #164 | Sampling for adapation and meta-testing...
2025-03-31 22:14:08 | [maml_trainer] epoch #164 | Finished meta-testing...
2025-03-31 22:14:08 | [maml_trainer] epoch #164 | Saving snapshot...
2025-03-31 22:14:30 | [maml_trainer] epoch #164 | Saved
2025-03-31 22:14:30 | [maml_trainer] epoch #164 | Time 201971.17 s
2025-03-31 22:14:30 | [maml_trainer] epoch #164 | EpochTime 1309.82 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.271
Average/AverageReturn                               -54.9792
Average/Iteration                                   164
Average/MaxReturn                                   -45.4473
Average/MinReturn                                   -84.5784
Average/NumEpisodes                                  80
Average/StdReturn                                     7.24314
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0306
GaussianMLPPolicy/KLAfter                             0.00296408
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.43213e-05
GaussianMLPPolicy/LossBefore                          4.11272e-09
GaussianMLPPolicy/dLoss                               1.43254e-05
Iteration                                           164
MetaTest/Average/AverageDiscountedReturn            -61.3146
MetaTest/Average/AverageReturn                      -61.3146
MetaTest/Average/Iteration                          164
MetaTest/Average/MaxReturn                          -49.3103
MetaTest/Average/MinReturn                         -104.087
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.7919
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.3146
MetaTest/__unnamed_task__/AverageReturn             -61.3146
MetaTest/__unnamed_task__/Iteration                 164
MetaTest/__unnamed_task__/MaxReturn                 -49.3103
MetaTest/__unnamed_task__/MinReturn                -104.087
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.7919
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.28e+06
__unnamed_task__/AverageDiscountedReturn            -29.271
__unnamed_task__/AverageReturn                      -54.9792
__unnamed_task__/Iteration                          164
__unnamed_task__/MaxReturn                          -45.4473
__unnamed_task__/MinReturn                          -84.5784
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            7.24314
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 22:31:05 | [maml_trainer] epoch #165 | Sampling for adapation and meta-testing...
2025-03-31 22:35:30 | [maml_trainer] epoch #165 | Finished meta-testing...
2025-03-31 22:35:30 | [maml_trainer] epoch #165 | Saving snapshot...
2025-03-31 22:35:51 | [maml_trainer] epoch #165 | Saved
2025-03-31 22:35:51 | [maml_trainer] epoch #165 | Time 203252.38 s
2025-03-31 22:35:51 | [maml_trainer] epoch #165 | EpochTime 1281.21 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.0663
Average/AverageReturn                               -55.6254
Average/Iteration                                   165
Average/MaxReturn                                   -42.7305
Average/MinReturn                                  -132.187
Average/NumEpisodes                                  80
Average/StdReturn                                    10.5201
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0292
GaussianMLPPolicy/KLAfter                             0.00261323
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000150755
GaussianMLPPolicy/LossBefore                          5.21541e-09
GaussianMLPPolicy/dLoss                               0.00015076
Iteration                                           165
MetaTest/Average/AverageDiscountedReturn            -55.2146
MetaTest/Average/AverageReturn                      -55.2146
MetaTest/Average/Iteration                          165
MetaTest/Average/MaxReturn                          -48.0077
MetaTest/Average/MinReturn                          -71.0919
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            4.97114
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -55.2146
MetaTest/__unnamed_task__/AverageReturn             -55.2146
MetaTest/__unnamed_task__/Iteration                 165
MetaTest/__unnamed_task__/MaxReturn                 -48.0077
MetaTest/__unnamed_task__/MinReturn                 -71.0919
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   4.97114
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.312e+06
__unnamed_task__/AverageDiscountedReturn            -29.0663
__unnamed_task__/AverageReturn                      -55.6254
__unnamed_task__/Iteration                          165
__unnamed_task__/MaxReturn                          -42.7305
__unnamed_task__/MinReturn                         -132.187
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.5201
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 22:52:40 | [maml_trainer] epoch #166 | Sampling for adapation and meta-testing...
2025-03-31 22:56:40 | [maml_trainer] epoch #166 | Finished meta-testing...
2025-03-31 22:56:40 | [maml_trainer] epoch #166 | Saving snapshot...
2025-03-31 22:57:01 | [maml_trainer] epoch #166 | Saved
2025-03-31 22:57:01 | [maml_trainer] epoch #166 | Time 204522.25 s
2025-03-31 22:57:01 | [maml_trainer] epoch #166 | EpochTime 1269.86 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.1016
Average/AverageReturn                               -54.8418
Average/Iteration                                   166
Average/MaxReturn                                   -44.2151
Average/MinReturn                                  -109.529
Average/NumEpisodes                                  80
Average/StdReturn                                     8.5926
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0297
GaussianMLPPolicy/KLAfter                             0.00363963
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.20415e-06
GaussianMLPPolicy/LossBefore                          6.97374e-09
GaussianMLPPolicy/dLoss                              -4.19718e-06
Iteration                                           166
MetaTest/Average/AverageDiscountedReturn            -53.4605
MetaTest/Average/AverageReturn                      -53.4605
MetaTest/Average/Iteration                          166
MetaTest/Average/MaxReturn                          -47.2877
MetaTest/Average/MinReturn                          -60.6549
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            3.54993
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -53.4605
MetaTest/__unnamed_task__/AverageReturn             -53.4605
MetaTest/__unnamed_task__/Iteration                 166
MetaTest/__unnamed_task__/MaxReturn                 -47.2877
MetaTest/__unnamed_task__/MinReturn                 -60.6549
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   3.54993
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.344e+06
__unnamed_task__/AverageDiscountedReturn            -29.1016
__unnamed_task__/AverageReturn                      -54.8418
__unnamed_task__/Iteration                          166
__unnamed_task__/MaxReturn                          -44.2151
__unnamed_task__/MinReturn                         -109.529
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.5926
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 23:13:58 | [maml_trainer] epoch #167 | Sampling for adapation and meta-testing...
2025-03-31 23:18:15 | [maml_trainer] epoch #167 | Finished meta-testing...
2025-03-31 23:18:15 | [maml_trainer] epoch #167 | Saving snapshot...
2025-03-31 23:18:34 | [maml_trainer] epoch #167 | Saved
2025-03-31 23:18:34 | [maml_trainer] epoch #167 | Time 205816.01 s
2025-03-31 23:18:34 | [maml_trainer] epoch #167 | EpochTime 1293.76 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.9621
Average/AverageReturn                               -54.6901
Average/Iteration                                   167
Average/MaxReturn                                   -46.2991
Average/MinReturn                                   -85.3617
Average/NumEpisodes                                  80
Average/StdReturn                                     6.19337
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0309
GaussianMLPPolicy/KLAfter                             0.00364906
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           9.6012e-05
GaussianMLPPolicy/LossBefore                          3.75509e-09
GaussianMLPPolicy/dLoss                              -9.60082e-05
Iteration                                           167
MetaTest/Average/AverageDiscountedReturn            -58.6115
MetaTest/Average/AverageReturn                      -58.6115
MetaTest/Average/Iteration                          167
MetaTest/Average/MaxReturn                          -48.0617
MetaTest/Average/MinReturn                         -107.493
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           13.9504
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.6115
MetaTest/__unnamed_task__/AverageReturn             -58.6115
MetaTest/__unnamed_task__/Iteration                 167
MetaTest/__unnamed_task__/MaxReturn                 -48.0617
MetaTest/__unnamed_task__/MinReturn                -107.493
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  13.9504
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.376e+06
__unnamed_task__/AverageDiscountedReturn            -28.9621
__unnamed_task__/AverageReturn                      -54.6901
__unnamed_task__/Iteration                          167
__unnamed_task__/MaxReturn                          -46.2991
__unnamed_task__/MinReturn                          -85.3617
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            6.19337
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-03-31 23:34:56 | [maml_trainer] epoch #168 | Sampling for adapation and meta-testing...
2025-03-31 23:39:10 | [maml_trainer] epoch #168 | Finished meta-testing...
2025-03-31 23:39:10 | [maml_trainer] epoch #168 | Saving snapshot...
2025-03-31 23:39:33 | [maml_trainer] epoch #168 | Saved
2025-03-31 23:39:33 | [maml_trainer] epoch #168 | Time 207074.36 s
2025-03-31 23:39:33 | [maml_trainer] epoch #168 | EpochTime 1258.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.2344
Average/AverageReturn                              -54.3826
Average/Iteration                                  168
Average/MaxReturn                                  -44.9383
Average/MinReturn                                  -73.3169
Average/NumEpisodes                                 80
Average/StdReturn                                    4.90963
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0312
GaussianMLPPolicy/KLAfter                            0.00522236
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.26799e-05
GaussianMLPPolicy/LossBefore                        -7.15256e-10
GaussianMLPPolicy/dLoss                             -5.26806e-05
Iteration                                          168
MetaTest/Average/AverageDiscountedReturn           -55.0298
MetaTest/Average/AverageReturn                     -55.0298
MetaTest/Average/Iteration                         168
MetaTest/Average/MaxReturn                         -46.8838
MetaTest/Average/MinReturn                         -64.6599
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.72086
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.0298
MetaTest/__unnamed_task__/AverageReturn            -55.0298
MetaTest/__unnamed_task__/Iteration                168
MetaTest/__unnamed_task__/MaxReturn                -46.8838
MetaTest/__unnamed_task__/MinReturn                -64.6599
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.72086
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.408e+06
__unnamed_task__/AverageDiscountedReturn           -29.2344
__unnamed_task__/AverageReturn                     -54.3826
__unnamed_task__/Iteration                         168
__unnamed_task__/MaxReturn                         -44.9383
__unnamed_task__/MinReturn                         -73.3169
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.90963
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-03-31 23:56:39 | [maml_trainer] epoch #169 | Sampling for adapation and meta-testing...
2025-04-01 00:00:54 | [maml_trainer] epoch #169 | Finished meta-testing...
2025-04-01 00:00:54 | [maml_trainer] epoch #169 | Saving snapshot...
2025-04-01 00:01:16 | [maml_trainer] epoch #169 | Saved
2025-04-01 00:01:16 | [maml_trainer] epoch #169 | Time 208377.07 s
2025-04-01 00:01:16 | [maml_trainer] epoch #169 | EpochTime 1302.71 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.6022
Average/AverageReturn                               -57.2476
Average/Iteration                                   169
Average/MaxReturn                                   -47.146
Average/MinReturn                                   -91.0797
Average/NumEpisodes                                  80
Average/StdReturn                                     8.2313
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0313
GaussianMLPPolicy/KLAfter                             0.00407404
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           8.91874e-05
GaussianMLPPolicy/LossBefore                         -5.48363e-09
GaussianMLPPolicy/dLoss                              -8.91929e-05
Iteration                                           169
MetaTest/Average/AverageDiscountedReturn            -57.7978
MetaTest/Average/AverageReturn                      -57.7978
MetaTest/Average/Iteration                          169
MetaTest/Average/MaxReturn                          -46.9585
MetaTest/Average/MinReturn                         -116.278
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.8214
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.7978
MetaTest/__unnamed_task__/AverageReturn             -57.7978
MetaTest/__unnamed_task__/Iteration                 169
MetaTest/__unnamed_task__/MaxReturn                 -46.9585
MetaTest/__unnamed_task__/MinReturn                -116.278
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.8214
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.44e+06
__unnamed_task__/AverageDiscountedReturn            -29.6022
__unnamed_task__/AverageReturn                      -57.2476
__unnamed_task__/Iteration                          169
__unnamed_task__/MaxReturn                          -47.146
__unnamed_task__/MinReturn                          -91.0797
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.2313
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 00:19:00 | [maml_trainer] epoch #170 | Sampling for adapation and meta-testing...
2025-04-01 00:23:16 | [maml_trainer] epoch #170 | Finished meta-testing...
2025-04-01 00:23:16 | [maml_trainer] epoch #170 | Saving snapshot...
2025-04-01 00:23:37 | [maml_trainer] epoch #170 | Saved
2025-04-01 00:23:37 | [maml_trainer] epoch #170 | Time 209718.71 s
2025-04-01 00:23:37 | [maml_trainer] epoch #170 | EpochTime 1341.64 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.0408
Average/AverageReturn                               -58.4174
Average/Iteration                                   170
Average/MaxReturn                                   -48.3974
Average/MinReturn                                  -109.147
Average/NumEpisodes                                  80
Average/StdReturn                                    10.256
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0327
GaussianMLPPolicy/KLAfter                             0.00384137
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           0.000124837
GaussianMLPPolicy/LossBefore                         -6.73532e-09
GaussianMLPPolicy/dLoss                              -0.000124844
Iteration                                           170
MetaTest/Average/AverageDiscountedReturn            -61.3687
MetaTest/Average/AverageReturn                      -61.3687
MetaTest/Average/Iteration                          170
MetaTest/Average/MaxReturn                          -52.5355
MetaTest/Average/MinReturn                          -84.9304
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.9024
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.3687
MetaTest/__unnamed_task__/AverageReturn             -61.3687
MetaTest/__unnamed_task__/Iteration                 170
MetaTest/__unnamed_task__/MaxReturn                 -52.5355
MetaTest/__unnamed_task__/MinReturn                 -84.9304
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.9024
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.472e+06
__unnamed_task__/AverageDiscountedReturn            -30.0408
__unnamed_task__/AverageReturn                      -58.4174
__unnamed_task__/Iteration                          170
__unnamed_task__/MaxReturn                          -48.3974
__unnamed_task__/MinReturn                         -109.147
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.256
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 00:40:04 | [maml_trainer] epoch #171 | Sampling for adapation and meta-testing...
2025-04-01 00:44:03 | [maml_trainer] epoch #171 | Finished meta-testing...
2025-04-01 00:44:03 | [maml_trainer] epoch #171 | Saving snapshot...
2025-04-01 00:44:23 | [maml_trainer] epoch #171 | Saved
2025-04-01 00:44:23 | [maml_trainer] epoch #171 | Time 210964.52 s
2025-04-01 00:44:23 | [maml_trainer] epoch #171 | EpochTime 1245.80 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.2561
Average/AverageReturn                               -58.7714
Average/Iteration                                   171
Average/MaxReturn                                   -46.3737
Average/MinReturn                                  -156.948
Average/NumEpisodes                                  80
Average/StdReturn                                    12.5001
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0314
GaussianMLPPolicy/KLAfter                             0.00450374
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -2.90306e-05
GaussianMLPPolicy/LossBefore                          2.02656e-09
GaussianMLPPolicy/dLoss                               2.90326e-05
Iteration                                           171
MetaTest/Average/AverageDiscountedReturn            -62.2151
MetaTest/Average/AverageReturn                      -62.2151
MetaTest/Average/Iteration                          171
MetaTest/Average/MaxReturn                          -50.5829
MetaTest/Average/MinReturn                          -82.8796
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.08447
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.2151
MetaTest/__unnamed_task__/AverageReturn             -62.2151
MetaTest/__unnamed_task__/Iteration                 171
MetaTest/__unnamed_task__/MaxReturn                 -50.5829
MetaTest/__unnamed_task__/MinReturn                 -82.8796
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.08447
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.504e+06
__unnamed_task__/AverageDiscountedReturn            -30.2561
__unnamed_task__/AverageReturn                      -58.7714
__unnamed_task__/Iteration                          171
__unnamed_task__/MaxReturn                          -46.3737
__unnamed_task__/MinReturn                         -156.948
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.5001
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 01:00:14 | [maml_trainer] epoch #172 | Sampling for adapation and meta-testing...
2025-04-01 01:04:25 | [maml_trainer] epoch #172 | Finished meta-testing...
2025-04-01 01:04:25 | [maml_trainer] epoch #172 | Saving snapshot...
2025-04-01 01:04:47 | [maml_trainer] epoch #172 | Saved
2025-04-01 01:04:47 | [maml_trainer] epoch #172 | Time 212188.73 s
2025-04-01 01:04:47 | [maml_trainer] epoch #172 | EpochTime 1224.21 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.5802
Average/AverageReturn                              -59.5675
Average/Iteration                                  172
Average/MaxReturn                                  -47.9568
Average/MinReturn                                  -75.2239
Average/NumEpisodes                                 80
Average/StdReturn                                    6.80185
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0287
GaussianMLPPolicy/KLAfter                            0.00273185
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.69013e-05
GaussianMLPPolicy/LossBefore                        -1.66893e-08
GaussianMLPPolicy/dLoss                             -2.6918e-05
Iteration                                          172
MetaTest/Average/AverageDiscountedReturn           -60.4465
MetaTest/Average/AverageReturn                     -60.4465
MetaTest/Average/Iteration                         172
MetaTest/Average/MaxReturn                         -52.1798
MetaTest/Average/MinReturn                         -81.1998
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.20595
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -60.4465
MetaTest/__unnamed_task__/AverageReturn            -60.4465
MetaTest/__unnamed_task__/Iteration                172
MetaTest/__unnamed_task__/MaxReturn                -52.1798
MetaTest/__unnamed_task__/MinReturn                -81.1998
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.20595
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.536e+06
__unnamed_task__/AverageDiscountedReturn           -30.5802
__unnamed_task__/AverageReturn                     -59.5675
__unnamed_task__/Iteration                         172
__unnamed_task__/MaxReturn                         -47.9568
__unnamed_task__/MinReturn                         -75.2239
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.80185
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 01:21:30 | [maml_trainer] epoch #173 | Sampling for adapation and meta-testing...
2025-04-01 01:25:38 | [maml_trainer] epoch #173 | Finished meta-testing...
2025-04-01 01:25:38 | [maml_trainer] epoch #173 | Saving snapshot...
2025-04-01 01:25:59 | [maml_trainer] epoch #173 | Saved
2025-04-01 01:25:59 | [maml_trainer] epoch #173 | Time 213460.09 s
2025-04-01 01:25:59 | [maml_trainer] epoch #173 | EpochTime 1271.36 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.108
Average/AverageReturn                               -62.3749
Average/Iteration                                   173
Average/MaxReturn                                   -49.0378
Average/MinReturn                                   -96.7658
Average/NumEpisodes                                  80
Average/StdReturn                                     9.11171
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.025
GaussianMLPPolicy/KLAfter                             0.00477671
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.01812e-05
GaussianMLPPolicy/LossBefore                         -2.26498e-09
GaussianMLPPolicy/dLoss                              -2.01835e-05
Iteration                                           173
MetaTest/Average/AverageDiscountedReturn            -66.4876
MetaTest/Average/AverageReturn                      -66.4876
MetaTest/Average/Iteration                          173
MetaTest/Average/MaxReturn                          -51.2182
MetaTest/Average/MinReturn                         -104.003
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           12.4558
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -66.4876
MetaTest/__unnamed_task__/AverageReturn             -66.4876
MetaTest/__unnamed_task__/Iteration                 173
MetaTest/__unnamed_task__/MaxReturn                 -51.2182
MetaTest/__unnamed_task__/MinReturn                -104.003
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  12.4558
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.568e+06
__unnamed_task__/AverageDiscountedReturn            -31.108
__unnamed_task__/AverageReturn                      -62.3749
__unnamed_task__/Iteration                          173
__unnamed_task__/MaxReturn                          -49.0378
__unnamed_task__/MinReturn                          -96.7658
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.11171
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 01:41:50 | [maml_trainer] epoch #174 | Sampling for adapation and meta-testing...
2025-04-01 01:45:48 | [maml_trainer] epoch #174 | Finished meta-testing...
2025-04-01 01:45:48 | [maml_trainer] epoch #174 | Saving snapshot...
2025-04-01 01:46:09 | [maml_trainer] epoch #174 | Saved
2025-04-01 01:46:09 | [maml_trainer] epoch #174 | Time 214670.39 s
2025-04-01 01:46:09 | [maml_trainer] epoch #174 | EpochTime 1210.29 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.5
Average/AverageReturn                               -62.6695
Average/Iteration                                   174
Average/MaxReturn                                   -49.7792
Average/MinReturn                                   -79.209
Average/NumEpisodes                                  80
Average/StdReturn                                     7.18348
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0216
GaussianMLPPolicy/KLAfter                             0.00291938
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.18009e-05
GaussianMLPPolicy/LossBefore                         -3.27826e-09
GaussianMLPPolicy/dLoss                              -6.18042e-05
Iteration                                           174
MetaTest/Average/AverageDiscountedReturn            -63.7065
MetaTest/Average/AverageReturn                      -63.7065
MetaTest/Average/Iteration                          174
MetaTest/Average/MaxReturn                          -51.7967
MetaTest/Average/MinReturn                         -128.422
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           16.1201
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -63.7065
MetaTest/__unnamed_task__/AverageReturn             -63.7065
MetaTest/__unnamed_task__/Iteration                 174
MetaTest/__unnamed_task__/MaxReturn                 -51.7967
MetaTest/__unnamed_task__/MinReturn                -128.422
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  16.1201
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.6e+06
__unnamed_task__/AverageDiscountedReturn            -31.5
__unnamed_task__/AverageReturn                      -62.6695
__unnamed_task__/Iteration                          174
__unnamed_task__/MaxReturn                          -49.7792
__unnamed_task__/MinReturn                          -79.209
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            7.18348
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 02:02:06 | [maml_trainer] epoch #175 | Sampling for adapation and meta-testing...
2025-04-01 02:06:03 | [maml_trainer] epoch #175 | Finished meta-testing...
2025-04-01 02:06:03 | [maml_trainer] epoch #175 | Saving snapshot...
2025-04-01 02:06:23 | [maml_trainer] epoch #175 | Saved
2025-04-01 02:06:23 | [maml_trainer] epoch #175 | Time 215884.22 s
2025-04-01 02:06:23 | [maml_trainer] epoch #175 | EpochTime 1213.82 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.1182
Average/AverageReturn                               -61.5495
Average/Iteration                                   175
Average/MaxReturn                                   -47.0552
Average/MinReturn                                  -135.364
Average/NumEpisodes                                  80
Average/StdReturn                                    11.6341
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0189
GaussianMLPPolicy/KLAfter                             0.00203766
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.74716e-05
GaussianMLPPolicy/LossBefore                          4.17232e-10
GaussianMLPPolicy/dLoss                               1.7472e-05
Iteration                                           175
MetaTest/Average/AverageDiscountedReturn            -62.5932
MetaTest/Average/AverageReturn                      -62.5932
MetaTest/Average/Iteration                          175
MetaTest/Average/MaxReturn                          -52.9407
MetaTest/Average/MinReturn                          -72.111
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.45626
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.5932
MetaTest/__unnamed_task__/AverageReturn             -62.5932
MetaTest/__unnamed_task__/Iteration                 175
MetaTest/__unnamed_task__/MaxReturn                 -52.9407
MetaTest/__unnamed_task__/MinReturn                 -72.111
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.45626
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.632e+06
__unnamed_task__/AverageDiscountedReturn            -31.1182
__unnamed_task__/AverageReturn                      -61.5495
__unnamed_task__/Iteration                          175
__unnamed_task__/MaxReturn                          -47.0552
__unnamed_task__/MinReturn                         -135.364
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.6341
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 02:22:10 | [maml_trainer] epoch #176 | Sampling for adapation and meta-testing...
2025-04-01 02:26:12 | [maml_trainer] epoch #176 | Finished meta-testing...
2025-04-01 02:26:12 | [maml_trainer] epoch #176 | Saving snapshot...
2025-04-01 02:26:33 | [maml_trainer] epoch #176 | Saved
2025-04-01 02:26:33 | [maml_trainer] epoch #176 | Time 217094.55 s
2025-04-01 02:26:33 | [maml_trainer] epoch #176 | EpochTime 1210.33 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -30.7525
Average/AverageReturn                              -61.026
Average/Iteration                                  176
Average/MaxReturn                                  -45.9188
Average/MinReturn                                  -88.1076
Average/NumEpisodes                                 80
Average/StdReturn                                    7.40869
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0169
GaussianMLPPolicy/KLAfter                            0.00155842
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.91698e-05
GaussianMLPPolicy/LossBefore                         9.53674e-10
GaussianMLPPolicy/dLoss                             -3.91689e-05
Iteration                                          176
MetaTest/Average/AverageDiscountedReturn           -61.2007
MetaTest/Average/AverageReturn                     -61.2007
MetaTest/Average/Iteration                         176
MetaTest/Average/MaxReturn                         -52.1201
MetaTest/Average/MinReturn                         -76.1733
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.15041
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -61.2007
MetaTest/__unnamed_task__/AverageReturn            -61.2007
MetaTest/__unnamed_task__/Iteration                176
MetaTest/__unnamed_task__/MaxReturn                -52.1201
MetaTest/__unnamed_task__/MinReturn                -76.1733
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.15041
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.664e+06
__unnamed_task__/AverageDiscountedReturn           -30.7525
__unnamed_task__/AverageReturn                     -61.026
__unnamed_task__/Iteration                         176
__unnamed_task__/MaxReturn                         -45.9188
__unnamed_task__/MinReturn                         -88.1076
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.40869
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 02:42:20 | [maml_trainer] epoch #177 | Sampling for adapation and meta-testing...
2025-04-01 02:46:20 | [maml_trainer] epoch #177 | Finished meta-testing...
2025-04-01 02:46:20 | [maml_trainer] epoch #177 | Saving snapshot...
2025-04-01 02:46:41 | [maml_trainer] epoch #177 | Saved
2025-04-01 02:46:41 | [maml_trainer] epoch #177 | Time 218302.25 s
2025-04-01 02:46:41 | [maml_trainer] epoch #177 | EpochTime 1207.70 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.4933
Average/AverageReturn                               -64.2011
Average/Iteration                                   177
Average/MaxReturn                                   -50.1548
Average/MinReturn                                  -137.62
Average/NumEpisodes                                  80
Average/StdReturn                                    12.0977
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0157
GaussianMLPPolicy/KLAfter                             0.00186481
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           9.54863e-05
GaussianMLPPolicy/LossBefore                         -6.79493e-09
GaussianMLPPolicy/dLoss                              -9.54931e-05
Iteration                                           177
MetaTest/Average/AverageDiscountedReturn            -62.5483
MetaTest/Average/AverageReturn                      -62.5483
MetaTest/Average/Iteration                          177
MetaTest/Average/MaxReturn                          -48.5671
MetaTest/Average/MinReturn                          -83.2139
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.74959
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.5483
MetaTest/__unnamed_task__/AverageReturn             -62.5483
MetaTest/__unnamed_task__/Iteration                 177
MetaTest/__unnamed_task__/MaxReturn                 -48.5671
MetaTest/__unnamed_task__/MinReturn                 -83.2139
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.74959
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.696e+06
__unnamed_task__/AverageDiscountedReturn            -31.4933
__unnamed_task__/AverageReturn                      -64.2011
__unnamed_task__/Iteration                          177
__unnamed_task__/MaxReturn                          -50.1548
__unnamed_task__/MinReturn                         -137.62
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.0977
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 03:02:45 | [maml_trainer] epoch #178 | Sampling for adapation and meta-testing...
2025-04-01 03:06:45 | [maml_trainer] epoch #178 | Finished meta-testing...
2025-04-01 03:06:45 | [maml_trainer] epoch #178 | Saving snapshot...
2025-04-01 03:07:06 | [maml_trainer] epoch #178 | Saved
2025-04-01 03:07:06 | [maml_trainer] epoch #178 | Time 219527.81 s
2025-04-01 03:07:06 | [maml_trainer] epoch #178 | EpochTime 1225.56 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.76
Average/AverageReturn                               -65.1411
Average/Iteration                                   178
Average/MaxReturn                                   -51.7555
Average/MinReturn                                  -122.431
Average/NumEpisodes                                  80
Average/StdReturn                                    11.0339
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0137
GaussianMLPPolicy/KLAfter                             0.00262959
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.8784e-05
GaussianMLPPolicy/LossBefore                         -9.38773e-09
GaussianMLPPolicy/dLoss                               5.87746e-05
Iteration                                           178
MetaTest/Average/AverageDiscountedReturn            -62.6185
MetaTest/Average/AverageReturn                      -62.6185
MetaTest/Average/Iteration                          178
MetaTest/Average/MaxReturn                          -51.0373
MetaTest/Average/MinReturn                          -91.5659
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.0927
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.6185
MetaTest/__unnamed_task__/AverageReturn             -62.6185
MetaTest/__unnamed_task__/Iteration                 178
MetaTest/__unnamed_task__/MaxReturn                 -51.0373
MetaTest/__unnamed_task__/MinReturn                 -91.5659
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.0927
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.728e+06
__unnamed_task__/AverageDiscountedReturn            -31.76
__unnamed_task__/AverageReturn                      -65.1411
__unnamed_task__/Iteration                          178
__unnamed_task__/MaxReturn                          -51.7555
__unnamed_task__/MinReturn                         -122.431
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.0339
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 03:23:17 | [maml_trainer] epoch #179 | Sampling for adapation and meta-testing...
2025-04-01 03:27:19 | [maml_trainer] epoch #179 | Finished meta-testing...
2025-04-01 03:27:19 | [maml_trainer] epoch #179 | Saving snapshot...
2025-04-01 03:27:39 | [maml_trainer] epoch #179 | Saved
2025-04-01 03:27:39 | [maml_trainer] epoch #179 | Time 220761.01 s
2025-04-01 03:27:39 | [maml_trainer] epoch #179 | EpochTime 1233.19 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.9879
Average/AverageReturn                               -62.3898
Average/Iteration                                   179
Average/MaxReturn                                   -46.6122
Average/MinReturn                                  -116.745
Average/NumEpisodes                                  80
Average/StdReturn                                    11.6279
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0119
GaussianMLPPolicy/KLAfter                             0.0024938
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -2.18121e-05
GaussianMLPPolicy/LossBefore                         -1.3411e-08
GaussianMLPPolicy/dLoss                               2.17987e-05
Iteration                                           179
MetaTest/Average/AverageDiscountedReturn            -66.5371
MetaTest/Average/AverageReturn                      -66.5371
MetaTest/Average/Iteration                          179
MetaTest/Average/MaxReturn                          -52.3285
MetaTest/Average/MinReturn                         -148.069
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           20.627
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -66.5371
MetaTest/__unnamed_task__/AverageReturn             -66.5371
MetaTest/__unnamed_task__/Iteration                 179
MetaTest/__unnamed_task__/MaxReturn                 -52.3285
MetaTest/__unnamed_task__/MinReturn                -148.069
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  20.627
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.76e+06
__unnamed_task__/AverageDiscountedReturn            -30.9879
__unnamed_task__/AverageReturn                      -62.3898
__unnamed_task__/Iteration                          179
__unnamed_task__/MaxReturn                          -46.6122
__unnamed_task__/MinReturn                         -116.745
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.6279
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 03:43:58 | [maml_trainer] epoch #180 | Sampling for adapation and meta-testing...
2025-04-01 03:48:00 | [maml_trainer] epoch #180 | Finished meta-testing...
2025-04-01 03:48:00 | [maml_trainer] epoch #180 | Saving snapshot...
2025-04-01 03:48:20 | [maml_trainer] epoch #180 | Saved
2025-04-01 03:48:20 | [maml_trainer] epoch #180 | Time 222001.55 s
2025-04-01 03:48:20 | [maml_trainer] epoch #180 | EpochTime 1240.54 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.9294
Average/AverageReturn                               -61.8016
Average/Iteration                                   180
Average/MaxReturn                                   -48.0692
Average/MinReturn                                  -122.297
Average/NumEpisodes                                  80
Average/StdReturn                                    10.1394
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0098
GaussianMLPPolicy/KLAfter                             0.00305026
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -6.96008e-05
GaussianMLPPolicy/LossBefore                         -1.40369e-08
GaussianMLPPolicy/dLoss                               6.95868e-05
Iteration                                           180
MetaTest/Average/AverageDiscountedReturn            -57.7082
MetaTest/Average/AverageReturn                      -57.7082
MetaTest/Average/Iteration                          180
MetaTest/Average/MaxReturn                          -48.6365
MetaTest/Average/MinReturn                          -76.3925
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.03204
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.7082
MetaTest/__unnamed_task__/AverageReturn             -57.7082
MetaTest/__unnamed_task__/Iteration                 180
MetaTest/__unnamed_task__/MaxReturn                 -48.6365
MetaTest/__unnamed_task__/MinReturn                 -76.3925
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.03204
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.792e+06
__unnamed_task__/AverageDiscountedReturn            -30.9294
__unnamed_task__/AverageReturn                      -61.8016
__unnamed_task__/Iteration                          180
__unnamed_task__/MaxReturn                          -48.0692
__unnamed_task__/MinReturn                         -122.297
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.1394
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 04:04:16 | [maml_trainer] epoch #181 | Sampling for adapation and meta-testing...
2025-04-01 04:08:24 | [maml_trainer] epoch #181 | Finished meta-testing...
2025-04-01 04:08:24 | [maml_trainer] epoch #181 | Saving snapshot...
2025-04-01 04:08:45 | [maml_trainer] epoch #181 | Saved
2025-04-01 04:08:45 | [maml_trainer] epoch #181 | Time 223226.35 s
2025-04-01 04:08:45 | [maml_trainer] epoch #181 | EpochTime 1224.79 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.0793
Average/AverageReturn                               -60.3627
Average/Iteration                                   181
Average/MaxReturn                                   -46.6374
Average/MinReturn                                  -123.667
Average/NumEpisodes                                  80
Average/StdReturn                                    13.8827
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0086
GaussianMLPPolicy/KLAfter                             0.00341136
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.24131e-05
GaussianMLPPolicy/LossBefore                          9.05991e-09
GaussianMLPPolicy/dLoss                               9.24222e-05
Iteration                                           181
MetaTest/Average/AverageDiscountedReturn            -59.0942
MetaTest/Average/AverageReturn                      -59.0942
MetaTest/Average/Iteration                          181
MetaTest/Average/MaxReturn                          -48.7204
MetaTest/Average/MinReturn                          -94.1468
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.58277
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -59.0942
MetaTest/__unnamed_task__/AverageReturn             -59.0942
MetaTest/__unnamed_task__/Iteration                 181
MetaTest/__unnamed_task__/MaxReturn                 -48.7204
MetaTest/__unnamed_task__/MinReturn                 -94.1468
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.58277
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.824e+06
__unnamed_task__/AverageDiscountedReturn            -30.0793
__unnamed_task__/AverageReturn                      -60.3627
__unnamed_task__/Iteration                          181
__unnamed_task__/MaxReturn                          -46.6374
__unnamed_task__/MinReturn                         -123.667
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.8827
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 04:25:19 | [maml_trainer] epoch #182 | Sampling for adapation and meta-testing...
2025-04-01 04:29:25 | [maml_trainer] epoch #182 | Finished meta-testing...
2025-04-01 04:29:25 | [maml_trainer] epoch #182 | Saving snapshot...
2025-04-01 04:29:47 | [maml_trainer] epoch #182 | Saved
2025-04-01 04:29:47 | [maml_trainer] epoch #182 | Time 224488.09 s
2025-04-01 04:29:47 | [maml_trainer] epoch #182 | EpochTime 1261.74 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.3686
Average/AverageReturn                               -60.6701
Average/Iteration                                   182
Average/MaxReturn                                   -48.7335
Average/MinReturn                                  -126.483
Average/NumEpisodes                                  80
Average/StdReturn                                    11.4259
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0081
GaussianMLPPolicy/KLAfter                             0.0034527
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000184458
GaussianMLPPolicy/LossBefore                         -7.15256e-10
GaussianMLPPolicy/dLoss                               0.000184457
Iteration                                           182
MetaTest/Average/AverageDiscountedReturn            -56.7075
MetaTest/Average/AverageReturn                      -56.7075
MetaTest/Average/Iteration                          182
MetaTest/Average/MaxReturn                          -49.0416
MetaTest/Average/MinReturn                          -71.354
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.08741
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.7075
MetaTest/__unnamed_task__/AverageReturn             -56.7075
MetaTest/__unnamed_task__/Iteration                 182
MetaTest/__unnamed_task__/MaxReturn                 -49.0416
MetaTest/__unnamed_task__/MinReturn                 -71.354
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.08741
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.856e+06
__unnamed_task__/AverageDiscountedReturn            -30.3686
__unnamed_task__/AverageReturn                      -60.6701
__unnamed_task__/Iteration                          182
__unnamed_task__/MaxReturn                          -48.7335
__unnamed_task__/MinReturn                         -126.483
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.4259
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 04:46:19 | [maml_trainer] epoch #183 | Sampling for adapation and meta-testing...
2025-04-01 04:50:23 | [maml_trainer] epoch #183 | Finished meta-testing...
2025-04-01 04:50:23 | [maml_trainer] epoch #183 | Saving snapshot...
2025-04-01 04:50:44 | [maml_trainer] epoch #183 | Saved
2025-04-01 04:50:44 | [maml_trainer] epoch #183 | Time 225745.94 s
2025-04-01 04:50:44 | [maml_trainer] epoch #183 | EpochTime 1257.85 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.6848
Average/AverageReturn                              -58.2793
Average/Iteration                                  183
Average/MaxReturn                                  -47.0487
Average/MinReturn                                  -88.7282
Average/NumEpisodes                                 80
Average/StdReturn                                    7.23316
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0077
GaussianMLPPolicy/KLAfter                            0.00155691
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.23558e-05
GaussianMLPPolicy/LossBefore                        -1.13845e-08
GaussianMLPPolicy/dLoss                             -2.23672e-05
Iteration                                          183
MetaTest/Average/AverageDiscountedReturn           -56.9138
MetaTest/Average/AverageReturn                     -56.9138
MetaTest/Average/Iteration                         183
MetaTest/Average/MaxReturn                         -47.1198
MetaTest/Average/MinReturn                         -90.0634
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.81784
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.9138
MetaTest/__unnamed_task__/AverageReturn            -56.9138
MetaTest/__unnamed_task__/Iteration                183
MetaTest/__unnamed_task__/MaxReturn                -47.1198
MetaTest/__unnamed_task__/MinReturn                -90.0634
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.81784
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.888e+06
__unnamed_task__/AverageDiscountedReturn           -29.6848
__unnamed_task__/AverageReturn                     -58.2793
__unnamed_task__/Iteration                         183
__unnamed_task__/MaxReturn                         -47.0487
__unnamed_task__/MinReturn                         -88.7282
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.23316
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 05:07:01 | [maml_trainer] epoch #184 | Sampling for adapation and meta-testing...
2025-04-01 05:11:04 | [maml_trainer] epoch #184 | Finished meta-testing...
2025-04-01 05:11:04 | [maml_trainer] epoch #184 | Saving snapshot...
2025-04-01 05:11:25 | [maml_trainer] epoch #184 | Saved
2025-04-01 05:11:25 | [maml_trainer] epoch #184 | Time 226986.08 s
2025-04-01 05:11:25 | [maml_trainer] epoch #184 | EpochTime 1240.14 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.9071
Average/AverageReturn                              -58.9792
Average/Iteration                                  184
Average/MaxReturn                                  -47.5711
Average/MinReturn                                  -89.8853
Average/NumEpisodes                                 80
Average/StdReturn                                    8.27952
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.006
GaussianMLPPolicy/KLAfter                            0.00159618
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.25699e-05
GaussianMLPPolicy/LossBefore                        -8.52346e-09
GaussianMLPPolicy/dLoss                              7.25614e-05
Iteration                                          184
MetaTest/Average/AverageDiscountedReturn           -57.1077
MetaTest/Average/AverageReturn                     -57.1077
MetaTest/Average/Iteration                         184
MetaTest/Average/MaxReturn                         -46.7959
MetaTest/Average/MinReturn                         -73.547
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.41537
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.1077
MetaTest/__unnamed_task__/AverageReturn            -57.1077
MetaTest/__unnamed_task__/Iteration                184
MetaTest/__unnamed_task__/MaxReturn                -46.7959
MetaTest/__unnamed_task__/MinReturn                -73.547
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.41537
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.92e+06
__unnamed_task__/AverageDiscountedReturn           -29.9071
__unnamed_task__/AverageReturn                     -58.9792
__unnamed_task__/Iteration                         184
__unnamed_task__/MaxReturn                         -47.5711
__unnamed_task__/MinReturn                         -89.8853
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.27952
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 05:27:44 | [maml_trainer] epoch #185 | Sampling for adapation and meta-testing...
2025-04-01 05:31:48 | [maml_trainer] epoch #185 | Finished meta-testing...
2025-04-01 05:31:48 | [maml_trainer] epoch #185 | Saving snapshot...
2025-04-01 05:32:09 | [maml_trainer] epoch #185 | Saved
2025-04-01 05:32:09 | [maml_trainer] epoch #185 | Time 228230.92 s
2025-04-01 05:32:09 | [maml_trainer] epoch #185 | EpochTime 1244.83 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.5532
Average/AverageReturn                               -58.2197
Average/Iteration                                   185
Average/MaxReturn                                   -46.3806
Average/MinReturn                                  -175.983
Average/NumEpisodes                                  80
Average/StdReturn                                    14.1802
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0024
GaussianMLPPolicy/KLAfter                             0.00204392
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.32677e-05
GaussianMLPPolicy/LossBefore                         -2.20537e-09
GaussianMLPPolicy/dLoss                               5.32655e-05
Iteration                                           185
MetaTest/Average/AverageDiscountedReturn            -59.242
MetaTest/Average/AverageReturn                      -59.242
MetaTest/Average/Iteration                          185
MetaTest/Average/MaxReturn                          -49.6767
MetaTest/Average/MinReturn                          -95.0625
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.10203
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -59.242
MetaTest/__unnamed_task__/AverageReturn             -59.242
MetaTest/__unnamed_task__/Iteration                 185
MetaTest/__unnamed_task__/MaxReturn                 -49.6767
MetaTest/__unnamed_task__/MinReturn                 -95.0625
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.10203
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.952e+06
__unnamed_task__/AverageDiscountedReturn            -29.5532
__unnamed_task__/AverageReturn                      -58.2197
__unnamed_task__/Iteration                          185
__unnamed_task__/MaxReturn                          -46.3806
__unnamed_task__/MinReturn                         -175.983
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.1802
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 05:48:38 | [maml_trainer] epoch #186 | Sampling for adapation and meta-testing...
2025-04-01 05:52:43 | [maml_trainer] epoch #186 | Finished meta-testing...
2025-04-01 05:52:43 | [maml_trainer] epoch #186 | Saving snapshot...
2025-04-01 05:53:04 | [maml_trainer] epoch #186 | Saved
2025-04-01 05:53:04 | [maml_trainer] epoch #186 | Time 229485.70 s
2025-04-01 05:53:04 | [maml_trainer] epoch #186 | EpochTime 1254.78 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.3728
Average/AverageReturn                               -57.6667
Average/Iteration                                   186
Average/MaxReturn                                   -47.5499
Average/MinReturn                                  -147.604
Average/NumEpisodes                                  80
Average/StdReturn                                    11.8859
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                            10.0003
GaussianMLPPolicy/KLAfter                             0.00176311
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.30216e-05
GaussianMLPPolicy/LossBefore                         -2.86102e-09
GaussianMLPPolicy/dLoss                              -2.30245e-05
Iteration                                           186
MetaTest/Average/AverageDiscountedReturn            -57.1271
MetaTest/Average/AverageReturn                      -57.1271
MetaTest/Average/Iteration                          186
MetaTest/Average/MaxReturn                          -46.8952
MetaTest/Average/MinReturn                          -77.0862
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.60649
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.1271
MetaTest/__unnamed_task__/AverageReturn             -57.1271
MetaTest/__unnamed_task__/Iteration                 186
MetaTest/__unnamed_task__/MaxReturn                 -46.8952
MetaTest/__unnamed_task__/MinReturn                 -77.0862
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.60649
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         5.984e+06
__unnamed_task__/AverageDiscountedReturn            -29.3728
__unnamed_task__/AverageReturn                      -57.6667
__unnamed_task__/Iteration                          186
__unnamed_task__/MaxReturn                          -47.5499
__unnamed_task__/MinReturn                         -147.604
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.8859
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 06:09:21 | [maml_trainer] epoch #187 | Sampling for adapation and meta-testing...
2025-04-01 06:13:26 | [maml_trainer] epoch #187 | Finished meta-testing...
2025-04-01 06:13:26 | [maml_trainer] epoch #187 | Saving snapshot...
2025-04-01 06:13:48 | [maml_trainer] epoch #187 | Saved
2025-04-01 06:13:48 | [maml_trainer] epoch #187 | Time 230729.24 s
2025-04-01 06:13:48 | [maml_trainer] epoch #187 | EpochTime 1243.53 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.5975
Average/AverageReturn                               -57.9983
Average/Iteration                                   187
Average/MaxReturn                                   -45.5275
Average/MinReturn                                  -168.806
Average/NumEpisodes                                  80
Average/StdReturn                                    13.9327
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.99903
GaussianMLPPolicy/KLAfter                             0.00202319
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           7.08475e-05
GaussianMLPPolicy/LossBefore                          8.70228e-09
GaussianMLPPolicy/dLoss                              -7.08388e-05
Iteration                                           187
MetaTest/Average/AverageDiscountedReturn            -54.6102
MetaTest/Average/AverageReturn                      -54.6102
MetaTest/Average/Iteration                          187
MetaTest/Average/MaxReturn                          -43.9652
MetaTest/Average/MinReturn                          -62.2569
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            4.69887
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.6102
MetaTest/__unnamed_task__/AverageReturn             -54.6102
MetaTest/__unnamed_task__/Iteration                 187
MetaTest/__unnamed_task__/MaxReturn                 -43.9652
MetaTest/__unnamed_task__/MinReturn                 -62.2569
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   4.69887
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.016e+06
__unnamed_task__/AverageDiscountedReturn            -29.5975
__unnamed_task__/AverageReturn                      -57.9983
__unnamed_task__/Iteration                          187
__unnamed_task__/MaxReturn                          -45.5275
__unnamed_task__/MinReturn                         -168.806
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.9327
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 06:30:05 | [maml_trainer] epoch #188 | Sampling for adapation and meta-testing...
2025-04-01 06:34:12 | [maml_trainer] epoch #188 | Finished meta-testing...
2025-04-01 06:34:12 | [maml_trainer] epoch #188 | Saving snapshot...
2025-04-01 06:34:33 | [maml_trainer] epoch #188 | Saved
2025-04-01 06:34:33 | [maml_trainer] epoch #188 | Time 231974.50 s
2025-04-01 06:34:33 | [maml_trainer] epoch #188 | EpochTime 1245.26 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.8287
Average/AverageReturn                              -55.9649
Average/Iteration                                  188
Average/MaxReturn                                  -44.5501
Average/MinReturn                                  -98.1058
Average/NumEpisodes                                 80
Average/StdReturn                                    7.17893
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99686
GaussianMLPPolicy/KLAfter                            0.00247053
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.00011231
GaussianMLPPolicy/LossBefore                         3.93391e-09
GaussianMLPPolicy/dLoss                              0.000112314
Iteration                                          188
MetaTest/Average/AverageDiscountedReturn           -55.3438
MetaTest/Average/AverageReturn                     -55.3438
MetaTest/Average/Iteration                         188
MetaTest/Average/MaxReturn                         -43.7743
MetaTest/Average/MinReturn                         -69.11
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.29651
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -55.3438
MetaTest/__unnamed_task__/AverageReturn            -55.3438
MetaTest/__unnamed_task__/Iteration                188
MetaTest/__unnamed_task__/MaxReturn                -43.7743
MetaTest/__unnamed_task__/MinReturn                -69.11
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.29651
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.048e+06
__unnamed_task__/AverageDiscountedReturn           -28.8287
__unnamed_task__/AverageReturn                     -55.9649
__unnamed_task__/Iteration                         188
__unnamed_task__/MaxReturn                         -44.5501
__unnamed_task__/MinReturn                         -98.1058
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.17893
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 06:51:07 | [maml_trainer] epoch #189 | Sampling for adapation and meta-testing...
2025-04-01 06:55:15 | [maml_trainer] epoch #189 | Finished meta-testing...
2025-04-01 06:55:15 | [maml_trainer] epoch #189 | Saving snapshot...
2025-04-01 06:55:36 | [maml_trainer] epoch #189 | Saved
2025-04-01 06:55:36 | [maml_trainer] epoch #189 | Time 233237.09 s
2025-04-01 06:55:36 | [maml_trainer] epoch #189 | EpochTime 1262.58 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.0025
Average/AverageReturn                              -55.964
Average/Iteration                                  189
Average/MaxReturn                                  -44.2866
Average/MinReturn                                  -87.8233
Average/NumEpisodes                                 80
Average/StdReturn                                    6.8849
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99457
GaussianMLPPolicy/KLAfter                            0.00321499
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000107627
GaussianMLPPolicy/LossBefore                         2.68221e-09
GaussianMLPPolicy/dLoss                              0.000107629
Iteration                                          189
MetaTest/Average/AverageDiscountedReturn           -54.3258
MetaTest/Average/AverageReturn                     -54.3258
MetaTest/Average/Iteration                         189
MetaTest/Average/MaxReturn                         -47.9803
MetaTest/Average/MinReturn                         -67.7375
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.47988
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.3258
MetaTest/__unnamed_task__/AverageReturn            -54.3258
MetaTest/__unnamed_task__/Iteration                189
MetaTest/__unnamed_task__/MaxReturn                -47.9803
MetaTest/__unnamed_task__/MinReturn                -67.7375
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.47988
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.08e+06
__unnamed_task__/AverageDiscountedReturn           -29.0025
__unnamed_task__/AverageReturn                     -55.964
__unnamed_task__/Iteration                         189
__unnamed_task__/MaxReturn                         -44.2866
__unnamed_task__/MinReturn                         -87.8233
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.8849
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 07:11:57 | [maml_trainer] epoch #190 | Sampling for adapation and meta-testing...
2025-04-01 07:16:01 | [maml_trainer] epoch #190 | Finished meta-testing...
2025-04-01 07:16:01 | [maml_trainer] epoch #190 | Saving snapshot...
2025-04-01 07:16:23 | [maml_trainer] epoch #190 | Saved
2025-04-01 07:16:23 | [maml_trainer] epoch #190 | Time 234484.09 s
2025-04-01 07:16:23 | [maml_trainer] epoch #190 | EpochTime 1247.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.8604
Average/AverageReturn                              -55.6621
Average/Iteration                                  190
Average/MaxReturn                                  -46.9065
Average/MinReturn                                  -89.7828
Average/NumEpisodes                                 80
Average/StdReturn                                    6.65079
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99077
GaussianMLPPolicy/KLAfter                            0.00469829
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000127282
GaussianMLPPolicy/LossBefore                         7.21216e-09
GaussianMLPPolicy/dLoss                              0.000127289
Iteration                                          190
MetaTest/Average/AverageDiscountedReturn           -54.4569
MetaTest/Average/AverageReturn                     -54.4569
MetaTest/Average/Iteration                         190
MetaTest/Average/MaxReturn                         -47.463
MetaTest/Average/MinReturn                         -63.9692
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.62377
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.4569
MetaTest/__unnamed_task__/AverageReturn            -54.4569
MetaTest/__unnamed_task__/Iteration                190
MetaTest/__unnamed_task__/MaxReturn                -47.463
MetaTest/__unnamed_task__/MinReturn                -63.9692
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.62377
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.112e+06
__unnamed_task__/AverageDiscountedReturn           -28.8604
__unnamed_task__/AverageReturn                     -55.6621
__unnamed_task__/Iteration                         190
__unnamed_task__/MaxReturn                         -46.9065
__unnamed_task__/MinReturn                         -89.7828
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.65079
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 07:32:42 | [maml_trainer] epoch #191 | Sampling for adapation and meta-testing...
2025-04-01 07:36:43 | [maml_trainer] epoch #191 | Finished meta-testing...
2025-04-01 07:36:43 | [maml_trainer] epoch #191 | Saving snapshot...
2025-04-01 07:37:04 | [maml_trainer] epoch #191 | Saved
2025-04-01 07:37:04 | [maml_trainer] epoch #191 | Time 235725.82 s
2025-04-01 07:37:04 | [maml_trainer] epoch #191 | EpochTime 1241.72 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.7334
Average/AverageReturn                               -56.5027
Average/Iteration                                   191
Average/MaxReturn                                   -45.308
Average/MinReturn                                  -170.769
Average/NumEpisodes                                  80
Average/StdReturn                                    13.9234
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9883
GaussianMLPPolicy/KLAfter                             0.00571116
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.33753e-05
GaussianMLPPolicy/LossBefore                         -4.76837e-09
GaussianMLPPolicy/dLoss                              -4.338e-05
Iteration                                           191
MetaTest/Average/AverageDiscountedReturn            -56.0123
MetaTest/Average/AverageReturn                      -56.0123
MetaTest/Average/Iteration                          191
MetaTest/Average/MaxReturn                          -47.8198
MetaTest/Average/MinReturn                          -66.3437
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.8617
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.0123
MetaTest/__unnamed_task__/AverageReturn             -56.0123
MetaTest/__unnamed_task__/Iteration                 191
MetaTest/__unnamed_task__/MaxReturn                 -47.8198
MetaTest/__unnamed_task__/MinReturn                 -66.3437
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.8617
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.144e+06
__unnamed_task__/AverageDiscountedReturn            -28.7334
__unnamed_task__/AverageReturn                      -56.5027
__unnamed_task__/Iteration                          191
__unnamed_task__/MaxReturn                          -45.308
__unnamed_task__/MinReturn                         -170.769
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.9234
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 07:53:12 | [maml_trainer] epoch #192 | Sampling for adapation and meta-testing...
2025-04-01 07:57:18 | [maml_trainer] epoch #192 | Finished meta-testing...
2025-04-01 07:57:18 | [maml_trainer] epoch #192 | Saving snapshot...
2025-04-01 07:57:40 | [maml_trainer] epoch #192 | Saved
2025-04-01 07:57:40 | [maml_trainer] epoch #192 | Time 236961.13 s
2025-04-01 07:57:40 | [maml_trainer] epoch #192 | EpochTime 1235.30 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.6714
Average/AverageReturn                              -54.275
Average/Iteration                                  192
Average/MaxReturn                                  -46.5907
Average/MinReturn                                  -64.3683
Average/NumEpisodes                                 80
Average/StdReturn                                    4.33991
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98594
GaussianMLPPolicy/KLAfter                            0.0023006
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.27834e-05
GaussianMLPPolicy/LossBefore                        -5.48363e-09
GaussianMLPPolicy/dLoss                             -9.27889e-05
Iteration                                          192
MetaTest/Average/AverageDiscountedReturn           -51.7506
MetaTest/Average/AverageReturn                     -51.7506
MetaTest/Average/Iteration                         192
MetaTest/Average/MaxReturn                         -46.9679
MetaTest/Average/MinReturn                         -59.7209
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.08294
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.7506
MetaTest/__unnamed_task__/AverageReturn            -51.7506
MetaTest/__unnamed_task__/Iteration                192
MetaTest/__unnamed_task__/MaxReturn                -46.9679
MetaTest/__unnamed_task__/MinReturn                -59.7209
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.08294
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.176e+06
__unnamed_task__/AverageDiscountedReturn           -28.6714
__unnamed_task__/AverageReturn                     -54.275
__unnamed_task__/Iteration                         192
__unnamed_task__/MaxReturn                         -46.5907
__unnamed_task__/MinReturn                         -64.3683
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.33991
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 08:13:55 | [maml_trainer] epoch #193 | Sampling for adapation and meta-testing...
2025-04-01 08:17:59 | [maml_trainer] epoch #193 | Finished meta-testing...
2025-04-01 08:17:59 | [maml_trainer] epoch #193 | Saving snapshot...
2025-04-01 08:18:19 | [maml_trainer] epoch #193 | Saved
2025-04-01 08:18:19 | [maml_trainer] epoch #193 | Time 238200.71 s
2025-04-01 08:18:19 | [maml_trainer] epoch #193 | EpochTime 1239.58 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.3748
Average/AverageReturn                              -54.2739
Average/Iteration                                  193
Average/MaxReturn                                  -45.4134
Average/MinReturn                                  -69.7349
Average/NumEpisodes                                 80
Average/StdReturn                                    5.65486
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98315
GaussianMLPPolicy/KLAfter                            0.0025972
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.86135e-05
GaussianMLPPolicy/LossBefore                        -8.10623e-09
GaussianMLPPolicy/dLoss                              1.86054e-05
Iteration                                          193
MetaTest/Average/AverageDiscountedReturn           -54.7584
MetaTest/Average/AverageReturn                     -54.7584
MetaTest/Average/Iteration                         193
MetaTest/Average/MaxReturn                         -48.3779
MetaTest/Average/MinReturn                         -66.4331
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.88082
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.7584
MetaTest/__unnamed_task__/AverageReturn            -54.7584
MetaTest/__unnamed_task__/Iteration                193
MetaTest/__unnamed_task__/MaxReturn                -48.3779
MetaTest/__unnamed_task__/MinReturn                -66.4331
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.88082
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.208e+06
__unnamed_task__/AverageDiscountedReturn           -28.3748
__unnamed_task__/AverageReturn                     -54.2739
__unnamed_task__/Iteration                         193
__unnamed_task__/MaxReturn                         -45.4134
__unnamed_task__/MinReturn                         -69.7349
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.65486
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 08:34:35 | [maml_trainer] epoch #194 | Sampling for adapation and meta-testing...
2025-04-01 08:38:38 | [maml_trainer] epoch #194 | Finished meta-testing...
2025-04-01 08:38:38 | [maml_trainer] epoch #194 | Saving snapshot...
2025-04-01 08:38:59 | [maml_trainer] epoch #194 | Saved
2025-04-01 08:38:59 | [maml_trainer] epoch #194 | Time 239440.71 s
2025-04-01 08:38:59 | [maml_trainer] epoch #194 | EpochTime 1240.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.7294
Average/AverageReturn                              -54.7769
Average/Iteration                                  194
Average/MaxReturn                                  -46.8609
Average/MinReturn                                  -73.0301
Average/NumEpisodes                                 80
Average/StdReturn                                    5.04766
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97984
GaussianMLPPolicy/KLAfter                            0.00312598
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.03723e-05
GaussianMLPPolicy/LossBefore                        -1.29938e-08
GaussianMLPPolicy/dLoss                              5.03593e-05
Iteration                                          194
MetaTest/Average/AverageDiscountedReturn           -53.8697
MetaTest/Average/AverageReturn                     -53.8697
MetaTest/Average/Iteration                         194
MetaTest/Average/MaxReturn                         -46.5476
MetaTest/Average/MinReturn                         -63.072
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.69944
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -53.8697
MetaTest/__unnamed_task__/AverageReturn            -53.8697
MetaTest/__unnamed_task__/Iteration                194
MetaTest/__unnamed_task__/MaxReturn                -46.5476
MetaTest/__unnamed_task__/MinReturn                -63.072
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.69944
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.24e+06
__unnamed_task__/AverageDiscountedReturn           -28.7294
__unnamed_task__/AverageReturn                     -54.7769
__unnamed_task__/Iteration                         194
__unnamed_task__/MaxReturn                         -46.8609
__unnamed_task__/MinReturn                         -73.0301
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.04766
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 08:55:11 | [maml_trainer] epoch #195 | Sampling for adapation and meta-testing...
2025-04-01 08:59:14 | [maml_trainer] epoch #195 | Finished meta-testing...
2025-04-01 08:59:14 | [maml_trainer] epoch #195 | Saving snapshot...
2025-04-01 08:59:35 | [maml_trainer] epoch #195 | Saved
2025-04-01 08:59:35 | [maml_trainer] epoch #195 | Time 240676.32 s
2025-04-01 08:59:35 | [maml_trainer] epoch #195 | EpochTime 1235.61 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.3062
Average/AverageReturn                              -53.621
Average/Iteration                                  195
Average/MaxReturn                                  -44.4827
Average/MinReturn                                  -66.593
Average/NumEpisodes                                 80
Average/StdReturn                                    4.51269
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9762
GaussianMLPPolicy/KLAfter                            0.00746373
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000243321
GaussianMLPPolicy/LossBefore                         6.61612e-09
GaussianMLPPolicy/dLoss                             -0.000243315
Iteration                                          195
MetaTest/Average/AverageDiscountedReturn           -53.49
MetaTest/Average/AverageReturn                     -53.49
MetaTest/Average/Iteration                         195
MetaTest/Average/MaxReturn                         -47.0778
MetaTest/Average/MinReturn                         -63.3016
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.63655
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -53.49
MetaTest/__unnamed_task__/AverageReturn            -53.49
MetaTest/__unnamed_task__/Iteration                195
MetaTest/__unnamed_task__/MaxReturn                -47.0778
MetaTest/__unnamed_task__/MinReturn                -63.3016
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.63655
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.272e+06
__unnamed_task__/AverageDiscountedReturn           -28.3062
__unnamed_task__/AverageReturn                     -53.621
__unnamed_task__/Iteration                         195
__unnamed_task__/MaxReturn                         -44.4827
__unnamed_task__/MinReturn                         -66.593
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.51269
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 09:15:42 | [maml_trainer] epoch #196 | Sampling for adapation and meta-testing...
2025-04-01 09:19:45 | [maml_trainer] epoch #196 | Finished meta-testing...
2025-04-01 09:19:45 | [maml_trainer] epoch #196 | Saving snapshot...
2025-04-01 09:20:07 | [maml_trainer] epoch #196 | Saved
2025-04-01 09:20:07 | [maml_trainer] epoch #196 | Time 241908.07 s
2025-04-01 09:20:07 | [maml_trainer] epoch #196 | EpochTime 1231.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.9342
Average/AverageReturn                              -52.7077
Average/Iteration                                  196
Average/MaxReturn                                  -44.7201
Average/MinReturn                                  -63.5657
Average/NumEpisodes                                 80
Average/StdReturn                                    4.14001
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97208
GaussianMLPPolicy/KLAfter                            0.00758979
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.87487e-06
GaussianMLPPolicy/LossBefore                        -7.98702e-09
GaussianMLPPolicy/dLoss                              5.86688e-06
Iteration                                          196
MetaTest/Average/AverageDiscountedReturn           -51.9153
MetaTest/Average/AverageReturn                     -51.9153
MetaTest/Average/Iteration                         196
MetaTest/Average/MaxReturn                         -44.8035
MetaTest/Average/MinReturn                         -59.078
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.69805
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.9153
MetaTest/__unnamed_task__/AverageReturn            -51.9153
MetaTest/__unnamed_task__/Iteration                196
MetaTest/__unnamed_task__/MaxReturn                -44.8035
MetaTest/__unnamed_task__/MinReturn                -59.078
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.69805
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.304e+06
__unnamed_task__/AverageDiscountedReturn           -27.9342
__unnamed_task__/AverageReturn                     -52.7077
__unnamed_task__/Iteration                         196
__unnamed_task__/MaxReturn                         -44.7201
__unnamed_task__/MinReturn                         -63.5657
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.14001
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 09:36:27 | [maml_trainer] epoch #197 | Sampling for adapation and meta-testing...
2025-04-01 09:40:45 | [maml_trainer] epoch #197 | Finished meta-testing...
2025-04-01 09:40:45 | [maml_trainer] epoch #197 | Saving snapshot...
2025-04-01 09:41:07 | [maml_trainer] epoch #197 | Saved
2025-04-01 09:41:07 | [maml_trainer] epoch #197 | Time 243168.05 s
2025-04-01 09:41:07 | [maml_trainer] epoch #197 | EpochTime 1259.98 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.0965
Average/AverageReturn                              -52.7083
Average/Iteration                                  197
Average/MaxReturn                                  -44.7886
Average/MinReturn                                  -63.6899
Average/NumEpisodes                                 80
Average/StdReturn                                    4.05351
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96952
GaussianMLPPolicy/KLAfter                            0.00647424
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000161309
GaussianMLPPolicy/LossBefore                        -2.5034e-09
GaussianMLPPolicy/dLoss                             -0.000161311
Iteration                                          197
MetaTest/Average/AverageDiscountedReturn           -54.833
MetaTest/Average/AverageReturn                     -54.833
MetaTest/Average/Iteration                         197
MetaTest/Average/MaxReturn                         -46.5785
MetaTest/Average/MinReturn                         -84.4943
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.94834
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.833
MetaTest/__unnamed_task__/AverageReturn            -54.833
MetaTest/__unnamed_task__/Iteration                197
MetaTest/__unnamed_task__/MaxReturn                -46.5785
MetaTest/__unnamed_task__/MinReturn                -84.4943
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.94834
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.336e+06
__unnamed_task__/AverageDiscountedReturn           -28.0965
__unnamed_task__/AverageReturn                     -52.7083
__unnamed_task__/Iteration                         197
__unnamed_task__/MaxReturn                         -44.7886
__unnamed_task__/MinReturn                         -63.6899
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.05351
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 09:58:17 | [maml_trainer] epoch #198 | Sampling for adapation and meta-testing...
2025-04-01 10:02:40 | [maml_trainer] epoch #198 | Finished meta-testing...
2025-04-01 10:02:40 | [maml_trainer] epoch #198 | Saving snapshot...
2025-04-01 10:03:02 | [maml_trainer] epoch #198 | Saved
2025-04-01 10:03:02 | [maml_trainer] epoch #198 | Time 244483.28 s
2025-04-01 10:03:02 | [maml_trainer] epoch #198 | EpochTime 1315.23 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.447
Average/AverageReturn                              -53.2557
Average/Iteration                                  198
Average/MaxReturn                                  -45.8119
Average/MinReturn                                  -75.3553
Average/NumEpisodes                                 80
Average/StdReturn                                    5.62493
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96698
GaussianMLPPolicy/KLAfter                            0.00732838
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000284694
GaussianMLPPolicy/LossBefore                         1.19209e-10
GaussianMLPPolicy/dLoss                              0.000284694
Iteration                                          198
MetaTest/Average/AverageDiscountedReturn           -49.6482
MetaTest/Average/AverageReturn                     -49.6482
MetaTest/Average/Iteration                         198
MetaTest/Average/MaxReturn                         -44.8267
MetaTest/Average/MinReturn                         -53.4638
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           2.57936
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.6482
MetaTest/__unnamed_task__/AverageReturn            -49.6482
MetaTest/__unnamed_task__/Iteration                198
MetaTest/__unnamed_task__/MaxReturn                -44.8267
MetaTest/__unnamed_task__/MinReturn                -53.4638
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  2.57936
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.368e+06
__unnamed_task__/AverageDiscountedReturn           -28.447
__unnamed_task__/AverageReturn                     -53.2557
__unnamed_task__/Iteration                         198
__unnamed_task__/MaxReturn                         -45.8119
__unnamed_task__/MinReturn                         -75.3553
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.62493
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 10:20:30 | [maml_trainer] epoch #199 | Sampling for adapation and meta-testing...
2025-04-01 10:25:10 | [maml_trainer] epoch #199 | Finished meta-testing...
2025-04-01 10:25:10 | [maml_trainer] epoch #199 | Saving snapshot...
2025-04-01 10:25:33 | [maml_trainer] epoch #199 | Saved
2025-04-01 10:25:33 | [maml_trainer] epoch #199 | Time 245835.00 s
2025-04-01 10:25:33 | [maml_trainer] epoch #199 | EpochTime 1351.71 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.8927
Average/AverageReturn                              -52.0013
Average/Iteration                                  199
Average/MaxReturn                                  -45.0658
Average/MinReturn                                  -63.2566
Average/NumEpisodes                                 80
Average/StdReturn                                    3.9676
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96501
GaussianMLPPolicy/KLAfter                            0.00795169
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000229979
GaussianMLPPolicy/LossBefore                         3.03984e-09
GaussianMLPPolicy/dLoss                             -0.000229976
Iteration                                          199
MetaTest/Average/AverageDiscountedReturn           -52.3986
MetaTest/Average/AverageReturn                     -52.3986
MetaTest/Average/Iteration                         199
MetaTest/Average/MaxReturn                         -46.0858
MetaTest/Average/MinReturn                         -61.8572
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.45659
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -52.3986
MetaTest/__unnamed_task__/AverageReturn            -52.3986
MetaTest/__unnamed_task__/Iteration                199
MetaTest/__unnamed_task__/MaxReturn                -46.0858
MetaTest/__unnamed_task__/MinReturn                -61.8572
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.45659
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.4e+06
__unnamed_task__/AverageDiscountedReturn           -27.8927
__unnamed_task__/AverageReturn                     -52.0013
__unnamed_task__/Iteration                         199
__unnamed_task__/MaxReturn                         -45.0658
__unnamed_task__/MinReturn                         -63.2566
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.9676
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 10:42:59 | [maml_trainer] epoch #200 | Sampling for adapation and meta-testing...
2025-04-01 10:47:19 | [maml_trainer] epoch #200 | Finished meta-testing...
2025-04-01 10:47:19 | [maml_trainer] epoch #200 | Saving snapshot...
2025-04-01 10:47:42 | [maml_trainer] epoch #200 | Saved
2025-04-01 10:47:42 | [maml_trainer] epoch #200 | Time 247163.47 s
2025-04-01 10:47:42 | [maml_trainer] epoch #200 | EpochTime 1328.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.6874
Average/AverageReturn                              -50.9233
Average/Iteration                                  200
Average/MaxReturn                                  -43.143
Average/MinReturn                                  -66.1218
Average/NumEpisodes                                 80
Average/StdReturn                                    3.92363
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96216
GaussianMLPPolicy/KLAfter                            0.00852344
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.93358e-05
GaussianMLPPolicy/LossBefore                         9.0003e-09
GaussianMLPPolicy/dLoss                             -5.93268e-05
Iteration                                          200
MetaTest/Average/AverageDiscountedReturn           -52.035
MetaTest/Average/AverageReturn                     -52.035
MetaTest/Average/Iteration                         200
MetaTest/Average/MaxReturn                         -45.5324
MetaTest/Average/MinReturn                         -70.3847
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.34178
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -52.035
MetaTest/__unnamed_task__/AverageReturn            -52.035
MetaTest/__unnamed_task__/Iteration                200
MetaTest/__unnamed_task__/MaxReturn                -45.5324
MetaTest/__unnamed_task__/MinReturn                -70.3847
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.34178
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.432e+06
__unnamed_task__/AverageDiscountedReturn           -27.6874
__unnamed_task__/AverageReturn                     -50.9233
__unnamed_task__/Iteration                         200
__unnamed_task__/MaxReturn                         -43.143
__unnamed_task__/MinReturn                         -66.1218
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.92363
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 11:05:06 | [maml_trainer] epoch #201 | Sampling for adapation and meta-testing...
2025-04-01 11:09:24 | [maml_trainer] epoch #201 | Finished meta-testing...
2025-04-01 11:09:24 | [maml_trainer] epoch #201 | Saving snapshot...
2025-04-01 11:09:47 | [maml_trainer] epoch #201 | Saved
2025-04-01 11:09:47 | [maml_trainer] epoch #201 | Time 248488.51 s
2025-04-01 11:09:47 | [maml_trainer] epoch #201 | EpochTime 1325.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.2924
Average/AverageReturn                              -50.9075
Average/Iteration                                  201
Average/MaxReturn                                  -41.1596
Average/MinReturn                                  -67.6407
Average/NumEpisodes                                 80
Average/StdReturn                                    5.08183
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95861
GaussianMLPPolicy/KLAfter                            0.00590206
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.13205e-06
GaussianMLPPolicy/LossBefore                        -1.09076e-08
GaussianMLPPolicy/dLoss                             -3.14295e-06
Iteration                                          201
MetaTest/Average/AverageDiscountedReturn           -50.5541
MetaTest/Average/AverageReturn                     -50.5541
MetaTest/Average/Iteration                         201
MetaTest/Average/MaxReturn                         -42.6253
MetaTest/Average/MinReturn                         -60.3128
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.524
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.5541
MetaTest/__unnamed_task__/AverageReturn            -50.5541
MetaTest/__unnamed_task__/Iteration                201
MetaTest/__unnamed_task__/MaxReturn                -42.6253
MetaTest/__unnamed_task__/MinReturn                -60.3128
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.524
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.464e+06
__unnamed_task__/AverageDiscountedReturn           -27.2924
__unnamed_task__/AverageReturn                     -50.9075
__unnamed_task__/Iteration                         201
__unnamed_task__/MaxReturn                         -41.1596
__unnamed_task__/MinReturn                         -67.6407
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.08183
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 11:26:48 | [maml_trainer] epoch #202 | Sampling for adapation and meta-testing...
2025-04-01 11:31:02 | [maml_trainer] epoch #202 | Finished meta-testing...
2025-04-01 11:31:02 | [maml_trainer] epoch #202 | Saving snapshot...
2025-04-01 11:31:23 | [maml_trainer] epoch #202 | Saved
2025-04-01 11:31:23 | [maml_trainer] epoch #202 | Time 249784.75 s
2025-04-01 11:31:23 | [maml_trainer] epoch #202 | EpochTime 1296.24 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.5168
Average/AverageReturn                              -50.9692
Average/Iteration                                  202
Average/MaxReturn                                  -42.027
Average/MinReturn                                  -78.8863
Average/NumEpisodes                                 80
Average/StdReturn                                    6.26867
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95663
GaussianMLPPolicy/KLAfter                            0.00555279
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000122701
GaussianMLPPolicy/LossBefore                         2.98023e-10
GaussianMLPPolicy/dLoss                             -0.000122701
Iteration                                          202
MetaTest/Average/AverageDiscountedReturn           -54.0254
MetaTest/Average/AverageReturn                     -54.0254
MetaTest/Average/Iteration                         202
MetaTest/Average/MaxReturn                         -44.8574
MetaTest/Average/MinReturn                         -67.6277
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.24414
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.0254
MetaTest/__unnamed_task__/AverageReturn            -54.0254
MetaTest/__unnamed_task__/Iteration                202
MetaTest/__unnamed_task__/MaxReturn                -44.8574
MetaTest/__unnamed_task__/MinReturn                -67.6277
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.24414
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.496e+06
__unnamed_task__/AverageDiscountedReturn           -27.5168
__unnamed_task__/AverageReturn                     -50.9692
__unnamed_task__/Iteration                         202
__unnamed_task__/MaxReturn                         -42.027
__unnamed_task__/MinReturn                         -78.8863
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.26867
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 11:48:24 | [maml_trainer] epoch #203 | Sampling for adapation and meta-testing...
2025-04-01 11:52:41 | [maml_trainer] epoch #203 | Finished meta-testing...
2025-04-01 11:52:41 | [maml_trainer] epoch #203 | Saving snapshot...
2025-04-01 11:53:03 | [maml_trainer] epoch #203 | Saved
2025-04-01 11:53:03 | [maml_trainer] epoch #203 | Time 251084.85 s
2025-04-01 11:53:03 | [maml_trainer] epoch #203 | EpochTime 1300.10 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.9794
Average/AverageReturn                              -50.1729
Average/Iteration                                  203
Average/MaxReturn                                  -40.7453
Average/MinReturn                                  -75.8694
Average/NumEpisodes                                 80
Average/StdReturn                                    6.02234
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95489
GaussianMLPPolicy/KLAfter                            0.0054653
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.25526e-05
GaussianMLPPolicy/LossBefore                        -7.27177e-09
GaussianMLPPolicy/dLoss                              1.25453e-05
Iteration                                          203
MetaTest/Average/AverageDiscountedReturn           -51.8975
MetaTest/Average/AverageReturn                     -51.8975
MetaTest/Average/Iteration                         203
MetaTest/Average/MaxReturn                         -44.3124
MetaTest/Average/MinReturn                         -68.7865
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.20072
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.8975
MetaTest/__unnamed_task__/AverageReturn            -51.8975
MetaTest/__unnamed_task__/Iteration                203
MetaTest/__unnamed_task__/MaxReturn                -44.3124
MetaTest/__unnamed_task__/MinReturn                -68.7865
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.20072
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.528e+06
__unnamed_task__/AverageDiscountedReturn           -26.9794
__unnamed_task__/AverageReturn                     -50.1729
__unnamed_task__/Iteration                         203
__unnamed_task__/MaxReturn                         -40.7453
__unnamed_task__/MinReturn                         -75.8694
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.02234
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 12:09:58 | [maml_trainer] epoch #204 | Sampling for adapation and meta-testing...
2025-04-01 12:14:10 | [maml_trainer] epoch #204 | Finished meta-testing...
2025-04-01 12:14:10 | [maml_trainer] epoch #204 | Saving snapshot...
2025-04-01 12:14:32 | [maml_trainer] epoch #204 | Saved
2025-04-01 12:14:32 | [maml_trainer] epoch #204 | Time 252373.62 s
2025-04-01 12:14:32 | [maml_trainer] epoch #204 | EpochTime 1288.76 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.0977
Average/AverageReturn                              -53.2232
Average/Iteration                                  204
Average/MaxReturn                                  -41.5307
Average/MinReturn                                  -77.2347
Average/NumEpisodes                                 80
Average/StdReturn                                    8.23514
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95331
GaussianMLPPolicy/KLAfter                            0.00328158
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.08407e-05
GaussianMLPPolicy/LossBefore                        -3.03984e-09
GaussianMLPPolicy/dLoss                             -8.08437e-05
Iteration                                          204
MetaTest/Average/AverageDiscountedReturn           -57.3313
MetaTest/Average/AverageReturn                     -57.3313
MetaTest/Average/Iteration                         204
MetaTest/Average/MaxReturn                         -43.6029
MetaTest/Average/MinReturn                         -92.76
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.4136
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -57.3313
MetaTest/__unnamed_task__/AverageReturn            -57.3313
MetaTest/__unnamed_task__/Iteration                204
MetaTest/__unnamed_task__/MaxReturn                -43.6029
MetaTest/__unnamed_task__/MinReturn                -92.76
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.4136
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.56e+06
__unnamed_task__/AverageDiscountedReturn           -28.0977
__unnamed_task__/AverageReturn                     -53.2232
__unnamed_task__/Iteration                         204
__unnamed_task__/MaxReturn                         -41.5307
__unnamed_task__/MinReturn                         -77.2347
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.23514
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 12:31:20 | [maml_trainer] epoch #205 | Sampling for adapation and meta-testing...
2025-04-01 12:35:34 | [maml_trainer] epoch #205 | Finished meta-testing...
2025-04-01 12:35:34 | [maml_trainer] epoch #205 | Saving snapshot...
2025-04-01 12:35:56 | [maml_trainer] epoch #205 | Saved
2025-04-01 12:35:56 | [maml_trainer] epoch #205 | Time 253657.69 s
2025-04-01 12:35:56 | [maml_trainer] epoch #205 | EpochTime 1284.07 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.519
Average/AverageReturn                               -56.8674
Average/Iteration                                   205
Average/MaxReturn                                   -40.0521
Average/MinReturn                                  -142.966
Average/NumEpisodes                                  80
Average/StdReturn                                    14.15
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95154
GaussianMLPPolicy/KLAfter                             0.00174658
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           5.71055e-05
GaussianMLPPolicy/LossBefore                         -9.83477e-09
GaussianMLPPolicy/dLoss                              -5.71153e-05
Iteration                                           205
MetaTest/Average/AverageDiscountedReturn            -50.8419
MetaTest/Average/AverageReturn                      -50.8419
MetaTest/Average/Iteration                          205
MetaTest/Average/MaxReturn                          -41.1061
MetaTest/Average/MinReturn                          -65.9486
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            6.49085
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -50.8419
MetaTest/__unnamed_task__/AverageReturn             -50.8419
MetaTest/__unnamed_task__/Iteration                 205
MetaTest/__unnamed_task__/MaxReturn                 -41.1061
MetaTest/__unnamed_task__/MinReturn                 -65.9486
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   6.49085
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.592e+06
__unnamed_task__/AverageDiscountedReturn            -28.519
__unnamed_task__/AverageReturn                      -56.8674
__unnamed_task__/Iteration                          205
__unnamed_task__/MaxReturn                          -40.0521
__unnamed_task__/MinReturn                         -142.966
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.15
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 12:52:13 | [maml_trainer] epoch #206 | Sampling for adapation and meta-testing...
2025-04-01 12:56:13 | [maml_trainer] epoch #206 | Finished meta-testing...
2025-04-01 12:56:13 | [maml_trainer] epoch #206 | Saving snapshot...
2025-04-01 12:56:33 | [maml_trainer] epoch #206 | Saved
2025-04-01 12:56:33 | [maml_trainer] epoch #206 | Time 254894.64 s
2025-04-01 12:56:33 | [maml_trainer] epoch #206 | EpochTime 1236.95 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.3734
Average/AverageReturn                               -55.2697
Average/Iteration                                   206
Average/MaxReturn                                   -38.7419
Average/MinReturn                                  -130.48
Average/NumEpisodes                                  80
Average/StdReturn                                    14.444
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95014
GaussianMLPPolicy/KLAfter                             0.000958298
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.91595e-05
GaussianMLPPolicy/LossBefore                         -4.58956e-09
GaussianMLPPolicy/dLoss                              -1.91641e-05
Iteration                                           206
MetaTest/Average/AverageDiscountedReturn            -52.2461
MetaTest/Average/AverageReturn                      -52.2461
MetaTest/Average/Iteration                          206
MetaTest/Average/MaxReturn                          -44.3045
MetaTest/Average/MinReturn                          -74.1699
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.08996
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -52.2461
MetaTest/__unnamed_task__/AverageReturn             -52.2461
MetaTest/__unnamed_task__/Iteration                 206
MetaTest/__unnamed_task__/MaxReturn                 -44.3045
MetaTest/__unnamed_task__/MinReturn                 -74.1699
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.08996
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.624e+06
__unnamed_task__/AverageDiscountedReturn            -28.3734
__unnamed_task__/AverageReturn                      -55.2697
__unnamed_task__/Iteration                          206
__unnamed_task__/MaxReturn                          -38.7419
__unnamed_task__/MinReturn                         -130.48
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.444
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 13:12:24 | [maml_trainer] epoch #207 | Sampling for adapation and meta-testing...
2025-04-01 13:16:28 | [maml_trainer] epoch #207 | Finished meta-testing...
2025-04-01 13:16:28 | [maml_trainer] epoch #207 | Saving snapshot...
2025-04-01 13:16:49 | [maml_trainer] epoch #207 | Saved
2025-04-01 13:16:49 | [maml_trainer] epoch #207 | Time 256110.34 s
2025-04-01 13:16:49 | [maml_trainer] epoch #207 | EpochTime 1215.69 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.4646
Average/AverageReturn                               -59.7259
Average/Iteration                                   207
Average/MaxReturn                                   -41.1065
Average/MinReturn                                  -173.891
Average/NumEpisodes                                  80
Average/StdReturn                                    22.033
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94837
GaussianMLPPolicy/KLAfter                             0.000988037
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -4.83666e-06
GaussianMLPPolicy/LossBefore                          9.23872e-10
GaussianMLPPolicy/dLoss                               4.83759e-06
Iteration                                           207
MetaTest/Average/AverageDiscountedReturn            -54.5092
MetaTest/Average/AverageReturn                      -54.5092
MetaTest/Average/Iteration                          207
MetaTest/Average/MaxReturn                          -44.4124
MetaTest/Average/MinReturn                          -87.6552
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           10.9866
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.5092
MetaTest/__unnamed_task__/AverageReturn             -54.5092
MetaTest/__unnamed_task__/Iteration                 207
MetaTest/__unnamed_task__/MaxReturn                 -44.4124
MetaTest/__unnamed_task__/MinReturn                 -87.6552
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  10.9866
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.656e+06
__unnamed_task__/AverageDiscountedReturn            -29.4646
__unnamed_task__/AverageReturn                      -59.7259
__unnamed_task__/Iteration                          207
__unnamed_task__/MaxReturn                          -41.1065
__unnamed_task__/MinReturn                         -173.891
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           22.033
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 13:32:58 | [maml_trainer] epoch #208 | Sampling for adapation and meta-testing...
2025-04-01 13:36:54 | [maml_trainer] epoch #208 | Finished meta-testing...
2025-04-01 13:36:54 | [maml_trainer] epoch #208 | Saving snapshot...
2025-04-01 13:37:15 | [maml_trainer] epoch #208 | Saved
2025-04-01 13:37:15 | [maml_trainer] epoch #208 | Time 257336.86 s
2025-04-01 13:37:15 | [maml_trainer] epoch #208 | EpochTime 1226.52 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.7629
Average/AverageReturn                               -56.4568
Average/Iteration                                   208
Average/MaxReturn                                   -43.3448
Average/MinReturn                                  -141.178
Average/NumEpisodes                                  80
Average/StdReturn                                    14.1166
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94817
GaussianMLPPolicy/KLAfter                             0.00163609
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.49133e-06
GaussianMLPPolicy/LossBefore                         -2.05636e-09
GaussianMLPPolicy/dLoss                              -6.49339e-06
Iteration                                           208
MetaTest/Average/AverageDiscountedReturn            -56.3629
MetaTest/Average/AverageReturn                      -56.3629
MetaTest/Average/Iteration                          208
MetaTest/Average/MaxReturn                          -45.6215
MetaTest/Average/MinReturn                          -73.9142
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            8.36037
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.3629
MetaTest/__unnamed_task__/AverageReturn             -56.3629
MetaTest/__unnamed_task__/Iteration                 208
MetaTest/__unnamed_task__/MaxReturn                 -45.6215
MetaTest/__unnamed_task__/MinReturn                 -73.9142
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   8.36037
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.688e+06
__unnamed_task__/AverageDiscountedReturn            -28.7629
__unnamed_task__/AverageReturn                      -56.4568
__unnamed_task__/Iteration                          208
__unnamed_task__/MaxReturn                          -43.3448
__unnamed_task__/MinReturn                         -141.178
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.1166
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 13:52:58 | [maml_trainer] epoch #209 | Sampling for adapation and meta-testing...
2025-04-01 13:56:56 | [maml_trainer] epoch #209 | Finished meta-testing...
2025-04-01 13:56:56 | [maml_trainer] epoch #209 | Saving snapshot...
2025-04-01 13:57:18 | [maml_trainer] epoch #209 | Saved
2025-04-01 13:57:18 | [maml_trainer] epoch #209 | Time 258539.23 s
2025-04-01 13:57:18 | [maml_trainer] epoch #209 | EpochTime 1202.36 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.1947
Average/AverageReturn                               -59.2112
Average/Iteration                                   209
Average/MaxReturn                                   -42.304
Average/MinReturn                                  -113.882
Average/NumEpisodes                                  80
Average/StdReturn                                    14.6535
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.94892
GaussianMLPPolicy/KLAfter                             0.00134228
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           0.000107756
GaussianMLPPolicy/LossBefore                         -2.65241e-09
GaussianMLPPolicy/dLoss                              -0.000107758
Iteration                                           209
MetaTest/Average/AverageDiscountedReturn            -54.9498
MetaTest/Average/AverageReturn                      -54.9498
MetaTest/Average/Iteration                          209
MetaTest/Average/MaxReturn                          -43.8734
MetaTest/Average/MinReturn                          -81.699
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.654
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.9498
MetaTest/__unnamed_task__/AverageReturn             -54.9498
MetaTest/__unnamed_task__/Iteration                 209
MetaTest/__unnamed_task__/MaxReturn                 -43.8734
MetaTest/__unnamed_task__/MinReturn                 -81.699
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.654
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.72e+06
__unnamed_task__/AverageDiscountedReturn            -29.1947
__unnamed_task__/AverageReturn                      -59.2112
__unnamed_task__/Iteration                          209
__unnamed_task__/MaxReturn                          -42.304
__unnamed_task__/MinReturn                         -113.882
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.6535
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 14:13:22 | [maml_trainer] epoch #210 | Sampling for adapation and meta-testing...
2025-04-01 14:17:25 | [maml_trainer] epoch #210 | Finished meta-testing...
2025-04-01 14:17:25 | [maml_trainer] epoch #210 | Saving snapshot...
2025-04-01 14:17:48 | [maml_trainer] epoch #210 | Saved
2025-04-01 14:17:48 | [maml_trainer] epoch #210 | Time 259769.68 s
2025-04-01 14:17:48 | [maml_trainer] epoch #210 | EpochTime 1230.45 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.446
Average/AverageReturn                               -55.8366
Average/Iteration                                   210
Average/MaxReturn                                   -40.4533
Average/MinReturn                                  -140.494
Average/NumEpisodes                                  80
Average/StdReturn                                    13.8913
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95042
GaussianMLPPolicy/KLAfter                             0.00113918
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.26316e-05
GaussianMLPPolicy/LossBefore                         -5.96048e-11
GaussianMLPPolicy/dLoss                               3.26315e-05
Iteration                                           210
MetaTest/Average/AverageDiscountedReturn            -62.4213
MetaTest/Average/AverageReturn                      -62.4213
MetaTest/Average/Iteration                          210
MetaTest/Average/MaxReturn                          -41.7178
MetaTest/Average/MinReturn                         -121.1
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           17.7101
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.4213
MetaTest/__unnamed_task__/AverageReturn             -62.4213
MetaTest/__unnamed_task__/Iteration                 210
MetaTest/__unnamed_task__/MaxReturn                 -41.7178
MetaTest/__unnamed_task__/MinReturn                -121.1
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  17.7101
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.752e+06
__unnamed_task__/AverageDiscountedReturn            -28.446
__unnamed_task__/AverageReturn                      -55.8366
__unnamed_task__/Iteration                          210
__unnamed_task__/MaxReturn                          -40.4533
__unnamed_task__/MinReturn                         -140.494
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.8913
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 14:34:39 | [maml_trainer] epoch #211 | Sampling for adapation and meta-testing...
2025-04-01 14:38:51 | [maml_trainer] epoch #211 | Finished meta-testing...
2025-04-01 14:38:51 | [maml_trainer] epoch #211 | Saving snapshot...
2025-04-01 14:39:11 | [maml_trainer] epoch #211 | Saved
2025-04-01 14:39:11 | [maml_trainer] epoch #211 | Time 261052.32 s
2025-04-01 14:39:11 | [maml_trainer] epoch #211 | EpochTime 1282.64 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.4998
Average/AverageReturn                               -60.7445
Average/Iteration                                   211
Average/MaxReturn                                   -39.7907
Average/MinReturn                                  -165.668
Average/NumEpisodes                                  80
Average/StdReturn                                    21.0377
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95227
GaussianMLPPolicy/KLAfter                             0.00116814
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000123993
GaussianMLPPolicy/LossBefore                          5.57303e-09
GaussianMLPPolicy/dLoss                               0.000123999
Iteration                                           211
MetaTest/Average/AverageDiscountedReturn            -62.0213
MetaTest/Average/AverageReturn                      -62.0213
MetaTest/Average/Iteration                          211
MetaTest/Average/MaxReturn                          -41.909
MetaTest/Average/MinReturn                         -118.401
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           19.46
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -62.0213
MetaTest/__unnamed_task__/AverageReturn             -62.0213
MetaTest/__unnamed_task__/Iteration                 211
MetaTest/__unnamed_task__/MaxReturn                 -41.909
MetaTest/__unnamed_task__/MinReturn                -118.401
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  19.46
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.784e+06
__unnamed_task__/AverageDiscountedReturn            -29.4998
__unnamed_task__/AverageReturn                      -60.7445
__unnamed_task__/Iteration                          211
__unnamed_task__/MaxReturn                          -39.7907
__unnamed_task__/MinReturn                         -165.668
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           21.0377
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 14:55:42 | [maml_trainer] epoch #212 | Sampling for adapation and meta-testing...
2025-04-01 14:59:43 | [maml_trainer] epoch #212 | Finished meta-testing...
2025-04-01 14:59:43 | [maml_trainer] epoch #212 | Saving snapshot...
2025-04-01 15:00:04 | [maml_trainer] epoch #212 | Saved
2025-04-01 15:00:04 | [maml_trainer] epoch #212 | Time 262305.53 s
2025-04-01 15:00:04 | [maml_trainer] epoch #212 | EpochTime 1253.21 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.3874
Average/AverageReturn                               -60.6342
Average/Iteration                                   212
Average/MaxReturn                                   -41.223
Average/MinReturn                                  -146.282
Average/NumEpisodes                                  80
Average/StdReturn                                    19.7113
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95375
GaussianMLPPolicy/KLAfter                             0.00111899
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.89638e-05
GaussianMLPPolicy/LossBefore                          5.36442e-09
GaussianMLPPolicy/dLoss                              -1.89584e-05
Iteration                                           212
MetaTest/Average/AverageDiscountedReturn            -56.9791
MetaTest/Average/AverageReturn                      -56.9791
MetaTest/Average/Iteration                          212
MetaTest/Average/MaxReturn                          -43.6334
MetaTest/Average/MinReturn                          -89.4573
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.8238
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -56.9791
MetaTest/__unnamed_task__/AverageReturn             -56.9791
MetaTest/__unnamed_task__/Iteration                 212
MetaTest/__unnamed_task__/MaxReturn                 -43.6334
MetaTest/__unnamed_task__/MinReturn                 -89.4573
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.8238
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.816e+06
__unnamed_task__/AverageDiscountedReturn            -29.3874
__unnamed_task__/AverageReturn                      -60.6342
__unnamed_task__/Iteration                          212
__unnamed_task__/MaxReturn                          -41.223
__unnamed_task__/MinReturn                         -146.282
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           19.7113
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 15:16:14 | [maml_trainer] epoch #213 | Sampling for adapation and meta-testing...
2025-04-01 15:20:25 | [maml_trainer] epoch #213 | Finished meta-testing...
2025-04-01 15:20:25 | [maml_trainer] epoch #213 | Saving snapshot...
2025-04-01 15:20:47 | [maml_trainer] epoch #213 | Saved
2025-04-01 15:20:47 | [maml_trainer] epoch #213 | Time 263548.93 s
2025-04-01 15:20:47 | [maml_trainer] epoch #213 | EpochTime 1243.40 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.5246
Average/AverageReturn                               -60.226
Average/Iteration                                   213
Average/MaxReturn                                   -36.3934
Average/MinReturn                                  -144.557
Average/NumEpisodes                                  80
Average/StdReturn                                    17.9479
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95535
GaussianMLPPolicy/KLAfter                             0.00134356
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -7.69142e-05
GaussianMLPPolicy/LossBefore                          4.41074e-09
GaussianMLPPolicy/dLoss                               7.69186e-05
Iteration                                           213
MetaTest/Average/AverageDiscountedReturn            -58.1109
MetaTest/Average/AverageReturn                      -58.1109
MetaTest/Average/Iteration                          213
MetaTest/Average/MaxReturn                          -42.2011
MetaTest/Average/MinReturn                          -84.244
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           11.9772
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.1109
MetaTest/__unnamed_task__/AverageReturn             -58.1109
MetaTest/__unnamed_task__/Iteration                 213
MetaTest/__unnamed_task__/MaxReturn                 -42.2011
MetaTest/__unnamed_task__/MinReturn                 -84.244
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  11.9772
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.848e+06
__unnamed_task__/AverageDiscountedReturn            -29.5246
__unnamed_task__/AverageReturn                      -60.226
__unnamed_task__/Iteration                          213
__unnamed_task__/MaxReturn                          -36.3934
__unnamed_task__/MinReturn                         -144.557
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           17.9479
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 15:37:39 | [maml_trainer] epoch #214 | Sampling for adapation and meta-testing...
2025-04-01 15:41:52 | [maml_trainer] epoch #214 | Finished meta-testing...
2025-04-01 15:41:52 | [maml_trainer] epoch #214 | Saving snapshot...
2025-04-01 15:42:15 | [maml_trainer] epoch #214 | Saved
2025-04-01 15:42:15 | [maml_trainer] epoch #214 | Time 264836.25 s
2025-04-01 15:42:15 | [maml_trainer] epoch #214 | EpochTime 1287.32 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.5942
Average/AverageReturn                               -57.3412
Average/Iteration                                   214
Average/MaxReturn                                   -40.8056
Average/MinReturn                                  -146.3
Average/NumEpisodes                                  80
Average/StdReturn                                    15.745
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95543
GaussianMLPPolicy/KLAfter                             0.00151693
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -2.83251e-05
GaussianMLPPolicy/LossBefore                         -1.78814e-10
GaussianMLPPolicy/dLoss                               2.83249e-05
Iteration                                           214
MetaTest/Average/AverageDiscountedReturn            -64.6312
MetaTest/Average/AverageReturn                      -64.6312
MetaTest/Average/Iteration                          214
MetaTest/Average/MaxReturn                          -43.5461
MetaTest/Average/MinReturn                         -128.462
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           20.9722
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -64.6312
MetaTest/__unnamed_task__/AverageReturn             -64.6312
MetaTest/__unnamed_task__/Iteration                 214
MetaTest/__unnamed_task__/MaxReturn                 -43.5461
MetaTest/__unnamed_task__/MinReturn                -128.462
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  20.9722
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.88e+06
__unnamed_task__/AverageDiscountedReturn            -28.5942
__unnamed_task__/AverageReturn                      -57.3412
__unnamed_task__/Iteration                          214
__unnamed_task__/MaxReturn                          -40.8056
__unnamed_task__/MinReturn                         -146.3
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.745
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 15:59:13 | [maml_trainer] epoch #215 | Sampling for adapation and meta-testing...
2025-04-01 16:03:30 | [maml_trainer] epoch #215 | Finished meta-testing...
2025-04-01 16:03:30 | [maml_trainer] epoch #215 | Saving snapshot...
2025-04-01 16:03:51 | [maml_trainer] epoch #215 | Saved
2025-04-01 16:03:51 | [maml_trainer] epoch #215 | Time 266132.94 s
2025-04-01 16:03:51 | [maml_trainer] epoch #215 | EpochTime 1296.68 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.3474
Average/AverageReturn                               -59.7827
Average/Iteration                                   215
Average/MaxReturn                                   -40.3279
Average/MinReturn                                  -163.248
Average/NumEpisodes                                  80
Average/StdReturn                                    17.419
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95493
GaussianMLPPolicy/KLAfter                             0.00142055
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.01192e-05
GaussianMLPPolicy/LossBefore                          8.76188e-09
GaussianMLPPolicy/dLoss                               3.01279e-05
Iteration                                           215
MetaTest/Average/AverageDiscountedReturn            -60.7866
MetaTest/Average/AverageReturn                      -60.7866
MetaTest/Average/Iteration                          215
MetaTest/Average/MaxReturn                          -41.9661
MetaTest/Average/MinReturn                         -169.13
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           26.1563
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -60.7866
MetaTest/__unnamed_task__/AverageReturn             -60.7866
MetaTest/__unnamed_task__/Iteration                 215
MetaTest/__unnamed_task__/MaxReturn                 -41.9661
MetaTest/__unnamed_task__/MinReturn                -169.13
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  26.1563
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.912e+06
__unnamed_task__/AverageDiscountedReturn            -29.3474
__unnamed_task__/AverageReturn                      -59.7827
__unnamed_task__/Iteration                          215
__unnamed_task__/MaxReturn                          -40.3279
__unnamed_task__/MinReturn                         -163.248
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           17.419
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 16:20:46 | [maml_trainer] epoch #216 | Sampling for adapation and meta-testing...
2025-04-01 16:24:56 | [maml_trainer] epoch #216 | Finished meta-testing...
2025-04-01 16:24:56 | [maml_trainer] epoch #216 | Saving snapshot...
2025-04-01 16:25:19 | [maml_trainer] epoch #216 | Saved
2025-04-01 16:25:19 | [maml_trainer] epoch #216 | Time 267420.06 s
2025-04-01 16:25:19 | [maml_trainer] epoch #216 | EpochTime 1287.11 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.8995
Average/AverageReturn                               -60.6695
Average/Iteration                                   216
Average/MaxReturn                                   -39.9387
Average/MinReturn                                  -126.282
Average/NumEpisodes                                  80
Average/StdReturn                                    16.6059
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95391
GaussianMLPPolicy/KLAfter                             0.00134332
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.30621e-05
GaussianMLPPolicy/LossBefore                         -1.10269e-09
GaussianMLPPolicy/dLoss                              -1.30633e-05
Iteration                                           216
MetaTest/Average/AverageDiscountedReturn            -54.6595
MetaTest/Average/AverageReturn                      -54.6595
MetaTest/Average/Iteration                          216
MetaTest/Average/MaxReturn                          -44.8731
MetaTest/Average/MinReturn                          -80.0829
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            9.76017
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.6595
MetaTest/__unnamed_task__/AverageReturn             -54.6595
MetaTest/__unnamed_task__/Iteration                 216
MetaTest/__unnamed_task__/MaxReturn                 -44.8731
MetaTest/__unnamed_task__/MinReturn                 -80.0829
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   9.76017
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.944e+06
__unnamed_task__/AverageDiscountedReturn            -29.8995
__unnamed_task__/AverageReturn                      -60.6695
__unnamed_task__/Iteration                          216
__unnamed_task__/MaxReturn                          -39.9387
__unnamed_task__/MinReturn                         -126.282
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           16.6059
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 16:42:22 | [maml_trainer] epoch #217 | Sampling for adapation and meta-testing...
2025-04-01 16:46:34 | [maml_trainer] epoch #217 | Finished meta-testing...
2025-04-01 16:46:34 | [maml_trainer] epoch #217 | Saving snapshot...
2025-04-01 16:46:58 | [maml_trainer] epoch #217 | Saved
2025-04-01 16:46:58 | [maml_trainer] epoch #217 | Time 268719.14 s
2025-04-01 16:46:58 | [maml_trainer] epoch #217 | EpochTime 1299.08 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.2632
Average/AverageReturn                               -59.8967
Average/Iteration                                   217
Average/MaxReturn                                   -40.3991
Average/MinReturn                                  -145.691
Average/NumEpisodes                                  80
Average/StdReturn                                    16.3875
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95338
GaussianMLPPolicy/KLAfter                             0.00125536
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.00010306
GaussianMLPPolicy/LossBefore                          1.63913e-09
GaussianMLPPolicy/dLoss                               0.000103061
Iteration                                           217
MetaTest/Average/AverageDiscountedReturn            -58.9484
MetaTest/Average/AverageReturn                      -58.9484
MetaTest/Average/Iteration                          217
MetaTest/Average/MaxReturn                          -39.3426
MetaTest/Average/MinReturn                         -110.595
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.7639
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -58.9484
MetaTest/__unnamed_task__/AverageReturn             -58.9484
MetaTest/__unnamed_task__/Iteration                 217
MetaTest/__unnamed_task__/MaxReturn                 -39.3426
MetaTest/__unnamed_task__/MinReturn                -110.595
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.7639
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         6.976e+06
__unnamed_task__/AverageDiscountedReturn            -29.2632
__unnamed_task__/AverageReturn                      -59.8967
__unnamed_task__/Iteration                          217
__unnamed_task__/MaxReturn                          -40.3991
__unnamed_task__/MinReturn                         -145.691
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           16.3875
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 17:03:06 | [maml_trainer] epoch #218 | Sampling for adapation and meta-testing...
2025-04-01 17:07:02 | [maml_trainer] epoch #218 | Finished meta-testing...
2025-04-01 17:07:02 | [maml_trainer] epoch #218 | Saving snapshot...
2025-04-01 17:07:24 | [maml_trainer] epoch #218 | Saved
2025-04-01 17:07:24 | [maml_trainer] epoch #218 | Time 269945.21 s
2025-04-01 17:07:24 | [maml_trainer] epoch #218 | EpochTime 1226.06 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.5131
Average/AverageReturn                               -59.7717
Average/Iteration                                   218
Average/MaxReturn                                   -39.1226
Average/MinReturn                                  -169.532
Average/NumEpisodes                                  80
Average/StdReturn                                    20.0767
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95336
GaussianMLPPolicy/KLAfter                             0.00151707
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.32023e-05
GaussianMLPPolicy/LossBefore                          3.06964e-09
GaussianMLPPolicy/dLoss                              -1.31992e-05
Iteration                                           218
MetaTest/Average/AverageDiscountedReturn            -61.0529
MetaTest/Average/AverageReturn                      -61.0529
MetaTest/Average/Iteration                          218
MetaTest/Average/MaxReturn                          -40.8253
MetaTest/Average/MinReturn                          -91.9374
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           12.8655
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -61.0529
MetaTest/__unnamed_task__/AverageReturn             -61.0529
MetaTest/__unnamed_task__/Iteration                 218
MetaTest/__unnamed_task__/MaxReturn                 -40.8253
MetaTest/__unnamed_task__/MinReturn                 -91.9374
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  12.8655
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.008e+06
__unnamed_task__/AverageDiscountedReturn            -29.5131
__unnamed_task__/AverageReturn                      -59.7717
__unnamed_task__/Iteration                          218
__unnamed_task__/MaxReturn                          -39.1226
__unnamed_task__/MinReturn                         -169.532
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           20.0767
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 17:23:19 | [maml_trainer] epoch #219 | Sampling for adapation and meta-testing...
2025-04-01 17:27:20 | [maml_trainer] epoch #219 | Finished meta-testing...
2025-04-01 17:27:20 | [maml_trainer] epoch #219 | Saving snapshot...
2025-04-01 17:27:41 | [maml_trainer] epoch #219 | Saved
2025-04-01 17:27:41 | [maml_trainer] epoch #219 | Time 271162.50 s
2025-04-01 17:27:41 | [maml_trainer] epoch #219 | EpochTime 1217.29 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.0074
Average/AverageReturn                               -58.7238
Average/Iteration                                   219
Average/MaxReturn                                   -41.001
Average/MinReturn                                  -126.648
Average/NumEpisodes                                  80
Average/StdReturn                                    14.3082
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95326
GaussianMLPPolicy/KLAfter                             0.00130345
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           7.37594e-05
GaussianMLPPolicy/LossBefore                         -3.18885e-09
GaussianMLPPolicy/dLoss                              -7.37626e-05
Iteration                                           219
MetaTest/Average/AverageDiscountedReturn            -60.7882
MetaTest/Average/AverageReturn                      -60.7882
MetaTest/Average/Iteration                          219
MetaTest/Average/MaxReturn                          -45.3926
MetaTest/Average/MinReturn                         -103.251
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.4249
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -60.7882
MetaTest/__unnamed_task__/AverageReturn             -60.7882
MetaTest/__unnamed_task__/Iteration                 219
MetaTest/__unnamed_task__/MaxReturn                 -45.3926
MetaTest/__unnamed_task__/MinReturn                -103.251
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.4249
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.04e+06
__unnamed_task__/AverageDiscountedReturn            -29.0074
__unnamed_task__/AverageReturn                      -58.7238
__unnamed_task__/Iteration                          219
__unnamed_task__/MaxReturn                          -41.001
__unnamed_task__/MinReturn                         -126.648
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.3082
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 17:43:45 | [maml_trainer] epoch #220 | Sampling for adapation and meta-testing...
2025-04-01 17:47:49 | [maml_trainer] epoch #220 | Finished meta-testing...
2025-04-01 17:47:49 | [maml_trainer] epoch #220 | Saving snapshot...
2025-04-01 17:48:09 | [maml_trainer] epoch #220 | Saved
2025-04-01 17:48:09 | [maml_trainer] epoch #220 | Time 272390.68 s
2025-04-01 17:48:09 | [maml_trainer] epoch #220 | EpochTime 1228.18 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.9283
Average/AverageReturn                               -62.5462
Average/Iteration                                   220
Average/MaxReturn                                   -41.0618
Average/MinReturn                                  -181.433
Average/NumEpisodes                                  80
Average/StdReturn                                    22.1879
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95356
GaussianMLPPolicy/KLAfter                             0.00172858
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -4.42247e-05
GaussianMLPPolicy/LossBefore                          6.75023e-09
GaussianMLPPolicy/dLoss                               4.42315e-05
Iteration                                           220
MetaTest/Average/AverageDiscountedReturn            -57.0691
MetaTest/Average/AverageReturn                      -57.0691
MetaTest/Average/Iteration                          220
MetaTest/Average/MaxReturn                          -43.3695
MetaTest/Average/MinReturn                          -90.204
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           13.6892
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -57.0691
MetaTest/__unnamed_task__/AverageReturn             -57.0691
MetaTest/__unnamed_task__/Iteration                 220
MetaTest/__unnamed_task__/MaxReturn                 -43.3695
MetaTest/__unnamed_task__/MinReturn                 -90.204
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  13.6892
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.072e+06
__unnamed_task__/AverageDiscountedReturn            -29.9283
__unnamed_task__/AverageReturn                      -62.5462
__unnamed_task__/Iteration                          220
__unnamed_task__/MaxReturn                          -41.0618
__unnamed_task__/MinReturn                         -181.433
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           22.1879
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 18:04:13 | [maml_trainer] epoch #221 | Sampling for adapation and meta-testing...
2025-04-01 18:08:10 | [maml_trainer] epoch #221 | Finished meta-testing...
2025-04-01 18:08:10 | [maml_trainer] epoch #221 | Saving snapshot...
2025-04-01 18:08:31 | [maml_trainer] epoch #221 | Saved
2025-04-01 18:08:31 | [maml_trainer] epoch #221 | Time 273612.53 s
2025-04-01 18:08:31 | [maml_trainer] epoch #221 | EpochTime 1221.84 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.7081
Average/AverageReturn                               -64.6008
Average/Iteration                                   221
Average/MaxReturn                                   -40.6212
Average/MinReturn                                  -143.004
Average/NumEpisodes                                  80
Average/StdReturn                                    17.7765
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95263
GaussianMLPPolicy/KLAfter                             0.000559091
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           5.61418e-05
GaussianMLPPolicy/LossBefore                          2.20537e-09
GaussianMLPPolicy/dLoss                              -5.61396e-05
Iteration                                           221
MetaTest/Average/AverageDiscountedReturn            -67.1405
MetaTest/Average/AverageReturn                      -67.1405
MetaTest/Average/Iteration                          221
MetaTest/Average/MaxReturn                          -44.7101
MetaTest/Average/MinReturn                         -115.8
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           19.2974
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -67.1405
MetaTest/__unnamed_task__/AverageReturn             -67.1405
MetaTest/__unnamed_task__/Iteration                 221
MetaTest/__unnamed_task__/MaxReturn                 -44.7101
MetaTest/__unnamed_task__/MinReturn                -115.8
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  19.2974
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.104e+06
__unnamed_task__/AverageDiscountedReturn            -30.7081
__unnamed_task__/AverageReturn                      -64.6008
__unnamed_task__/Iteration                          221
__unnamed_task__/MaxReturn                          -40.6212
__unnamed_task__/MinReturn                         -143.004
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           17.7765
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 18:24:39 | [maml_trainer] epoch #222 | Sampling for adapation and meta-testing...
2025-04-01 18:28:37 | [maml_trainer] epoch #222 | Finished meta-testing...
2025-04-01 18:28:37 | [maml_trainer] epoch #222 | Saving snapshot...
2025-04-01 18:28:59 | [maml_trainer] epoch #222 | Saved
2025-04-01 18:28:59 | [maml_trainer] epoch #222 | Time 274840.28 s
2025-04-01 18:28:59 | [maml_trainer] epoch #222 | EpochTime 1227.75 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.1527
Average/AverageReturn                               -63.553
Average/Iteration                                   222
Average/MaxReturn                                   -38.6175
Average/MinReturn                                  -178.63
Average/NumEpisodes                                  80
Average/StdReturn                                    24.1403
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95231
GaussianMLPPolicy/KLAfter                             0.000405224
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -4.01754e-05
GaussianMLPPolicy/LossBefore                         -6.16908e-09
GaussianMLPPolicy/dLoss                               4.01692e-05
Iteration                                           222
MetaTest/Average/AverageDiscountedReturn            -64.0891
MetaTest/Average/AverageReturn                      -64.0891
MetaTest/Average/Iteration                          222
MetaTest/Average/MaxReturn                          -43.2202
MetaTest/Average/MinReturn                         -104.848
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.5352
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -64.0891
MetaTest/__unnamed_task__/AverageReturn             -64.0891
MetaTest/__unnamed_task__/Iteration                 222
MetaTest/__unnamed_task__/MaxReturn                 -43.2202
MetaTest/__unnamed_task__/MinReturn                -104.848
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.5352
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.136e+06
__unnamed_task__/AverageDiscountedReturn            -30.1527
__unnamed_task__/AverageReturn                      -63.553
__unnamed_task__/Iteration                          222
__unnamed_task__/MaxReturn                          -38.6175
__unnamed_task__/MinReturn                         -178.63
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           24.1403
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 18:45:00 | [maml_trainer] epoch #223 | Sampling for adapation and meta-testing...
2025-04-01 18:49:00 | [maml_trainer] epoch #223 | Finished meta-testing...
2025-04-01 18:49:00 | [maml_trainer] epoch #223 | Saving snapshot...
2025-04-01 18:49:22 | [maml_trainer] epoch #223 | Saved
2025-04-01 18:49:22 | [maml_trainer] epoch #223 | Time 276063.08 s
2025-04-01 18:49:22 | [maml_trainer] epoch #223 | EpochTime 1222.79 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -30.631
Average/AverageReturn                               -63.742
Average/Iteration                                   223
Average/MaxReturn                                   -40.8908
Average/MinReturn                                  -137.259
Average/NumEpisodes                                  80
Average/StdReturn                                    18.0266
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95219
GaussianMLPPolicy/KLAfter                             0.000691688
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.83395e-05
GaussianMLPPolicy/LossBefore                         -3.8147e-09
GaussianMLPPolicy/dLoss                              -2.83433e-05
Iteration                                           223
MetaTest/Average/AverageDiscountedReturn            -60.2212
MetaTest/Average/AverageReturn                      -60.2212
MetaTest/Average/Iteration                          223
MetaTest/Average/MaxReturn                          -41.4618
MetaTest/Average/MinReturn                         -108.724
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.6006
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -60.2212
MetaTest/__unnamed_task__/AverageReturn             -60.2212
MetaTest/__unnamed_task__/Iteration                 223
MetaTest/__unnamed_task__/MaxReturn                 -41.4618
MetaTest/__unnamed_task__/MinReturn                -108.724
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.6006
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.168e+06
__unnamed_task__/AverageDiscountedReturn            -30.631
__unnamed_task__/AverageReturn                      -63.742
__unnamed_task__/Iteration                          223
__unnamed_task__/MaxReturn                          -40.8908
__unnamed_task__/MinReturn                         -137.259
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           18.0266
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 19:05:14 | [maml_trainer] epoch #224 | Sampling for adapation and meta-testing...
2025-04-01 19:09:12 | [maml_trainer] epoch #224 | Finished meta-testing...
2025-04-01 19:09:12 | [maml_trainer] epoch #224 | Saving snapshot...
2025-04-01 19:09:33 | [maml_trainer] epoch #224 | Saved
2025-04-01 19:09:33 | [maml_trainer] epoch #224 | Time 277274.71 s
2025-04-01 19:09:33 | [maml_trainer] epoch #224 | EpochTime 1211.63 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -31.0826
Average/AverageReturn                               -66.3327
Average/Iteration                                   224
Average/MaxReturn                                   -41.5343
Average/MinReturn                                  -152.777
Average/NumEpisodes                                  80
Average/StdReturn                                    20.2861
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95228
GaussianMLPPolicy/KLAfter                             0.000621854
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.66867e-05
GaussianMLPPolicy/LossBefore                         -8.01682e-09
GaussianMLPPolicy/dLoss                               3.66787e-05
Iteration                                           224
MetaTest/Average/AverageDiscountedReturn            -64.3237
MetaTest/Average/AverageReturn                      -64.3237
MetaTest/Average/Iteration                          224
MetaTest/Average/MaxReturn                          -42.9015
MetaTest/Average/MinReturn                         -122.034
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           19.4784
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -64.3237
MetaTest/__unnamed_task__/AverageReturn             -64.3237
MetaTest/__unnamed_task__/Iteration                 224
MetaTest/__unnamed_task__/MaxReturn                 -42.9015
MetaTest/__unnamed_task__/MinReturn                -122.034
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  19.4784
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.2e+06
__unnamed_task__/AverageDiscountedReturn            -31.0826
__unnamed_task__/AverageReturn                      -66.3327
__unnamed_task__/Iteration                          224
__unnamed_task__/MaxReturn                          -41.5343
__unnamed_task__/MinReturn                         -152.777
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           20.2861
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 19:25:27 | [maml_trainer] epoch #225 | Sampling for adapation and meta-testing...
2025-04-01 19:29:30 | [maml_trainer] epoch #225 | Finished meta-testing...
2025-04-01 19:29:30 | [maml_trainer] epoch #225 | Saving snapshot...
2025-04-01 19:29:51 | [maml_trainer] epoch #225 | Saved
2025-04-01 19:29:51 | [maml_trainer] epoch #225 | Time 278492.76 s
2025-04-01 19:29:51 | [maml_trainer] epoch #225 | EpochTime 1218.05 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.7606
Average/AverageReturn                               -60.4381
Average/Iteration                                   225
Average/MaxReturn                                   -40.9843
Average/MinReturn                                  -101.823
Average/NumEpisodes                                  80
Average/StdReturn                                    13.5664
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95216
GaussianMLPPolicy/KLAfter                             0.00127431
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -9.22008e-05
GaussianMLPPolicy/LossBefore                         -8.25524e-09
GaussianMLPPolicy/dLoss                               9.21925e-05
Iteration                                           225
MetaTest/Average/AverageDiscountedReturn            -59.8797
MetaTest/Average/AverageReturn                      -59.8797
MetaTest/Average/Iteration                          225
MetaTest/Average/MaxReturn                          -42.5913
MetaTest/Average/MinReturn                         -115.814
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           16.8107
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -59.8797
MetaTest/__unnamed_task__/AverageReturn             -59.8797
MetaTest/__unnamed_task__/Iteration                 225
MetaTest/__unnamed_task__/MaxReturn                 -42.5913
MetaTest/__unnamed_task__/MinReturn                -115.814
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  16.8107
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.232e+06
__unnamed_task__/AverageDiscountedReturn            -29.7606
__unnamed_task__/AverageReturn                      -60.4381
__unnamed_task__/Iteration                          225
__unnamed_task__/MaxReturn                          -40.9843
__unnamed_task__/MinReturn                         -101.823
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.5664
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 19:45:42 | [maml_trainer] epoch #226 | Sampling for adapation and meta-testing...
2025-04-01 19:49:39 | [maml_trainer] epoch #226 | Finished meta-testing...
2025-04-01 19:49:39 | [maml_trainer] epoch #226 | Saving snapshot...
2025-04-01 19:50:01 | [maml_trainer] epoch #226 | Saved
2025-04-01 19:50:01 | [maml_trainer] epoch #226 | Time 279702.25 s
2025-04-01 19:50:01 | [maml_trainer] epoch #226 | EpochTime 1209.48 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -29.9599
Average/AverageReturn                               -61.2007
Average/Iteration                                   226
Average/MaxReturn                                   -39.8321
Average/MinReturn                                  -186.076
Average/NumEpisodes                                  80
Average/StdReturn                                    20.0038
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95333
GaussianMLPPolicy/KLAfter                             0.00180305
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -3.08623e-05
GaussianMLPPolicy/LossBefore                         -2.66731e-09
GaussianMLPPolicy/dLoss                               3.08596e-05
Iteration                                           226
MetaTest/Average/AverageDiscountedReturn            -53.2917
MetaTest/Average/AverageReturn                      -53.2917
MetaTest/Average/Iteration                          226
MetaTest/Average/MaxReturn                          -41.2371
MetaTest/Average/MinReturn                          -71.0958
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.95838
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -53.2917
MetaTest/__unnamed_task__/AverageReturn             -53.2917
MetaTest/__unnamed_task__/Iteration                 226
MetaTest/__unnamed_task__/MaxReturn                 -41.2371
MetaTest/__unnamed_task__/MinReturn                 -71.0958
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.95838
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.264e+06
__unnamed_task__/AverageDiscountedReturn            -29.9599
__unnamed_task__/AverageReturn                      -61.2007
__unnamed_task__/Iteration                          226
__unnamed_task__/MaxReturn                          -39.8321
__unnamed_task__/MinReturn                         -186.076
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           20.0038
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 20:05:55 | [maml_trainer] epoch #227 | Sampling for adapation and meta-testing...
2025-04-01 20:09:54 | [maml_trainer] epoch #227 | Finished meta-testing...
2025-04-01 20:09:54 | [maml_trainer] epoch #227 | Saving snapshot...
2025-04-01 20:10:16 | [maml_trainer] epoch #227 | Saved
2025-04-01 20:10:16 | [maml_trainer] epoch #227 | Time 280917.37 s
2025-04-01 20:10:16 | [maml_trainer] epoch #227 | EpochTime 1215.12 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -28.9097
Average/AverageReturn                               -57.4468
Average/Iteration                                   227
Average/MaxReturn                                   -39.5265
Average/MinReturn                                  -145.193
Average/NumEpisodes                                  80
Average/StdReturn                                    15.228
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.95323
GaussianMLPPolicy/KLAfter                             0.00219729
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -7.0556e-05
GaussianMLPPolicy/LossBefore                         -3.93391e-09
GaussianMLPPolicy/dLoss                               7.05521e-05
Iteration                                           227
MetaTest/Average/AverageDiscountedReturn            -54.2149
MetaTest/Average/AverageReturn                      -54.2149
MetaTest/Average/Iteration                          227
MetaTest/Average/MaxReturn                          -41.4429
MetaTest/Average/MinReturn                          -84.0026
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           12.5782
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.2149
MetaTest/__unnamed_task__/AverageReturn             -54.2149
MetaTest/__unnamed_task__/Iteration                 227
MetaTest/__unnamed_task__/MaxReturn                 -41.4429
MetaTest/__unnamed_task__/MinReturn                 -84.0026
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  12.5782
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.296e+06
__unnamed_task__/AverageDiscountedReturn            -28.9097
__unnamed_task__/AverageReturn                      -57.4468
__unnamed_task__/Iteration                          227
__unnamed_task__/MaxReturn                          -39.5265
__unnamed_task__/MinReturn                         -145.193
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           15.228
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-01 20:26:24 | [maml_trainer] epoch #228 | Sampling for adapation and meta-testing...
2025-04-01 20:30:23 | [maml_trainer] epoch #228 | Finished meta-testing...
2025-04-01 20:30:23 | [maml_trainer] epoch #228 | Saving snapshot...
2025-04-01 20:30:44 | [maml_trainer] epoch #228 | Saved
2025-04-01 20:30:44 | [maml_trainer] epoch #228 | Time 282145.12 s
2025-04-01 20:30:44 | [maml_trainer] epoch #228 | EpochTime 1227.75 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -29.1678
Average/AverageReturn                              -56.2536
Average/Iteration                                  228
Average/MaxReturn                                   24.3872
Average/MinReturn                                  -90.9681
Average/NumEpisodes                                 80
Average/StdReturn                                   14.7645
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95224
GaussianMLPPolicy/KLAfter                            0.00104123
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.39441e-05
GaussianMLPPolicy/LossBefore                         7.24196e-09
GaussianMLPPolicy/dLoss                              3.39513e-05
Iteration                                          228
MetaTest/Average/AverageDiscountedReturn           -45.4774
MetaTest/Average/AverageReturn                     -45.4774
MetaTest/Average/Iteration                         228
MetaTest/Average/MaxReturn                          88.9481
MetaTest/Average/MinReturn                         -71.4604
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          31.7677
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -45.4774
MetaTest/__unnamed_task__/AverageReturn            -45.4774
MetaTest/__unnamed_task__/Iteration                228
MetaTest/__unnamed_task__/MaxReturn                 88.9481
MetaTest/__unnamed_task__/MinReturn                -71.4604
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 31.7677
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.328e+06
__unnamed_task__/AverageDiscountedReturn           -29.1678
__unnamed_task__/AverageReturn                     -56.2536
__unnamed_task__/Iteration                         228
__unnamed_task__/MaxReturn                          24.3872
__unnamed_task__/MinReturn                         -90.9681
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.7645
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 20:46:41 | [maml_trainer] epoch #229 | Sampling for adapation and meta-testing...
2025-04-01 20:50:48 | [maml_trainer] epoch #229 | Finished meta-testing...
2025-04-01 20:50:48 | [maml_trainer] epoch #229 | Saving snapshot...
2025-04-01 20:51:11 | [maml_trainer] epoch #229 | Saved
2025-04-01 20:51:11 | [maml_trainer] epoch #229 | Time 283372.56 s
2025-04-01 20:51:11 | [maml_trainer] epoch #229 | EpochTime 1227.43 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.5701
Average/AverageReturn                              -55.3511
Average/Iteration                                  229
Average/MaxReturn                                  -40.7992
Average/MinReturn                                  -83.4228
Average/NumEpisodes                                 80
Average/StdReturn                                   10.5604
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95088
GaussianMLPPolicy/KLAfter                            0.00254199
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000119399
GaussianMLPPolicy/LossBefore                        -6.02007e-09
GaussianMLPPolicy/dLoss                              0.000119393
Iteration                                          229
MetaTest/Average/AverageDiscountedReturn           -54.4706
MetaTest/Average/AverageReturn                     -54.4706
MetaTest/Average/Iteration                         229
MetaTest/Average/MaxReturn                         -44.4829
MetaTest/Average/MinReturn                         -76.3939
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.6173
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -54.4706
MetaTest/__unnamed_task__/AverageReturn            -54.4706
MetaTest/__unnamed_task__/Iteration                229
MetaTest/__unnamed_task__/MaxReturn                -44.4829
MetaTest/__unnamed_task__/MinReturn                -76.3939
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.6173
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.36e+06
__unnamed_task__/AverageDiscountedReturn           -28.5701
__unnamed_task__/AverageReturn                     -55.3511
__unnamed_task__/Iteration                         229
__unnamed_task__/MaxReturn                         -40.7992
__unnamed_task__/MinReturn                         -83.4228
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.5604
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 21:08:02 | [maml_trainer] epoch #230 | Sampling for adapation and meta-testing...
2025-04-01 21:12:13 | [maml_trainer] epoch #230 | Finished meta-testing...
2025-04-01 21:12:13 | [maml_trainer] epoch #230 | Saving snapshot...
2025-04-01 21:12:35 | [maml_trainer] epoch #230 | Saved
2025-04-01 21:12:35 | [maml_trainer] epoch #230 | Time 284656.96 s
2025-04-01 21:12:35 | [maml_trainer] epoch #230 | EpochTime 1284.40 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.7223
Average/AverageReturn                              -51.334
Average/Iteration                                  230
Average/MaxReturn                                  -39.6765
Average/MinReturn                                  -74.9368
Average/NumEpisodes                                 80
Average/StdReturn                                    7.64695
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94931
GaussianMLPPolicy/KLAfter                            0.00260824
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.36295e-05
GaussianMLPPolicy/LossBefore                        -1.01328e-09
GaussianMLPPolicy/dLoss                              5.36285e-05
Iteration                                          230
MetaTest/Average/AverageDiscountedReturn           -56.1934
MetaTest/Average/AverageReturn                     -56.1934
MetaTest/Average/Iteration                         230
MetaTest/Average/MaxReturn                         -40.9612
MetaTest/Average/MinReturn                         -80.2339
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.9156
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -56.1934
MetaTest/__unnamed_task__/AverageReturn            -56.1934
MetaTest/__unnamed_task__/Iteration                230
MetaTest/__unnamed_task__/MaxReturn                -40.9612
MetaTest/__unnamed_task__/MinReturn                -80.2339
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.9156
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.392e+06
__unnamed_task__/AverageDiscountedReturn           -27.7223
__unnamed_task__/AverageReturn                     -51.334
__unnamed_task__/Iteration                         230
__unnamed_task__/MaxReturn                         -39.6765
__unnamed_task__/MinReturn                         -74.9368
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.64695
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 21:29:28 | [maml_trainer] epoch #231 | Sampling for adapation and meta-testing...
2025-04-01 21:33:41 | [maml_trainer] epoch #231 | Finished meta-testing...
2025-04-01 21:33:41 | [maml_trainer] epoch #231 | Saving snapshot...
2025-04-01 21:34:04 | [maml_trainer] epoch #231 | Saved
2025-04-01 21:34:04 | [maml_trainer] epoch #231 | Time 285945.45 s
2025-04-01 21:34:04 | [maml_trainer] epoch #231 | EpochTime 1288.49 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -28.4765
Average/AverageReturn                              -54.6097
Average/Iteration                                  231
Average/MaxReturn                                  -41.3022
Average/MinReturn                                  -86.3969
Average/NumEpisodes                                 80
Average/StdReturn                                   10.8106
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94881
GaussianMLPPolicy/KLAfter                            0.00188031
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.2794e-05
GaussianMLPPolicy/LossBefore                        -7.39098e-09
GaussianMLPPolicy/dLoss                              6.27866e-05
Iteration                                          231
MetaTest/Average/AverageDiscountedReturn           -50.6968
MetaTest/Average/AverageReturn                     -50.6968
MetaTest/Average/Iteration                         231
MetaTest/Average/MaxReturn                         -43.0984
MetaTest/Average/MinReturn                         -76.3966
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.78469
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.6968
MetaTest/__unnamed_task__/AverageReturn            -50.6968
MetaTest/__unnamed_task__/Iteration                231
MetaTest/__unnamed_task__/MaxReturn                -43.0984
MetaTest/__unnamed_task__/MinReturn                -76.3966
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.78469
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.424e+06
__unnamed_task__/AverageDiscountedReturn           -28.4765
__unnamed_task__/AverageReturn                     -54.6097
__unnamed_task__/Iteration                         231
__unnamed_task__/MaxReturn                         -41.3022
__unnamed_task__/MinReturn                         -86.3969
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.8106
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 21:51:08 | [maml_trainer] epoch #232 | Sampling for adapation and meta-testing...
2025-04-01 21:55:24 | [maml_trainer] epoch #232 | Finished meta-testing...
2025-04-01 21:55:24 | [maml_trainer] epoch #232 | Saving snapshot...
2025-04-01 21:55:47 | [maml_trainer] epoch #232 | Saved
2025-04-01 21:55:47 | [maml_trainer] epoch #232 | Time 287248.76 s
2025-04-01 21:55:47 | [maml_trainer] epoch #232 | EpochTime 1303.30 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.69
Average/AverageReturn                              -51.6284
Average/Iteration                                  232
Average/MaxReturn                                  -42.6228
Average/MinReturn                                  -74.9602
Average/NumEpisodes                                 80
Average/StdReturn                                    6.66382
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94762
GaussianMLPPolicy/KLAfter                            0.00176964
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.44559e-05
GaussianMLPPolicy/LossBefore                        -1.54972e-08
GaussianMLPPolicy/dLoss                              2.44404e-05
Iteration                                          232
MetaTest/Average/AverageDiscountedReturn           -52.4178
MetaTest/Average/AverageReturn                     -52.4178
MetaTest/Average/Iteration                         232
MetaTest/Average/MaxReturn                         -44.0578
MetaTest/Average/MinReturn                         -77.9857
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.45133
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -52.4178
MetaTest/__unnamed_task__/AverageReturn            -52.4178
MetaTest/__unnamed_task__/Iteration                232
MetaTest/__unnamed_task__/MaxReturn                -44.0578
MetaTest/__unnamed_task__/MinReturn                -77.9857
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.45133
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.456e+06
__unnamed_task__/AverageDiscountedReturn           -27.69
__unnamed_task__/AverageReturn                     -51.6284
__unnamed_task__/Iteration                         232
__unnamed_task__/MaxReturn                         -42.6228
__unnamed_task__/MinReturn                         -74.9602
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.66382
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 22:12:56 | [maml_trainer] epoch #233 | Sampling for adapation and meta-testing...
2025-04-01 22:17:16 | [maml_trainer] epoch #233 | Finished meta-testing...
2025-04-01 22:17:16 | [maml_trainer] epoch #233 | Saving snapshot...
2025-04-01 22:17:38 | [maml_trainer] epoch #233 | Saved
2025-04-01 22:17:38 | [maml_trainer] epoch #233 | Time 288559.10 s
2025-04-01 22:17:38 | [maml_trainer] epoch #233 | EpochTime 1310.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.903
Average/AverageReturn                              -51.5947
Average/Iteration                                  233
Average/MaxReturn                                  -40.7258
Average/MinReturn                                  -80.3938
Average/NumEpisodes                                 80
Average/StdReturn                                    7.31757
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94633
GaussianMLPPolicy/KLAfter                            0.00242864
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.13658e-05
GaussianMLPPolicy/LossBefore                        -1.2815e-08
GaussianMLPPolicy/dLoss                              6.1353e-05
Iteration                                          233
MetaTest/Average/AverageDiscountedReturn           -51.6322
MetaTest/Average/AverageReturn                     -51.6322
MetaTest/Average/Iteration                         233
MetaTest/Average/MaxReturn                         -43.726
MetaTest/Average/MinReturn                         -71.9067
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.01804
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.6322
MetaTest/__unnamed_task__/AverageReturn            -51.6322
MetaTest/__unnamed_task__/Iteration                233
MetaTest/__unnamed_task__/MaxReturn                -43.726
MetaTest/__unnamed_task__/MinReturn                -71.9067
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.01804
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.488e+06
__unnamed_task__/AverageDiscountedReturn           -27.903
__unnamed_task__/AverageReturn                     -51.5947
__unnamed_task__/Iteration                         233
__unnamed_task__/MaxReturn                         -40.7258
__unnamed_task__/MinReturn                         -80.3938
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.31757
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 22:35:02 | [maml_trainer] epoch #234 | Sampling for adapation and meta-testing...
2025-04-01 22:39:20 | [maml_trainer] epoch #234 | Finished meta-testing...
2025-04-01 22:39:20 | [maml_trainer] epoch #234 | Saving snapshot...
2025-04-01 22:39:43 | [maml_trainer] epoch #234 | Saved
2025-04-01 22:39:43 | [maml_trainer] epoch #234 | Time 289884.38 s
2025-04-01 22:39:43 | [maml_trainer] epoch #234 | EpochTime 1325.28 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.4796
Average/AverageReturn                              -50.8213
Average/Iteration                                  234
Average/MaxReturn                                  -42.6073
Average/MinReturn                                  -76.3643
Average/NumEpisodes                                 80
Average/StdReturn                                    6.26445
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9443
GaussianMLPPolicy/KLAfter                            0.00144548
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.99056e-05
GaussianMLPPolicy/LossBefore                         1.37091e-09
GaussianMLPPolicy/dLoss                             -1.99042e-05
Iteration                                          234
MetaTest/Average/AverageDiscountedReturn           -51.2445
MetaTest/Average/AverageReturn                     -51.2445
MetaTest/Average/Iteration                         234
MetaTest/Average/MaxReturn                         -44.6866
MetaTest/Average/MinReturn                         -73.8342
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.19308
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.2445
MetaTest/__unnamed_task__/AverageReturn            -51.2445
MetaTest/__unnamed_task__/Iteration                234
MetaTest/__unnamed_task__/MaxReturn                -44.6866
MetaTest/__unnamed_task__/MinReturn                -73.8342
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.19308
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.52e+06
__unnamed_task__/AverageDiscountedReturn           -27.4796
__unnamed_task__/AverageReturn                     -50.8213
__unnamed_task__/Iteration                         234
__unnamed_task__/MaxReturn                         -42.6073
__unnamed_task__/MinReturn                         -76.3643
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.26445
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 22:56:55 | [maml_trainer] epoch #235 | Sampling for adapation and meta-testing...
2025-04-01 23:01:13 | [maml_trainer] epoch #235 | Finished meta-testing...
2025-04-01 23:01:13 | [maml_trainer] epoch #235 | Saving snapshot...
2025-04-01 23:01:36 | [maml_trainer] epoch #235 | Saved
2025-04-01 23:01:36 | [maml_trainer] epoch #235 | Time 291198.00 s
2025-04-01 23:01:36 | [maml_trainer] epoch #235 | EpochTime 1313.61 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.0465
Average/AverageReturn                              -50.3442
Average/Iteration                                  235
Average/MaxReturn                                  -40.3661
Average/MinReturn                                  -68.3778
Average/NumEpisodes                                 80
Average/StdReturn                                    5.26833
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94166
GaussianMLPPolicy/KLAfter                            0.00163146
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.18006e-05
GaussianMLPPolicy/LossBefore                        -9.83477e-09
GaussianMLPPolicy/dLoss                             -7.18104e-05
Iteration                                          235
MetaTest/Average/AverageDiscountedReturn           -52.6586
MetaTest/Average/AverageReturn                     -52.6586
MetaTest/Average/Iteration                         235
MetaTest/Average/MaxReturn                         -43.5997
MetaTest/Average/MinReturn                         -69.5793
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.80969
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -52.6586
MetaTest/__unnamed_task__/AverageReturn            -52.6586
MetaTest/__unnamed_task__/Iteration                235
MetaTest/__unnamed_task__/MaxReturn                -43.5997
MetaTest/__unnamed_task__/MinReturn                -69.5793
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.80969
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.552e+06
__unnamed_task__/AverageDiscountedReturn           -27.0465
__unnamed_task__/AverageReturn                     -50.3442
__unnamed_task__/Iteration                         235
__unnamed_task__/MaxReturn                         -40.3661
__unnamed_task__/MinReturn                         -68.3778
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.26833
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 23:18:48 | [maml_trainer] epoch #236 | Sampling for adapation and meta-testing...
2025-04-01 23:23:04 | [maml_trainer] epoch #236 | Finished meta-testing...
2025-04-01 23:23:04 | [maml_trainer] epoch #236 | Saving snapshot...
2025-04-01 23:23:27 | [maml_trainer] epoch #236 | Saved
2025-04-01 23:23:27 | [maml_trainer] epoch #236 | Time 292508.18 s
2025-04-01 23:23:27 | [maml_trainer] epoch #236 | EpochTime 1310.18 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.1652
Average/AverageReturn                              -50.0848
Average/Iteration                                  236
Average/MaxReturn                                  -41.6745
Average/MinReturn                                  -73.1352
Average/NumEpisodes                                 80
Average/StdReturn                                    5.97698
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93755
GaussianMLPPolicy/KLAfter                            0.00391106
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.34783e-05
GaussianMLPPolicy/LossBefore                         4.35114e-09
GaussianMLPPolicy/dLoss                             -1.34739e-05
Iteration                                          236
MetaTest/Average/AverageDiscountedReturn           -49.9637
MetaTest/Average/AverageReturn                     -49.9637
MetaTest/Average/Iteration                         236
MetaTest/Average/MaxReturn                         -42.8958
MetaTest/Average/MinReturn                         -56.8817
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.32018
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.9637
MetaTest/__unnamed_task__/AverageReturn            -49.9637
MetaTest/__unnamed_task__/Iteration                236
MetaTest/__unnamed_task__/MaxReturn                -42.8958
MetaTest/__unnamed_task__/MinReturn                -56.8817
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.32018
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.584e+06
__unnamed_task__/AverageDiscountedReturn           -27.1652
__unnamed_task__/AverageReturn                     -50.0848
__unnamed_task__/Iteration                         236
__unnamed_task__/MaxReturn                         -41.6745
__unnamed_task__/MinReturn                         -73.1352
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.97698
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-01 23:40:49 | [maml_trainer] epoch #237 | Sampling for adapation and meta-testing...
2025-04-01 23:44:59 | [maml_trainer] epoch #237 | Finished meta-testing...
2025-04-01 23:44:59 | [maml_trainer] epoch #237 | Saving snapshot...
2025-04-01 23:45:20 | [maml_trainer] epoch #237 | Saved
2025-04-01 23:45:20 | [maml_trainer] epoch #237 | Time 293821.41 s
2025-04-01 23:45:20 | [maml_trainer] epoch #237 | EpochTime 1313.22 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.2507
Average/AverageReturn                              -50.9423
Average/Iteration                                  237
Average/MaxReturn                                  -40.6031
Average/MinReturn                                  -80.7078
Average/NumEpisodes                                 80
Average/StdReturn                                    6.5751
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93548
GaussianMLPPolicy/KLAfter                            0.00287824
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.55979e-06
GaussianMLPPolicy/LossBefore                        -7.15256e-10
GaussianMLPPolicy/dLoss                             -1.56051e-06
Iteration                                          237
MetaTest/Average/AverageDiscountedReturn           -48.6198
MetaTest/Average/AverageReturn                     -48.6198
MetaTest/Average/Iteration                         237
MetaTest/Average/MaxReturn                         -39.0922
MetaTest/Average/MinReturn                         -55.3364
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.75505
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.6198
MetaTest/__unnamed_task__/AverageReturn            -48.6198
MetaTest/__unnamed_task__/Iteration                237
MetaTest/__unnamed_task__/MaxReturn                -39.0922
MetaTest/__unnamed_task__/MinReturn                -55.3364
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.75505
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.616e+06
__unnamed_task__/AverageDiscountedReturn           -27.2507
__unnamed_task__/AverageReturn                     -50.9423
__unnamed_task__/Iteration                         237
__unnamed_task__/MaxReturn                         -40.6031
__unnamed_task__/MinReturn                         -80.7078
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.5751
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 00:02:23 | [maml_trainer] epoch #238 | Sampling for adapation and meta-testing...
2025-04-02 00:06:43 | [maml_trainer] epoch #238 | Finished meta-testing...
2025-04-02 00:06:43 | [maml_trainer] epoch #238 | Saving snapshot...
2025-04-02 00:07:05 | [maml_trainer] epoch #238 | Saved
2025-04-02 00:07:05 | [maml_trainer] epoch #238 | Time 295126.94 s
2025-04-02 00:07:05 | [maml_trainer] epoch #238 | EpochTime 1305.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.6131
Average/AverageReturn                              -48.9902
Average/Iteration                                  238
Average/MaxReturn                                  -38.934
Average/MinReturn                                  -63.5328
Average/NumEpisodes                                 80
Average/StdReturn                                    4.4941
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93164
GaussianMLPPolicy/KLAfter                            0.00484362
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000135787
GaussianMLPPolicy/LossBefore                         1.52588e-08
GaussianMLPPolicy/dLoss                             -0.000135772
Iteration                                          238
MetaTest/Average/AverageDiscountedReturn           -50.3323
MetaTest/Average/AverageReturn                     -50.3323
MetaTest/Average/Iteration                         238
MetaTest/Average/MaxReturn                         -43.4522
MetaTest/Average/MinReturn                         -60.7062
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.14478
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.3323
MetaTest/__unnamed_task__/AverageReturn            -50.3323
MetaTest/__unnamed_task__/Iteration                238
MetaTest/__unnamed_task__/MaxReturn                -43.4522
MetaTest/__unnamed_task__/MinReturn                -60.7062
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.14478
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.648e+06
__unnamed_task__/AverageDiscountedReturn           -26.6131
__unnamed_task__/AverageReturn                     -48.9902
__unnamed_task__/Iteration                         238
__unnamed_task__/MaxReturn                         -38.934
__unnamed_task__/MinReturn                         -63.5328
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.4941
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 00:24:17 | [maml_trainer] epoch #239 | Sampling for adapation and meta-testing...
2025-04-02 00:28:35 | [maml_trainer] epoch #239 | Finished meta-testing...
2025-04-02 00:28:35 | [maml_trainer] epoch #239 | Saving snapshot...
2025-04-02 00:28:58 | [maml_trainer] epoch #239 | Saved
2025-04-02 00:28:58 | [maml_trainer] epoch #239 | Time 296439.58 s
2025-04-02 00:28:58 | [maml_trainer] epoch #239 | EpochTime 1312.63 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -27.5306
Average/AverageReturn                              -50.9876
Average/Iteration                                  239
Average/MaxReturn                                  -41.1665
Average/MinReturn                                  -65.9911
Average/NumEpisodes                                 80
Average/StdReturn                                    5.1108
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92862
GaussianMLPPolicy/KLAfter                            0.0061105
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000108094
GaussianMLPPolicy/LossBefore                        -6.02007e-09
GaussianMLPPolicy/dLoss                             -0.0001081
Iteration                                          239
MetaTest/Average/AverageDiscountedReturn           -49.5212
MetaTest/Average/AverageReturn                     -49.5212
MetaTest/Average/Iteration                         239
MetaTest/Average/MaxReturn                         -42.1173
MetaTest/Average/MinReturn                         -58.299
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.42281
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.5212
MetaTest/__unnamed_task__/AverageReturn            -49.5212
MetaTest/__unnamed_task__/Iteration                239
MetaTest/__unnamed_task__/MaxReturn                -42.1173
MetaTest/__unnamed_task__/MinReturn                -58.299
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.42281
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.68e+06
__unnamed_task__/AverageDiscountedReturn           -27.5306
__unnamed_task__/AverageReturn                     -50.9876
__unnamed_task__/Iteration                         239
__unnamed_task__/MaxReturn                         -41.1665
__unnamed_task__/MinReturn                         -65.9911
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.1108
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 00:46:23 | [maml_trainer] epoch #240 | Sampling for adapation and meta-testing...
2025-04-02 00:50:44 | [maml_trainer] epoch #240 | Finished meta-testing...
2025-04-02 00:50:44 | [maml_trainer] epoch #240 | Saving snapshot...
2025-04-02 00:51:07 | [maml_trainer] epoch #240 | Saved
2025-04-02 00:51:07 | [maml_trainer] epoch #240 | Time 297768.20 s
2025-04-02 00:51:07 | [maml_trainer] epoch #240 | EpochTime 1328.62 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.7213
Average/AverageReturn                               -49.777
Average/Iteration                                   240
Average/MaxReturn                                   -41.1057
Average/MinReturn                                  -113.689
Average/NumEpisodes                                  80
Average/StdReturn                                     8.21183
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.92559
GaussianMLPPolicy/KLAfter                             0.00484518
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           0.000110975
GaussianMLPPolicy/LossBefore                          7.33137e-09
GaussianMLPPolicy/dLoss                              -0.000110968
Iteration                                           240
MetaTest/Average/AverageDiscountedReturn            -48.6025
MetaTest/Average/AverageReturn                      -48.6025
MetaTest/Average/Iteration                          240
MetaTest/Average/MaxReturn                          -43.3188
MetaTest/Average/MinReturn                          -56.565
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            3.06976
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -48.6025
MetaTest/__unnamed_task__/AverageReturn             -48.6025
MetaTest/__unnamed_task__/Iteration                 240
MetaTest/__unnamed_task__/MaxReturn                 -43.3188
MetaTest/__unnamed_task__/MinReturn                 -56.565
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   3.06976
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         7.712e+06
__unnamed_task__/AverageDiscountedReturn            -26.7213
__unnamed_task__/AverageReturn                      -49.777
__unnamed_task__/Iteration                          240
__unnamed_task__/MaxReturn                          -41.1057
__unnamed_task__/MinReturn                         -113.689
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.21183
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 01:08:30 | [maml_trainer] epoch #241 | Sampling for adapation and meta-testing...
2025-04-02 01:12:49 | [maml_trainer] epoch #241 | Finished meta-testing...
2025-04-02 01:12:49 | [maml_trainer] epoch #241 | Saving snapshot...
2025-04-02 01:13:11 | [maml_trainer] epoch #241 | Saved
2025-04-02 01:13:11 | [maml_trainer] epoch #241 | Time 299092.96 s
2025-04-02 01:13:11 | [maml_trainer] epoch #241 | EpochTime 1324.75 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.4164
Average/AverageReturn                              -49.2257
Average/Iteration                                  241
Average/MaxReturn                                  -42.0582
Average/MinReturn                                  -58.6083
Average/NumEpisodes                                 80
Average/StdReturn                                    3.81022
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92199
GaussianMLPPolicy/KLAfter                            0.00605187
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000166464
GaussianMLPPolicy/LossBefore                        -8.9407e-10
GaussianMLPPolicy/dLoss                              0.000166463
Iteration                                          241
MetaTest/Average/AverageDiscountedReturn           -49.3434
MetaTest/Average/AverageReturn                     -49.3434
MetaTest/Average/Iteration                         241
MetaTest/Average/MaxReturn                         -44.4378
MetaTest/Average/MinReturn                         -79.0388
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.23578
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.3434
MetaTest/__unnamed_task__/AverageReturn            -49.3434
MetaTest/__unnamed_task__/Iteration                241
MetaTest/__unnamed_task__/MaxReturn                -44.4378
MetaTest/__unnamed_task__/MinReturn                -79.0388
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.23578
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.744e+06
__unnamed_task__/AverageDiscountedReturn           -26.4164
__unnamed_task__/AverageReturn                     -49.2257
__unnamed_task__/Iteration                         241
__unnamed_task__/MaxReturn                         -42.0582
__unnamed_task__/MinReturn                         -58.6083
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.81022
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 01:30:47 | [maml_trainer] epoch #242 | Sampling for adapation and meta-testing...
2025-04-02 01:35:07 | [maml_trainer] epoch #242 | Finished meta-testing...
2025-04-02 01:35:07 | [maml_trainer] epoch #242 | Saving snapshot...
2025-04-02 01:35:30 | [maml_trainer] epoch #242 | Saved
2025-04-02 01:35:30 | [maml_trainer] epoch #242 | Time 300431.20 s
2025-04-02 01:35:30 | [maml_trainer] epoch #242 | EpochTime 1338.24 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.769
Average/AverageReturn                              -49.7509
Average/Iteration                                  242
Average/MaxReturn                                  -43.1764
Average/MinReturn                                  -61.3728
Average/NumEpisodes                                 80
Average/StdReturn                                    4.15657
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91973
GaussianMLPPolicy/KLAfter                            0.00350552
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.6082e-05
GaussianMLPPolicy/LossBefore                         6.67572e-09
GaussianMLPPolicy/dLoss                             -3.60754e-05
Iteration                                          242
MetaTest/Average/AverageDiscountedReturn           -51.0225
MetaTest/Average/AverageReturn                     -51.0225
MetaTest/Average/Iteration                         242
MetaTest/Average/MaxReturn                         -45.0464
MetaTest/Average/MinReturn                         -64.0342
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.49028
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.0225
MetaTest/__unnamed_task__/AverageReturn            -51.0225
MetaTest/__unnamed_task__/Iteration                242
MetaTest/__unnamed_task__/MaxReturn                -45.0464
MetaTest/__unnamed_task__/MinReturn                -64.0342
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.49028
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.776e+06
__unnamed_task__/AverageDiscountedReturn           -26.769
__unnamed_task__/AverageReturn                     -49.7509
__unnamed_task__/Iteration                         242
__unnamed_task__/MaxReturn                         -43.1764
__unnamed_task__/MinReturn                         -61.3728
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.15657
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 01:52:58 | [maml_trainer] epoch #243 | Sampling for adapation and meta-testing...
2025-04-02 01:57:12 | [maml_trainer] epoch #243 | Finished meta-testing...
2025-04-02 01:57:12 | [maml_trainer] epoch #243 | Saving snapshot...
2025-04-02 01:57:34 | [maml_trainer] epoch #243 | Saved
2025-04-02 01:57:34 | [maml_trainer] epoch #243 | Time 301755.22 s
2025-04-02 01:57:34 | [maml_trainer] epoch #243 | EpochTime 1324.02 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.5626
Average/AverageReturn                              -49.436
Average/Iteration                                  243
Average/MaxReturn                                  -42.7879
Average/MinReturn                                  -60.7807
Average/NumEpisodes                                 80
Average/StdReturn                                    3.67537
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91826
GaussianMLPPolicy/KLAfter                            0.00152158
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.21303e-05
GaussianMLPPolicy/LossBefore                         5.66244e-09
GaussianMLPPolicy/dLoss                             -3.21246e-05
Iteration                                          243
MetaTest/Average/AverageDiscountedReturn           -50.4167
MetaTest/Average/AverageReturn                     -50.4167
MetaTest/Average/Iteration                         243
MetaTest/Average/MaxReturn                         -44.9258
MetaTest/Average/MinReturn                         -58.264
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.63759
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.4167
MetaTest/__unnamed_task__/AverageReturn            -50.4167
MetaTest/__unnamed_task__/Iteration                243
MetaTest/__unnamed_task__/MaxReturn                -44.9258
MetaTest/__unnamed_task__/MinReturn                -58.264
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.63759
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.808e+06
__unnamed_task__/AverageDiscountedReturn           -26.5626
__unnamed_task__/AverageReturn                     -49.436
__unnamed_task__/Iteration                         243
__unnamed_task__/MaxReturn                         -42.7879
__unnamed_task__/MinReturn                         -60.7807
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.67537
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 02:13:54 | [maml_trainer] epoch #244 | Sampling for adapation and meta-testing...
2025-04-02 02:17:57 | [maml_trainer] epoch #244 | Finished meta-testing...
2025-04-02 02:17:57 | [maml_trainer] epoch #244 | Saving snapshot...
2025-04-02 02:18:18 | [maml_trainer] epoch #244 | Saved
2025-04-02 02:18:18 | [maml_trainer] epoch #244 | Time 302999.93 s
2025-04-02 02:18:18 | [maml_trainer] epoch #244 | EpochTime 1244.70 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.8705
Average/AverageReturn                              -49.8378
Average/Iteration                                  244
Average/MaxReturn                                  -43.1918
Average/MinReturn                                  -60.0846
Average/NumEpisodes                                 80
Average/StdReturn                                    3.99979
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91721
GaussianMLPPolicy/KLAfter                            0.00144648
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.9587e-05
GaussianMLPPolicy/LossBefore                         4.94719e-09
GaussianMLPPolicy/dLoss                              3.9592e-05
Iteration                                          244
MetaTest/Average/AverageDiscountedReturn           -49.6127
MetaTest/Average/AverageReturn                     -49.6127
MetaTest/Average/Iteration                         244
MetaTest/Average/MaxReturn                         -44.3756
MetaTest/Average/MinReturn                         -58.2956
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.77137
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.6127
MetaTest/__unnamed_task__/AverageReturn            -49.6127
MetaTest/__unnamed_task__/Iteration                244
MetaTest/__unnamed_task__/MaxReturn                -44.3756
MetaTest/__unnamed_task__/MinReturn                -58.2956
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.77137
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.84e+06
__unnamed_task__/AverageDiscountedReturn           -26.8705
__unnamed_task__/AverageReturn                     -49.8378
__unnamed_task__/Iteration                         244
__unnamed_task__/MaxReturn                         -43.1918
__unnamed_task__/MinReturn                         -60.0846
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.99979
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 02:34:39 | [maml_trainer] epoch #245 | Sampling for adapation and meta-testing...
2025-04-02 02:38:42 | [maml_trainer] epoch #245 | Finished meta-testing...
2025-04-02 02:38:42 | [maml_trainer] epoch #245 | Saving snapshot...
2025-04-02 02:39:03 | [maml_trainer] epoch #245 | Saved
2025-04-02 02:39:03 | [maml_trainer] epoch #245 | Time 304244.48 s
2025-04-02 02:39:03 | [maml_trainer] epoch #245 | EpochTime 1244.55 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.676
Average/AverageReturn                              -49.7997
Average/Iteration                                  245
Average/MaxReturn                                  -42.6971
Average/MinReturn                                  -58.6533
Average/NumEpisodes                                 80
Average/StdReturn                                    3.67853
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91761
GaussianMLPPolicy/KLAfter                            0.00285965
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.44574e-05
GaussianMLPPolicy/LossBefore                        -1.508e-08
GaussianMLPPolicy/dLoss                              2.44423e-05
Iteration                                          245
MetaTest/Average/AverageDiscountedReturn           -49.2091
MetaTest/Average/AverageReturn                     -49.2091
MetaTest/Average/Iteration                         245
MetaTest/Average/MaxReturn                         -44.2353
MetaTest/Average/MinReturn                         -62.234
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.02995
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.2091
MetaTest/__unnamed_task__/AverageReturn            -49.2091
MetaTest/__unnamed_task__/Iteration                245
MetaTest/__unnamed_task__/MaxReturn                -44.2353
MetaTest/__unnamed_task__/MinReturn                -62.234
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.02995
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.872e+06
__unnamed_task__/AverageDiscountedReturn           -26.676
__unnamed_task__/AverageReturn                     -49.7997
__unnamed_task__/Iteration                         245
__unnamed_task__/MaxReturn                         -42.6971
__unnamed_task__/MinReturn                         -58.6533
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.67853
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 02:55:45 | [maml_trainer] epoch #246 | Sampling for adapation and meta-testing...
2025-04-02 02:59:53 | [maml_trainer] epoch #246 | Finished meta-testing...
2025-04-02 02:59:53 | [maml_trainer] epoch #246 | Saving snapshot...
2025-04-02 03:00:13 | [maml_trainer] epoch #246 | Saved
2025-04-02 03:00:13 | [maml_trainer] epoch #246 | Time 305514.65 s
2025-04-02 03:00:13 | [maml_trainer] epoch #246 | EpochTime 1270.17 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.6287
Average/AverageReturn                              -49.5581
Average/Iteration                                  246
Average/MaxReturn                                  -41.9844
Average/MinReturn                                  -57.5213
Average/NumEpisodes                                 80
Average/StdReturn                                    3.39268
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91747
GaussianMLPPolicy/KLAfter                            0.00310112
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000271369
GaussianMLPPolicy/LossBefore                        -2.19345e-08
GaussianMLPPolicy/dLoss                             -0.000271391
Iteration                                          246
MetaTest/Average/AverageDiscountedReturn           -48.1811
MetaTest/Average/AverageReturn                     -48.1811
MetaTest/Average/Iteration                         246
MetaTest/Average/MaxReturn                         -43.9779
MetaTest/Average/MinReturn                         -54.8985
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           2.34847
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.1811
MetaTest/__unnamed_task__/AverageReturn            -48.1811
MetaTest/__unnamed_task__/Iteration                246
MetaTest/__unnamed_task__/MaxReturn                -43.9779
MetaTest/__unnamed_task__/MinReturn                -54.8985
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  2.34847
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.904e+06
__unnamed_task__/AverageDiscountedReturn           -26.6287
__unnamed_task__/AverageReturn                     -49.5581
__unnamed_task__/Iteration                         246
__unnamed_task__/MaxReturn                         -41.9844
__unnamed_task__/MinReturn                         -57.5213
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.39268
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 03:16:36 | [maml_trainer] epoch #247 | Sampling for adapation and meta-testing...
2025-04-02 03:20:45 | [maml_trainer] epoch #247 | Finished meta-testing...
2025-04-02 03:20:45 | [maml_trainer] epoch #247 | Saving snapshot...
2025-04-02 03:21:07 | [maml_trainer] epoch #247 | Saved
2025-04-02 03:21:07 | [maml_trainer] epoch #247 | Time 306768.56 s
2025-04-02 03:21:07 | [maml_trainer] epoch #247 | EpochTime 1253.90 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.6479
Average/AverageReturn                              -49.748
Average/Iteration                                  247
Average/MaxReturn                                  -44.0882
Average/MinReturn                                  -61.5038
Average/NumEpisodes                                 80
Average/StdReturn                                    3.43647
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91804
GaussianMLPPolicy/KLAfter                            0.00118152
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.44112e-05
GaussianMLPPolicy/LossBefore                         3.45707e-09
GaussianMLPPolicy/dLoss                              7.44147e-05
Iteration                                          247
MetaTest/Average/AverageDiscountedReturn           -51.7682
MetaTest/Average/AverageReturn                     -51.7682
MetaTest/Average/Iteration                         247
MetaTest/Average/MaxReturn                         -45.8627
MetaTest/Average/MinReturn                         -63.5562
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.56963
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.7682
MetaTest/__unnamed_task__/AverageReturn            -51.7682
MetaTest/__unnamed_task__/Iteration                247
MetaTest/__unnamed_task__/MaxReturn                -45.8627
MetaTest/__unnamed_task__/MinReturn                -63.5562
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.56963
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.936e+06
__unnamed_task__/AverageDiscountedReturn           -26.6479
__unnamed_task__/AverageReturn                     -49.748
__unnamed_task__/Iteration                         247
__unnamed_task__/MaxReturn                         -44.0882
__unnamed_task__/MinReturn                         -61.5038
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.43647
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 03:37:37 | [maml_trainer] epoch #248 | Sampling for adapation and meta-testing...
2025-04-02 03:41:47 | [maml_trainer] epoch #248 | Finished meta-testing...
2025-04-02 03:41:47 | [maml_trainer] epoch #248 | Saving snapshot...
2025-04-02 03:42:09 | [maml_trainer] epoch #248 | Saved
2025-04-02 03:42:09 | [maml_trainer] epoch #248 | Time 308030.27 s
2025-04-02 03:42:09 | [maml_trainer] epoch #248 | EpochTime 1261.71 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.6157
Average/AverageReturn                              -49.8812
Average/Iteration                                  248
Average/MaxReturn                                  -39.046
Average/MinReturn                                  -58.0094
Average/NumEpisodes                                 80
Average/StdReturn                                    3.83731
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91731
GaussianMLPPolicy/KLAfter                            0.000417107
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.57416e-06
GaussianMLPPolicy/LossBefore                         2.80142e-09
GaussianMLPPolicy/dLoss                              1.57696e-06
Iteration                                          248
MetaTest/Average/AverageDiscountedReturn           -48.6309
MetaTest/Average/AverageReturn                     -48.6309
MetaTest/Average/Iteration                         248
MetaTest/Average/MaxReturn                         -43.7788
MetaTest/Average/MinReturn                         -54.7661
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           2.89093
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.6309
MetaTest/__unnamed_task__/AverageReturn            -48.6309
MetaTest/__unnamed_task__/Iteration                248
MetaTest/__unnamed_task__/MaxReturn                -43.7788
MetaTest/__unnamed_task__/MinReturn                -54.7661
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  2.89093
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.968e+06
__unnamed_task__/AverageDiscountedReturn           -26.6157
__unnamed_task__/AverageReturn                     -49.8812
__unnamed_task__/Iteration                         248
__unnamed_task__/MaxReturn                         -39.046
__unnamed_task__/MinReturn                         -58.0094
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           3.83731
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 03:58:39 | [maml_trainer] epoch #249 | Sampling for adapation and meta-testing...
2025-04-02 04:02:48 | [maml_trainer] epoch #249 | Finished meta-testing...
2025-04-02 04:02:48 | [maml_trainer] epoch #249 | Saving snapshot...
2025-04-02 04:03:09 | [maml_trainer] epoch #249 | Saved
2025-04-02 04:03:09 | [maml_trainer] epoch #249 | Time 309290.98 s
2025-04-02 04:03:09 | [maml_trainer] epoch #249 | EpochTime 1260.70 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -27.0377
Average/AverageReturn                               -50.7799
Average/Iteration                                   249
Average/MaxReturn                                   -43.0221
Average/MinReturn                                  -100.729
Average/NumEpisodes                                  80
Average/StdReturn                                     7.06586
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.91565
GaussianMLPPolicy/KLAfter                             0.000922354
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.9924e-05
GaussianMLPPolicy/LossBefore                          1.2219e-08
GaussianMLPPolicy/dLoss                               1.99363e-05
Iteration                                           249
MetaTest/Average/AverageDiscountedReturn            -50.6395
MetaTest/Average/AverageReturn                      -50.6395
MetaTest/Average/Iteration                          249
MetaTest/Average/MaxReturn                          -45.2767
MetaTest/Average/MinReturn                          -59.1544
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            3.7464
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -50.6395
MetaTest/__unnamed_task__/AverageReturn             -50.6395
MetaTest/__unnamed_task__/Iteration                 249
MetaTest/__unnamed_task__/MaxReturn                 -45.2767
MetaTest/__unnamed_task__/MinReturn                 -59.1544
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   3.7464
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8e+06
__unnamed_task__/AverageDiscountedReturn            -27.0377
__unnamed_task__/AverageReturn                      -50.7799
__unnamed_task__/Iteration                          249
__unnamed_task__/MaxReturn                          -43.0221
__unnamed_task__/MinReturn                         -100.729
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            7.06586
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 04:19:32 | [maml_trainer] epoch #250 | Sampling for adapation and meta-testing...
2025-04-02 04:23:35 | [maml_trainer] epoch #250 | Finished meta-testing...
2025-04-02 04:23:35 | [maml_trainer] epoch #250 | Saving snapshot...
2025-04-02 04:23:56 | [maml_trainer] epoch #250 | Saved
2025-04-02 04:23:56 | [maml_trainer] epoch #250 | Time 310537.67 s
2025-04-02 04:23:56 | [maml_trainer] epoch #250 | EpochTime 1246.69 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.8865
Average/AverageReturn                               -50.9457
Average/Iteration                                   250
Average/MaxReturn                                   -42.2579
Average/MinReturn                                  -115.834
Average/NumEpisodes                                  80
Average/StdReturn                                     9.27359
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.91415
GaussianMLPPolicy/KLAfter                             0.00179861
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -8.27261e-05
GaussianMLPPolicy/LossBefore                          2.68221e-09
GaussianMLPPolicy/dLoss                               8.27288e-05
Iteration                                           250
MetaTest/Average/AverageDiscountedReturn            -52.3587
MetaTest/Average/AverageReturn                      -52.3587
MetaTest/Average/Iteration                          250
MetaTest/Average/MaxReturn                          -45.7712
MetaTest/Average/MinReturn                          -63.5985
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.27544
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -52.3587
MetaTest/__unnamed_task__/AverageReturn             -52.3587
MetaTest/__unnamed_task__/Iteration                 250
MetaTest/__unnamed_task__/MaxReturn                 -45.7712
MetaTest/__unnamed_task__/MinReturn                 -63.5985
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.27544
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.032e+06
__unnamed_task__/AverageDiscountedReturn            -26.8865
__unnamed_task__/AverageReturn                      -50.9457
__unnamed_task__/Iteration                          250
__unnamed_task__/MaxReturn                          -42.2579
__unnamed_task__/MinReturn                         -115.834
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.27359
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 04:40:20 | [maml_trainer] epoch #251 | Sampling for adapation and meta-testing...
2025-04-02 04:44:28 | [maml_trainer] epoch #251 | Finished meta-testing...
2025-04-02 04:44:28 | [maml_trainer] epoch #251 | Saving snapshot...
2025-04-02 04:44:48 | [maml_trainer] epoch #251 | Saved
2025-04-02 04:44:48 | [maml_trainer] epoch #251 | Time 311789.73 s
2025-04-02 04:44:48 | [maml_trainer] epoch #251 | EpochTime 1252.05 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.9399
Average/AverageReturn                              -50.4839
Average/Iteration                                  251
Average/MaxReturn                                  -42.6563
Average/MinReturn                                  -87.1828
Average/NumEpisodes                                 80
Average/StdReturn                                    6.04835
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91386
GaussianMLPPolicy/KLAfter                            0.00357354
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.02356e-05
GaussianMLPPolicy/LossBefore                        -8.82149e-09
GaussianMLPPolicy/dLoss                              3.02268e-05
Iteration                                          251
MetaTest/Average/AverageDiscountedReturn           -50.5461
MetaTest/Average/AverageReturn                     -50.5461
MetaTest/Average/Iteration                         251
MetaTest/Average/MaxReturn                         -42.9345
MetaTest/Average/MinReturn                         -60.2023
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.41349
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.5461
MetaTest/__unnamed_task__/AverageReturn            -50.5461
MetaTest/__unnamed_task__/Iteration                251
MetaTest/__unnamed_task__/MaxReturn                -42.9345
MetaTest/__unnamed_task__/MinReturn                -60.2023
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.41349
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.064e+06
__unnamed_task__/AverageDiscountedReturn           -26.9399
__unnamed_task__/AverageReturn                     -50.4839
__unnamed_task__/Iteration                         251
__unnamed_task__/MaxReturn                         -42.6563
__unnamed_task__/MinReturn                         -87.1828
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.04835
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 05:01:05 | [maml_trainer] epoch #252 | Sampling for adapation and meta-testing...
2025-04-02 05:05:11 | [maml_trainer] epoch #252 | Finished meta-testing...
2025-04-02 05:05:11 | [maml_trainer] epoch #252 | Saving snapshot...
2025-04-02 05:05:33 | [maml_trainer] epoch #252 | Saved
2025-04-02 05:05:33 | [maml_trainer] epoch #252 | Time 313034.46 s
2025-04-02 05:05:33 | [maml_trainer] epoch #252 | EpochTime 1244.73 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.5869
Average/AverageReturn                              -49.6708
Average/Iteration                                  252
Average/MaxReturn                                  -41.8079
Average/MinReturn                                  -58.7105
Average/NumEpisodes                                 80
Average/StdReturn                                    4.21808
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91252
GaussianMLPPolicy/KLAfter                            0.00602618
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.42007e-05
GaussianMLPPolicy/LossBefore                         5.54323e-09
GaussianMLPPolicy/dLoss                              2.42062e-05
Iteration                                          252
MetaTest/Average/AverageDiscountedReturn           -50.4591
MetaTest/Average/AverageReturn                     -50.4591
MetaTest/Average/Iteration                         252
MetaTest/Average/MaxReturn                         -44.2483
MetaTest/Average/MinReturn                         -72.6721
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.57237
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.4591
MetaTest/__unnamed_task__/AverageReturn            -50.4591
MetaTest/__unnamed_task__/Iteration                252
MetaTest/__unnamed_task__/MaxReturn                -44.2483
MetaTest/__unnamed_task__/MinReturn                -72.6721
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.57237
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.096e+06
__unnamed_task__/AverageDiscountedReturn           -26.5869
__unnamed_task__/AverageReturn                     -49.6708
__unnamed_task__/Iteration                         252
__unnamed_task__/MaxReturn                         -41.8079
__unnamed_task__/MinReturn                         -58.7105
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.21808
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 05:21:48 | [maml_trainer] epoch #253 | Sampling for adapation and meta-testing...
2025-04-02 05:25:55 | [maml_trainer] epoch #253 | Finished meta-testing...
2025-04-02 05:25:55 | [maml_trainer] epoch #253 | Saving snapshot...
2025-04-02 05:26:16 | [maml_trainer] epoch #253 | Saved
2025-04-02 05:26:16 | [maml_trainer] epoch #253 | Time 314277.88 s
2025-04-02 05:26:16 | [maml_trainer] epoch #253 | EpochTime 1243.42 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -27.234
Average/AverageReturn                               -51.2885
Average/Iteration                                   253
Average/MaxReturn                                   -43.4976
Average/MinReturn                                  -116.491
Average/NumEpisodes                                  80
Average/StdReturn                                     8.83303
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.91198
GaussianMLPPolicy/KLAfter                             0.00584098
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           8.56286e-05
GaussianMLPPolicy/LossBefore                         -1.01924e-08
GaussianMLPPolicy/dLoss                              -8.56388e-05
Iteration                                           253
MetaTest/Average/AverageDiscountedReturn            -53.1529
MetaTest/Average/AverageReturn                      -53.1529
MetaTest/Average/Iteration                          253
MetaTest/Average/MaxReturn                          -44.079
MetaTest/Average/MinReturn                         -120.025
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.8815
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -53.1529
MetaTest/__unnamed_task__/AverageReturn             -53.1529
MetaTest/__unnamed_task__/Iteration                 253
MetaTest/__unnamed_task__/MaxReturn                 -44.079
MetaTest/__unnamed_task__/MinReturn                -120.025
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.8815
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.128e+06
__unnamed_task__/AverageDiscountedReturn            -27.234
__unnamed_task__/AverageReturn                      -51.2885
__unnamed_task__/Iteration                          253
__unnamed_task__/MaxReturn                          -43.4976
__unnamed_task__/MinReturn                         -116.491
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.83303
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 05:42:33 | [maml_trainer] epoch #254 | Sampling for adapation and meta-testing...
2025-04-02 05:46:36 | [maml_trainer] epoch #254 | Finished meta-testing...
2025-04-02 05:46:36 | [maml_trainer] epoch #254 | Saving snapshot...
2025-04-02 05:46:57 | [maml_trainer] epoch #254 | Saved
2025-04-02 05:46:57 | [maml_trainer] epoch #254 | Time 315518.49 s
2025-04-02 05:46:57 | [maml_trainer] epoch #254 | EpochTime 1240.60 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.6383
Average/AverageReturn                              -49.7681
Average/Iteration                                  254
Average/MaxReturn                                  -42.3283
Average/MinReturn                                  -62.2242
Average/NumEpisodes                                 80
Average/StdReturn                                    4.30757
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91165
GaussianMLPPolicy/KLAfter                            0.0051888
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.1771e-05
GaussianMLPPolicy/LossBefore                        -9.53674e-10
GaussianMLPPolicy/dLoss                             -3.1772e-05
Iteration                                          254
MetaTest/Average/AverageDiscountedReturn           -50.7339
MetaTest/Average/AverageReturn                     -50.7339
MetaTest/Average/Iteration                         254
MetaTest/Average/MaxReturn                         -43.9758
MetaTest/Average/MinReturn                         -68.4231
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.84679
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.7339
MetaTest/__unnamed_task__/AverageReturn            -50.7339
MetaTest/__unnamed_task__/Iteration                254
MetaTest/__unnamed_task__/MaxReturn                -43.9758
MetaTest/__unnamed_task__/MinReturn                -68.4231
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.84679
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.16e+06
__unnamed_task__/AverageDiscountedReturn           -26.6383
__unnamed_task__/AverageReturn                     -49.7681
__unnamed_task__/Iteration                         254
__unnamed_task__/MaxReturn                         -42.3283
__unnamed_task__/MinReturn                         -62.2242
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.30757
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 06:03:15 | [maml_trainer] epoch #255 | Sampling for adapation and meta-testing...
2025-04-02 06:07:19 | [maml_trainer] epoch #255 | Finished meta-testing...
2025-04-02 06:07:19 | [maml_trainer] epoch #255 | Saving snapshot...
2025-04-02 06:07:40 | [maml_trainer] epoch #255 | Saved
2025-04-02 06:07:40 | [maml_trainer] epoch #255 | Time 316761.45 s
2025-04-02 06:07:40 | [maml_trainer] epoch #255 | EpochTime 1242.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.6518
Average/AverageReturn                              -49.4393
Average/Iteration                                  255
Average/MaxReturn                                  -41.151
Average/MinReturn                                  -69.3074
Average/NumEpisodes                                 80
Average/StdReturn                                    5.09481
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91238
GaussianMLPPolicy/KLAfter                            0.00506535
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.2687e-06
GaussianMLPPolicy/LossBefore                        -7.7486e-10
GaussianMLPPolicy/dLoss                              9.26793e-06
Iteration                                          255
MetaTest/Average/AverageDiscountedReturn           -49.5188
MetaTest/Average/AverageReturn                     -49.5188
MetaTest/Average/Iteration                         255
MetaTest/Average/MaxReturn                         -43.6144
MetaTest/Average/MinReturn                         -61.042
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.41737
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.5188
MetaTest/__unnamed_task__/AverageReturn            -49.5188
MetaTest/__unnamed_task__/Iteration                255
MetaTest/__unnamed_task__/MaxReturn                -43.6144
MetaTest/__unnamed_task__/MinReturn                -61.042
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.41737
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.192e+06
__unnamed_task__/AverageDiscountedReturn           -26.6518
__unnamed_task__/AverageReturn                     -49.4393
__unnamed_task__/Iteration                         255
__unnamed_task__/MaxReturn                         -41.151
__unnamed_task__/MinReturn                         -69.3074
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.09481
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 06:24:04 | [maml_trainer] epoch #256 | Sampling for adapation and meta-testing...
2025-04-02 06:28:08 | [maml_trainer] epoch #256 | Finished meta-testing...
2025-04-02 06:28:08 | [maml_trainer] epoch #256 | Saving snapshot...
2025-04-02 06:28:30 | [maml_trainer] epoch #256 | Saved
2025-04-02 06:28:30 | [maml_trainer] epoch #256 | Time 318011.84 s
2025-04-02 06:28:30 | [maml_trainer] epoch #256 | EpochTime 1250.39 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.4523
Average/AverageReturn                              -49.2619
Average/Iteration                                  256
Average/MaxReturn                                  -40.4189
Average/MinReturn                                  -60.9947
Average/NumEpisodes                                 80
Average/StdReturn                                    4.21468
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91101
GaussianMLPPolicy/KLAfter                            0.00364224
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.41291e-05
GaussianMLPPolicy/LossBefore                        -5.24521e-09
GaussianMLPPolicy/dLoss                              6.41239e-05
Iteration                                          256
MetaTest/Average/AverageDiscountedReturn           -48.7821
MetaTest/Average/AverageReturn                     -48.7821
MetaTest/Average/Iteration                         256
MetaTest/Average/MaxReturn                         -40.8842
MetaTest/Average/MinReturn                         -57.6159
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.78722
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.7821
MetaTest/__unnamed_task__/AverageReturn            -48.7821
MetaTest/__unnamed_task__/Iteration                256
MetaTest/__unnamed_task__/MaxReturn                -40.8842
MetaTest/__unnamed_task__/MinReturn                -57.6159
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.78722
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.224e+06
__unnamed_task__/AverageDiscountedReturn           -26.4523
__unnamed_task__/AverageReturn                     -49.2619
__unnamed_task__/Iteration                         256
__unnamed_task__/MaxReturn                         -40.4189
__unnamed_task__/MinReturn                         -60.9947
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.21468
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 06:45:01 | [maml_trainer] epoch #257 | Sampling for adapation and meta-testing...
2025-04-02 06:49:04 | [maml_trainer] epoch #257 | Finished meta-testing...
2025-04-02 06:49:04 | [maml_trainer] epoch #257 | Saving snapshot...
2025-04-02 06:49:25 | [maml_trainer] epoch #257 | Saved
2025-04-02 06:49:25 | [maml_trainer] epoch #257 | Time 319266.89 s
2025-04-02 06:49:25 | [maml_trainer] epoch #257 | EpochTime 1255.05 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.9827
Average/AverageReturn                               -50.7904
Average/Iteration                                   257
Average/MaxReturn                                   -42.8398
Average/MinReturn                                  -123.016
Average/NumEpisodes                                  80
Average/StdReturn                                     9.47746
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90906
GaussianMLPPolicy/KLAfter                             0.00195476
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.15632e-05
GaussianMLPPolicy/LossBefore                         -2.01762e-08
GaussianMLPPolicy/dLoss                              -2.15834e-05
Iteration                                           257
MetaTest/Average/AverageDiscountedReturn            -51.4174
MetaTest/Average/AverageReturn                      -51.4174
MetaTest/Average/Iteration                          257
MetaTest/Average/MaxReturn                          -42.6541
MetaTest/Average/MinReturn                          -68.7823
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            6.94364
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -51.4174
MetaTest/__unnamed_task__/AverageReturn             -51.4174
MetaTest/__unnamed_task__/Iteration                 257
MetaTest/__unnamed_task__/MaxReturn                 -42.6541
MetaTest/__unnamed_task__/MinReturn                 -68.7823
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   6.94364
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.256e+06
__unnamed_task__/AverageDiscountedReturn            -26.9827
__unnamed_task__/AverageReturn                      -50.7904
__unnamed_task__/Iteration                          257
__unnamed_task__/MaxReturn                          -42.8398
__unnamed_task__/MinReturn                         -123.016
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.47746
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 07:05:36 | [maml_trainer] epoch #258 | Sampling for adapation and meta-testing...
2025-04-02 07:09:44 | [maml_trainer] epoch #258 | Finished meta-testing...
2025-04-02 07:09:44 | [maml_trainer] epoch #258 | Saving snapshot...
2025-04-02 07:10:05 | [maml_trainer] epoch #258 | Saved
2025-04-02 07:10:05 | [maml_trainer] epoch #258 | Time 320507.02 s
2025-04-02 07:10:05 | [maml_trainer] epoch #258 | EpochTime 1240.13 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.1316
Average/AverageReturn                              -48.537
Average/Iteration                                  258
Average/MaxReturn                                  -40.0443
Average/MinReturn                                  -68.8626
Average/NumEpisodes                                 80
Average/StdReturn                                    4.88704
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9077
GaussianMLPPolicy/KLAfter                            0.0017138
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.33015e-05
GaussianMLPPolicy/LossBefore                         1.19209e-08
GaussianMLPPolicy/dLoss                             -6.32896e-05
Iteration                                          258
MetaTest/Average/AverageDiscountedReturn           -48.4274
MetaTest/Average/AverageReturn                     -48.4274
MetaTest/Average/Iteration                         258
MetaTest/Average/MaxReturn                         -39.7755
MetaTest/Average/MinReturn                         -66.9879
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.04726
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.4274
MetaTest/__unnamed_task__/AverageReturn            -48.4274
MetaTest/__unnamed_task__/Iteration                258
MetaTest/__unnamed_task__/MaxReturn                -39.7755
MetaTest/__unnamed_task__/MinReturn                -66.9879
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.04726
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.288e+06
__unnamed_task__/AverageDiscountedReturn           -26.1316
__unnamed_task__/AverageReturn                     -48.537
__unnamed_task__/Iteration                         258
__unnamed_task__/MaxReturn                         -40.0443
__unnamed_task__/MinReturn                         -68.8626
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.88704
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 07:26:34 | [maml_trainer] epoch #259 | Sampling for adapation and meta-testing...
2025-04-02 07:30:38 | [maml_trainer] epoch #259 | Finished meta-testing...
2025-04-02 07:30:38 | [maml_trainer] epoch #259 | Saving snapshot...
2025-04-02 07:30:59 | [maml_trainer] epoch #259 | Saved
2025-04-02 07:30:59 | [maml_trainer] epoch #259 | Time 321760.38 s
2025-04-02 07:30:59 | [maml_trainer] epoch #259 | EpochTime 1253.36 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.9736
Average/AverageReturn                              -48.3783
Average/Iteration                                  259
Average/MaxReturn                                  -38.5471
Average/MinReturn                                  -64.2364
Average/NumEpisodes                                 80
Average/StdReturn                                    5.48258
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90661
GaussianMLPPolicy/KLAfter                            0.000586095
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.76547e-05
GaussianMLPPolicy/LossBefore                        -1.84774e-09
GaussianMLPPolicy/dLoss                             -8.76565e-05
Iteration                                          259
MetaTest/Average/AverageDiscountedReturn           -48.8292
MetaTest/Average/AverageReturn                     -48.8292
MetaTest/Average/Iteration                         259
MetaTest/Average/MaxReturn                         -44.1039
MetaTest/Average/MinReturn                         -59.0082
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.15143
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.8292
MetaTest/__unnamed_task__/AverageReturn            -48.8292
MetaTest/__unnamed_task__/Iteration                259
MetaTest/__unnamed_task__/MaxReturn                -44.1039
MetaTest/__unnamed_task__/MinReturn                -59.0082
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.15143
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.32e+06
__unnamed_task__/AverageDiscountedReturn           -25.9736
__unnamed_task__/AverageReturn                     -48.3783
__unnamed_task__/Iteration                         259
__unnamed_task__/MaxReturn                         -38.5471
__unnamed_task__/MinReturn                         -64.2364
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.48258
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 07:47:23 | [maml_trainer] epoch #260 | Sampling for adapation and meta-testing...
2025-04-02 07:51:30 | [maml_trainer] epoch #260 | Finished meta-testing...
2025-04-02 07:51:30 | [maml_trainer] epoch #260 | Saving snapshot...
2025-04-02 07:51:51 | [maml_trainer] epoch #260 | Saved
2025-04-02 07:51:51 | [maml_trainer] epoch #260 | Time 323012.41 s
2025-04-02 07:51:51 | [maml_trainer] epoch #260 | EpochTime 1252.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.1173
Average/AverageReturn                              -48.3479
Average/Iteration                                  260
Average/MaxReturn                                  -39.702
Average/MinReturn                                  -65.1445
Average/NumEpisodes                                 80
Average/StdReturn                                    5.50774
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90636
GaussianMLPPolicy/KLAfter                            0.00088628
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000104469
GaussianMLPPolicy/LossBefore                        -9.59635e-09
GaussianMLPPolicy/dLoss                              0.000104459
Iteration                                          260
MetaTest/Average/AverageDiscountedReturn           -49.4947
MetaTest/Average/AverageReturn                     -49.4947
MetaTest/Average/Iteration                         260
MetaTest/Average/MaxReturn                         -43.631
MetaTest/Average/MinReturn                         -64.0202
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.8931
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.4947
MetaTest/__unnamed_task__/AverageReturn            -49.4947
MetaTest/__unnamed_task__/Iteration                260
MetaTest/__unnamed_task__/MaxReturn                -43.631
MetaTest/__unnamed_task__/MinReturn                -64.0202
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.8931
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.352e+06
__unnamed_task__/AverageDiscountedReturn           -26.1173
__unnamed_task__/AverageReturn                     -48.3479
__unnamed_task__/Iteration                         260
__unnamed_task__/MaxReturn                         -39.702
__unnamed_task__/MinReturn                         -65.1445
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.50774
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 08:08:27 | [maml_trainer] epoch #261 | Sampling for adapation and meta-testing...
2025-04-02 08:12:28 | [maml_trainer] epoch #261 | Finished meta-testing...
2025-04-02 08:12:28 | [maml_trainer] epoch #261 | Saving snapshot...
2025-04-02 08:12:50 | [maml_trainer] epoch #261 | Saved
2025-04-02 08:12:50 | [maml_trainer] epoch #261 | Time 324271.51 s
2025-04-02 08:12:50 | [maml_trainer] epoch #261 | EpochTime 1259.09 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -27.2639
Average/AverageReturn                               -52.363
Average/Iteration                                   261
Average/MaxReturn                                   -40.446
Average/MinReturn                                  -143.219
Average/NumEpisodes                                  80
Average/StdReturn                                    14.7277
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90694
GaussianMLPPolicy/KLAfter                             0.000808422
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -1.01348e-05
GaussianMLPPolicy/LossBefore                          1.54972e-09
GaussianMLPPolicy/dLoss                               1.01363e-05
Iteration                                           261
MetaTest/Average/AverageDiscountedReturn            -50.5273
MetaTest/Average/AverageReturn                      -50.5273
MetaTest/Average/Iteration                          261
MetaTest/Average/MaxReturn                          -42.2506
MetaTest/Average/MinReturn                          -59.3995
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.08023
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -50.5273
MetaTest/__unnamed_task__/AverageReturn             -50.5273
MetaTest/__unnamed_task__/Iteration                 261
MetaTest/__unnamed_task__/MaxReturn                 -42.2506
MetaTest/__unnamed_task__/MinReturn                 -59.3995
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.08023
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.384e+06
__unnamed_task__/AverageDiscountedReturn            -27.2639
__unnamed_task__/AverageReturn                      -52.363
__unnamed_task__/Iteration                          261
__unnamed_task__/MaxReturn                          -40.446
__unnamed_task__/MinReturn                         -143.219
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.7277
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 08:29:26 | [maml_trainer] epoch #262 | Sampling for adapation and meta-testing...
2025-04-02 08:33:32 | [maml_trainer] epoch #262 | Finished meta-testing...
2025-04-02 08:33:32 | [maml_trainer] epoch #262 | Saving snapshot...
2025-04-02 08:33:53 | [maml_trainer] epoch #262 | Saved
2025-04-02 08:33:53 | [maml_trainer] epoch #262 | Time 325535.00 s
2025-04-02 08:33:53 | [maml_trainer] epoch #262 | EpochTime 1263.49 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.532
Average/AverageReturn                              -49.7735
Average/Iteration                                  262
Average/MaxReturn                                  -39.5732
Average/MinReturn                                  -65.9936
Average/NumEpisodes                                 80
Average/StdReturn                                    5.65148
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90693
GaussianMLPPolicy/KLAfter                            0.00221917
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000122077
GaussianMLPPolicy/LossBefore                         3.99351e-09
GaussianMLPPolicy/dLoss                              0.000122081
Iteration                                          262
MetaTest/Average/AverageDiscountedReturn           -50.4775
MetaTest/Average/AverageReturn                     -50.4775
MetaTest/Average/Iteration                         262
MetaTest/Average/MaxReturn                         -42.4098
MetaTest/Average/MinReturn                         -73.0194
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.39867
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.4775
MetaTest/__unnamed_task__/AverageReturn            -50.4775
MetaTest/__unnamed_task__/Iteration                262
MetaTest/__unnamed_task__/MaxReturn                -42.4098
MetaTest/__unnamed_task__/MinReturn                -73.0194
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.39867
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.416e+06
__unnamed_task__/AverageDiscountedReturn           -26.532
__unnamed_task__/AverageReturn                     -49.7735
__unnamed_task__/Iteration                         262
__unnamed_task__/MaxReturn                         -39.5732
__unnamed_task__/MinReturn                         -65.9936
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.65148
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 08:50:16 | [maml_trainer] epoch #263 | Sampling for adapation and meta-testing...
2025-04-02 08:54:22 | [maml_trainer] epoch #263 | Finished meta-testing...
2025-04-02 08:54:22 | [maml_trainer] epoch #263 | Saving snapshot...
2025-04-02 08:54:43 | [maml_trainer] epoch #263 | Saved
2025-04-02 08:54:43 | [maml_trainer] epoch #263 | Time 326784.74 s
2025-04-02 08:54:43 | [maml_trainer] epoch #263 | EpochTime 1249.74 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.3425
Average/AverageReturn                               -49.7014
Average/Iteration                                   263
Average/MaxReturn                                   -40.5699
Average/MinReturn                                  -129.763
Average/NumEpisodes                                  80
Average/StdReturn                                    10.3858
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90642
GaussianMLPPolicy/KLAfter                             0.000684454
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.67341e-06
GaussianMLPPolicy/LossBefore                         -1.08778e-08
GaussianMLPPolicy/dLoss                               5.66253e-06
Iteration                                           263
MetaTest/Average/AverageDiscountedReturn            -54.2138
MetaTest/Average/AverageReturn                      -54.2138
MetaTest/Average/Iteration                          263
MetaTest/Average/MaxReturn                          -42.1517
MetaTest/Average/MinReturn                         -115.221
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.7517
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -54.2138
MetaTest/__unnamed_task__/AverageReturn             -54.2138
MetaTest/__unnamed_task__/Iteration                 263
MetaTest/__unnamed_task__/MaxReturn                 -42.1517
MetaTest/__unnamed_task__/MinReturn                -115.221
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.7517
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.448e+06
__unnamed_task__/AverageDiscountedReturn            -26.3425
__unnamed_task__/AverageReturn                      -49.7014
__unnamed_task__/Iteration                          263
__unnamed_task__/MaxReturn                          -40.5699
__unnamed_task__/MinReturn                         -129.763
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.3858
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 09:11:24 | [maml_trainer] epoch #264 | Sampling for adapation and meta-testing...
2025-04-02 09:15:24 | [maml_trainer] epoch #264 | Finished meta-testing...
2025-04-02 09:15:24 | [maml_trainer] epoch #264 | Saving snapshot...
2025-04-02 09:15:45 | [maml_trainer] epoch #264 | Saved
2025-04-02 09:15:45 | [maml_trainer] epoch #264 | Time 328046.72 s
2025-04-02 09:15:45 | [maml_trainer] epoch #264 | EpochTime 1261.97 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.1862
Average/AverageReturn                              -48.6115
Average/Iteration                                  264
Average/MaxReturn                                  -40.4601
Average/MinReturn                                  -63.3609
Average/NumEpisodes                                 80
Average/StdReturn                                    4.68423
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90683
GaussianMLPPolicy/KLAfter                            0.00115954
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.84788e-05
GaussianMLPPolicy/LossBefore                        -1.0848e-08
GaussianMLPPolicy/dLoss                             -4.84896e-05
Iteration                                          264
MetaTest/Average/AverageDiscountedReturn           -48.433
MetaTest/Average/AverageReturn                     -48.433
MetaTest/Average/Iteration                         264
MetaTest/Average/MaxReturn                         -41.3998
MetaTest/Average/MinReturn                         -62.1513
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.29993
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.433
MetaTest/__unnamed_task__/AverageReturn            -48.433
MetaTest/__unnamed_task__/Iteration                264
MetaTest/__unnamed_task__/MaxReturn                -41.3998
MetaTest/__unnamed_task__/MinReturn                -62.1513
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.29993
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.48e+06
__unnamed_task__/AverageDiscountedReturn           -26.1862
__unnamed_task__/AverageReturn                     -48.6115
__unnamed_task__/Iteration                         264
__unnamed_task__/MaxReturn                         -40.4601
__unnamed_task__/MinReturn                         -63.3609
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.68423
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 09:32:26 | [maml_trainer] epoch #265 | Sampling for adapation and meta-testing...
2025-04-02 09:36:34 | [maml_trainer] epoch #265 | Finished meta-testing...
2025-04-02 09:36:34 | [maml_trainer] epoch #265 | Saving snapshot...
2025-04-02 09:36:56 | [maml_trainer] epoch #265 | Saved
2025-04-02 09:36:56 | [maml_trainer] epoch #265 | Time 329317.28 s
2025-04-02 09:36:56 | [maml_trainer] epoch #265 | EpochTime 1270.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.1195
Average/AverageReturn                              -48.5729
Average/Iteration                                  265
Average/MaxReturn                                  -38.8465
Average/MinReturn                                  -71.2622
Average/NumEpisodes                                 80
Average/StdReturn                                    5.12778
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90571
GaussianMLPPolicy/KLAfter                            0.00215932
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.38367e-05
GaussianMLPPolicy/LossBefore                         5.126e-09
GaussianMLPPolicy/dLoss                              2.38419e-05
Iteration                                          265
MetaTest/Average/AverageDiscountedReturn           -48.762
MetaTest/Average/AverageReturn                     -48.762
MetaTest/Average/Iteration                         265
MetaTest/Average/MaxReturn                         -41.5341
MetaTest/Average/MinReturn                         -56.3969
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.56325
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.762
MetaTest/__unnamed_task__/AverageReturn            -48.762
MetaTest/__unnamed_task__/Iteration                265
MetaTest/__unnamed_task__/MaxReturn                -41.5341
MetaTest/__unnamed_task__/MinReturn                -56.3969
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.56325
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.512e+06
__unnamed_task__/AverageDiscountedReturn           -26.1195
__unnamed_task__/AverageReturn                     -48.5729
__unnamed_task__/Iteration                         265
__unnamed_task__/MaxReturn                         -38.8465
__unnamed_task__/MinReturn                         -71.2622
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.12778
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 09:53:22 | [maml_trainer] epoch #266 | Sampling for adapation and meta-testing...
2025-04-02 09:57:25 | [maml_trainer] epoch #266 | Finished meta-testing...
2025-04-02 09:57:25 | [maml_trainer] epoch #266 | Saving snapshot...
2025-04-02 09:57:47 | [maml_trainer] epoch #266 | Saved
2025-04-02 09:57:47 | [maml_trainer] epoch #266 | Time 330568.34 s
2025-04-02 09:57:47 | [maml_trainer] epoch #266 | EpochTime 1251.06 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.7617
Average/AverageReturn                               -50.7105
Average/Iteration                                   266
Average/MaxReturn                                   -41.486
Average/MinReturn                                  -122.793
Average/NumEpisodes                                  80
Average/StdReturn                                     9.98713
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90437
GaussianMLPPolicy/KLAfter                             0.0026121
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.85165e-05
GaussianMLPPolicy/LossBefore                         -1.49012e-08
GaussianMLPPolicy/dLoss                              -6.85314e-05
Iteration                                           266
MetaTest/Average/AverageDiscountedReturn            -48.6478
MetaTest/Average/AverageReturn                      -48.6478
MetaTest/Average/Iteration                          266
MetaTest/Average/MaxReturn                          -41.4419
MetaTest/Average/MinReturn                          -62.8852
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.60724
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -48.6478
MetaTest/__unnamed_task__/AverageReturn             -48.6478
MetaTest/__unnamed_task__/Iteration                 266
MetaTest/__unnamed_task__/MaxReturn                 -41.4419
MetaTest/__unnamed_task__/MinReturn                 -62.8852
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.60724
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.544e+06
__unnamed_task__/AverageDiscountedReturn            -26.7617
__unnamed_task__/AverageReturn                      -50.7105
__unnamed_task__/Iteration                          266
__unnamed_task__/MaxReturn                          -41.486
__unnamed_task__/MinReturn                         -122.793
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.98713
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 10:14:06 | [maml_trainer] epoch #267 | Sampling for adapation and meta-testing...
2025-04-02 10:18:17 | [maml_trainer] epoch #267 | Finished meta-testing...
2025-04-02 10:18:17 | [maml_trainer] epoch #267 | Saving snapshot...
2025-04-02 10:18:39 | [maml_trainer] epoch #267 | Saved
2025-04-02 10:18:39 | [maml_trainer] epoch #267 | Time 331820.38 s
2025-04-02 10:18:39 | [maml_trainer] epoch #267 | EpochTime 1252.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.9843
Average/AverageReturn                              -48.4083
Average/Iteration                                  267
Average/MaxReturn                                  -40.3788
Average/MinReturn                                  -64.7928
Average/NumEpisodes                                 80
Average/StdReturn                                    5.53165
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90245
GaussianMLPPolicy/KLAfter                            0.00287146
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.10727e-05
GaussianMLPPolicy/LossBefore                         7.689e-09
GaussianMLPPolicy/dLoss                             -1.1065e-05
Iteration                                          267
MetaTest/Average/AverageDiscountedReturn           -48.165
MetaTest/Average/AverageReturn                     -48.165
MetaTest/Average/Iteration                         267
MetaTest/Average/MaxReturn                         -40.0171
MetaTest/Average/MinReturn                         -60.985
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.26471
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.165
MetaTest/__unnamed_task__/AverageReturn            -48.165
MetaTest/__unnamed_task__/Iteration                267
MetaTest/__unnamed_task__/MaxReturn                -40.0171
MetaTest/__unnamed_task__/MinReturn                -60.985
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.26471
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.576e+06
__unnamed_task__/AverageDiscountedReturn           -25.9843
__unnamed_task__/AverageReturn                     -48.4083
__unnamed_task__/Iteration                         267
__unnamed_task__/MaxReturn                         -40.3788
__unnamed_task__/MinReturn                         -64.7928
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.53165
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 10:35:44 | [maml_trainer] epoch #268 | Sampling for adapation and meta-testing...
2025-04-02 10:40:07 | [maml_trainer] epoch #268 | Finished meta-testing...
2025-04-02 10:40:07 | [maml_trainer] epoch #268 | Saving snapshot...
2025-04-02 10:40:29 | [maml_trainer] epoch #268 | Saved
2025-04-02 10:40:29 | [maml_trainer] epoch #268 | Time 333130.65 s
2025-04-02 10:40:29 | [maml_trainer] epoch #268 | EpochTime 1310.27 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.4264
Average/AverageReturn                               -49.969
Average/Iteration                                   268
Average/MaxReturn                                   -41.0933
Average/MinReturn                                  -116.936
Average/NumEpisodes                                  80
Average/StdReturn                                     9.10434
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9016
GaussianMLPPolicy/KLAfter                             0.00305371
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -7.35587e-05
GaussianMLPPolicy/LossBefore                          1.68383e-08
GaussianMLPPolicy/dLoss                               7.35756e-05
Iteration                                           268
MetaTest/Average/AverageDiscountedReturn            -47.7347
MetaTest/Average/AverageReturn                      -47.7347
MetaTest/Average/Iteration                          268
MetaTest/Average/MaxReturn                          -40.6219
MetaTest/Average/MinReturn                          -59.2945
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.14921
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.7347
MetaTest/__unnamed_task__/AverageReturn             -47.7347
MetaTest/__unnamed_task__/Iteration                 268
MetaTest/__unnamed_task__/MaxReturn                 -40.6219
MetaTest/__unnamed_task__/MinReturn                 -59.2945
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.14921
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.608e+06
__unnamed_task__/AverageDiscountedReturn            -26.4264
__unnamed_task__/AverageReturn                      -49.969
__unnamed_task__/Iteration                          268
__unnamed_task__/MaxReturn                          -41.0933
__unnamed_task__/MinReturn                         -116.936
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            9.10434
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 10:57:48 | [maml_trainer] epoch #269 | Sampling for adapation and meta-testing...
2025-04-02 11:02:08 | [maml_trainer] epoch #269 | Finished meta-testing...
2025-04-02 11:02:08 | [maml_trainer] epoch #269 | Saving snapshot...
2025-04-02 11:02:31 | [maml_trainer] epoch #269 | Saved
2025-04-02 11:02:31 | [maml_trainer] epoch #269 | Time 334452.44 s
2025-04-02 11:02:31 | [maml_trainer] epoch #269 | EpochTime 1321.79 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.4716
Average/AverageReturn                               -49.3
Average/Iteration                                   269
Average/MaxReturn                                   -38.8952
Average/MinReturn                                   -64.407
Average/NumEpisodes                                  80
Average/StdReturn                                     5.13584
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90072
GaussianMLPPolicy/KLAfter                             0.00496245
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000102776
GaussianMLPPolicy/LossBefore                          8.58307e-09
GaussianMLPPolicy/dLoss                               0.000102784
Iteration                                           269
MetaTest/Average/AverageDiscountedReturn            -51.8882
MetaTest/Average/AverageReturn                      -51.8882
MetaTest/Average/Iteration                          269
MetaTest/Average/MaxReturn                          -40.712
MetaTest/Average/MinReturn                         -125.946
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           17.5782
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -51.8882
MetaTest/__unnamed_task__/AverageReturn             -51.8882
MetaTest/__unnamed_task__/Iteration                 269
MetaTest/__unnamed_task__/MaxReturn                 -40.712
MetaTest/__unnamed_task__/MinReturn                -125.946
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  17.5782
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.64e+06
__unnamed_task__/AverageDiscountedReturn            -26.4716
__unnamed_task__/AverageReturn                      -49.3
__unnamed_task__/Iteration                          269
__unnamed_task__/MaxReturn                          -38.8952
__unnamed_task__/MinReturn                          -64.407
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            5.13584
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 11:19:50 | [maml_trainer] epoch #270 | Sampling for adapation and meta-testing...
2025-04-02 11:24:09 | [maml_trainer] epoch #270 | Finished meta-testing...
2025-04-02 11:24:09 | [maml_trainer] epoch #270 | Saving snapshot...
2025-04-02 11:24:33 | [maml_trainer] epoch #270 | Saved
2025-04-02 11:24:33 | [maml_trainer] epoch #270 | Time 335774.37 s
2025-04-02 11:24:33 | [maml_trainer] epoch #270 | EpochTime 1321.93 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.0998
Average/AverageReturn                               -48.4501
Average/Iteration                                   270
Average/MaxReturn                                   -39.7187
Average/MinReturn                                   -62.2074
Average/NumEpisodes                                  80
Average/StdReturn                                     4.71038
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90057
GaussianMLPPolicy/KLAfter                             0.00530785
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -6.56852e-05
GaussianMLPPolicy/LossBefore                          2.09808e-08
GaussianMLPPolicy/dLoss                               6.57061e-05
Iteration                                           270
MetaTest/Average/AverageDiscountedReturn            -51.9127
MetaTest/Average/AverageReturn                      -51.9127
MetaTest/Average/Iteration                          270
MetaTest/Average/MaxReturn                          -42.2752
MetaTest/Average/MinReturn                         -112.401
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           14.2616
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -51.9127
MetaTest/__unnamed_task__/AverageReturn             -51.9127
MetaTest/__unnamed_task__/Iteration                 270
MetaTest/__unnamed_task__/MaxReturn                 -42.2752
MetaTest/__unnamed_task__/MinReturn                -112.401
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  14.2616
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.672e+06
__unnamed_task__/AverageDiscountedReturn            -26.0998
__unnamed_task__/AverageReturn                      -48.4501
__unnamed_task__/Iteration                          270
__unnamed_task__/MaxReturn                          -39.7187
__unnamed_task__/MinReturn                          -62.2074
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            4.71038
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 11:42:00 | [maml_trainer] epoch #271 | Sampling for adapation and meta-testing...
2025-04-02 11:46:21 | [maml_trainer] epoch #271 | Finished meta-testing...
2025-04-02 11:46:21 | [maml_trainer] epoch #271 | Saving snapshot...
2025-04-02 11:46:45 | [maml_trainer] epoch #271 | Saved
2025-04-02 11:46:45 | [maml_trainer] epoch #271 | Time 337106.34 s
2025-04-02 11:46:45 | [maml_trainer] epoch #271 | EpochTime 1331.97 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.3342
Average/AverageReturn                               -48.9336
Average/Iteration                                   271
Average/MaxReturn                                   -39.6383
Average/MinReturn                                   -69.0627
Average/NumEpisodes                                  80
Average/StdReturn                                     5.81737
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90072
GaussianMLPPolicy/KLAfter                             0.00346048
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.57243e-05
GaussianMLPPolicy/LossBefore                         -6.73533e-09
GaussianMLPPolicy/dLoss                              -1.5731e-05
Iteration                                           271
MetaTest/Average/AverageDiscountedReturn            -52.7635
MetaTest/Average/AverageReturn                      -52.7635
MetaTest/Average/Iteration                          271
MetaTest/Average/MaxReturn                          -40.8771
MetaTest/Average/MinReturn                         -133.64
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           19.0977
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -52.7635
MetaTest/__unnamed_task__/AverageReturn             -52.7635
MetaTest/__unnamed_task__/Iteration                 271
MetaTest/__unnamed_task__/MaxReturn                 -40.8771
MetaTest/__unnamed_task__/MinReturn                -133.64
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  19.0977
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.704e+06
__unnamed_task__/AverageDiscountedReturn            -26.3342
__unnamed_task__/AverageReturn                      -48.9336
__unnamed_task__/Iteration                          271
__unnamed_task__/MaxReturn                          -39.6383
__unnamed_task__/MinReturn                          -69.0627
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            5.81737
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 12:03:54 | [maml_trainer] epoch #272 | Sampling for adapation and meta-testing...
2025-04-02 12:08:20 | [maml_trainer] epoch #272 | Finished meta-testing...
2025-04-02 12:08:20 | [maml_trainer] epoch #272 | Saving snapshot...
2025-04-02 12:08:43 | [maml_trainer] epoch #272 | Saved
2025-04-02 12:08:43 | [maml_trainer] epoch #272 | Time 338424.12 s
2025-04-02 12:08:43 | [maml_trainer] epoch #272 | EpochTime 1317.77 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.4301
Average/AverageReturn                              -49.6274
Average/Iteration                                  272
Average/MaxReturn                                  -39.0874
Average/MinReturn                                  -72.6432
Average/NumEpisodes                                 80
Average/StdReturn                                    5.54994
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90099
GaussianMLPPolicy/KLAfter                            0.00384465
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.91239e-05
GaussianMLPPolicy/LossBefore                         1.43051e-09
GaussianMLPPolicy/dLoss                             -5.91225e-05
Iteration                                          272
MetaTest/Average/AverageDiscountedReturn           -49.3503
MetaTest/Average/AverageReturn                     -49.3503
MetaTest/Average/Iteration                         272
MetaTest/Average/MaxReturn                         -41.9412
MetaTest/Average/MinReturn                         -66.476
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.93576
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.3503
MetaTest/__unnamed_task__/AverageReturn            -49.3503
MetaTest/__unnamed_task__/Iteration                272
MetaTest/__unnamed_task__/MaxReturn                -41.9412
MetaTest/__unnamed_task__/MinReturn                -66.476
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.93576
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.736e+06
__unnamed_task__/AverageDiscountedReturn           -26.4301
__unnamed_task__/AverageReturn                     -49.6274
__unnamed_task__/Iteration                         272
__unnamed_task__/MaxReturn                         -39.0874
__unnamed_task__/MinReturn                         -72.6432
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.54994
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 12:25:22 | [maml_trainer] epoch #273 | Sampling for adapation and meta-testing...
2025-04-02 12:29:29 | [maml_trainer] epoch #273 | Finished meta-testing...
2025-04-02 12:29:29 | [maml_trainer] epoch #273 | Saving snapshot...
2025-04-02 12:29:49 | [maml_trainer] epoch #273 | Saved
2025-04-02 12:29:49 | [maml_trainer] epoch #273 | Time 339690.92 s
2025-04-02 12:29:49 | [maml_trainer] epoch #273 | EpochTime 1266.80 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.4897
Average/AverageReturn                               -49.8064
Average/Iteration                                   273
Average/MaxReturn                                   -42.1777
Average/MinReturn                                  -111.917
Average/NumEpisodes                                  80
Average/StdReturn                                     8.20475
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90212
GaussianMLPPolicy/KLAfter                             0.00243315
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -7.6491e-06
GaussianMLPPolicy/LossBefore                          3.99351e-09
GaussianMLPPolicy/dLoss                               7.65309e-06
Iteration                                           273
MetaTest/Average/AverageDiscountedReturn            -47.9319
MetaTest/Average/AverageReturn                      -47.9319
MetaTest/Average/Iteration                          273
MetaTest/Average/MaxReturn                          -38.1539
MetaTest/Average/MinReturn                          -54.0466
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            3.63891
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.9319
MetaTest/__unnamed_task__/AverageReturn             -47.9319
MetaTest/__unnamed_task__/Iteration                 273
MetaTest/__unnamed_task__/MaxReturn                 -38.1539
MetaTest/__unnamed_task__/MinReturn                 -54.0466
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   3.63891
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         8.768e+06
__unnamed_task__/AverageDiscountedReturn            -26.4897
__unnamed_task__/AverageReturn                      -49.8064
__unnamed_task__/Iteration                          273
__unnamed_task__/MaxReturn                          -42.1777
__unnamed_task__/MinReturn                         -111.917
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.20475
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 12:46:15 | [maml_trainer] epoch #274 | Sampling for adapation and meta-testing...
2025-04-02 12:50:20 | [maml_trainer] epoch #274 | Finished meta-testing...
2025-04-02 12:50:20 | [maml_trainer] epoch #274 | Saving snapshot...
2025-04-02 12:50:41 | [maml_trainer] epoch #274 | Saved
2025-04-02 12:50:41 | [maml_trainer] epoch #274 | Time 340942.97 s
2025-04-02 12:50:41 | [maml_trainer] epoch #274 | EpochTime 1252.04 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.3836
Average/AverageReturn                              -49.3289
Average/Iteration                                  274
Average/MaxReturn                                  -40.8925
Average/MinReturn                                  -62.3649
Average/NumEpisodes                                 80
Average/StdReturn                                    4.50485
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90347
GaussianMLPPolicy/KLAfter                            0.00262916
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.81505e-05
GaussianMLPPolicy/LossBefore                        -2.2769e-08
GaussianMLPPolicy/dLoss                             -3.81733e-05
Iteration                                          274
MetaTest/Average/AverageDiscountedReturn           -49.7128
MetaTest/Average/AverageReturn                     -49.7128
MetaTest/Average/Iteration                         274
MetaTest/Average/MaxReturn                         -43.259
MetaTest/Average/MinReturn                         -57.652
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.32232
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.7128
MetaTest/__unnamed_task__/AverageReturn            -49.7128
MetaTest/__unnamed_task__/Iteration                274
MetaTest/__unnamed_task__/MaxReturn                -43.259
MetaTest/__unnamed_task__/MinReturn                -57.652
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.32232
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.8e+06
__unnamed_task__/AverageDiscountedReturn           -26.3836
__unnamed_task__/AverageReturn                     -49.3289
__unnamed_task__/Iteration                         274
__unnamed_task__/MaxReturn                         -40.8925
__unnamed_task__/MinReturn                         -62.3649
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.50485
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 13:06:53 | [maml_trainer] epoch #275 | Sampling for adapation and meta-testing...
2025-04-02 13:11:07 | [maml_trainer] epoch #275 | Finished meta-testing...
2025-04-02 13:11:07 | [maml_trainer] epoch #275 | Saving snapshot...
2025-04-02 13:11:30 | [maml_trainer] epoch #275 | Saved
2025-04-02 13:11:30 | [maml_trainer] epoch #275 | Time 342191.53 s
2025-04-02 13:11:30 | [maml_trainer] epoch #275 | EpochTime 1248.55 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.5062
Average/AverageReturn                              -49.5379
Average/Iteration                                  275
Average/MaxReturn                                  -40.5538
Average/MinReturn                                  -61.2091
Average/NumEpisodes                                 80
Average/StdReturn                                    4.52083
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90357
GaussianMLPPolicy/KLAfter                            0.00479817
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.34368e-05
GaussianMLPPolicy/LossBefore                        -8.70228e-09
GaussianMLPPolicy/dLoss                             -7.34455e-05
Iteration                                          275
MetaTest/Average/AverageDiscountedReturn           -49.5208
MetaTest/Average/AverageReturn                     -49.5208
MetaTest/Average/Iteration                         275
MetaTest/Average/MaxReturn                         -41.8437
MetaTest/Average/MinReturn                         -66.9236
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.35792
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -49.5208
MetaTest/__unnamed_task__/AverageReturn            -49.5208
MetaTest/__unnamed_task__/Iteration                275
MetaTest/__unnamed_task__/MaxReturn                -41.8437
MetaTest/__unnamed_task__/MinReturn                -66.9236
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.35792
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.832e+06
__unnamed_task__/AverageDiscountedReturn           -26.5062
__unnamed_task__/AverageReturn                     -49.5379
__unnamed_task__/Iteration                         275
__unnamed_task__/MaxReturn                         -40.5538
__unnamed_task__/MinReturn                         -61.2091
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.52083
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 13:28:40 | [maml_trainer] epoch #276 | Sampling for adapation and meta-testing...
2025-04-02 13:32:58 | [maml_trainer] epoch #276 | Finished meta-testing...
2025-04-02 13:32:58 | [maml_trainer] epoch #276 | Saving snapshot...
2025-04-02 13:33:22 | [maml_trainer] epoch #276 | Saved
2025-04-02 13:33:22 | [maml_trainer] epoch #276 | Time 343503.21 s
2025-04-02 13:33:22 | [maml_trainer] epoch #276 | EpochTime 1311.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.2308
Average/AverageReturn                              -48.7297
Average/Iteration                                  276
Average/MaxReturn                                  -40.6259
Average/MinReturn                                  -63.9514
Average/NumEpisodes                                 80
Average/StdReturn                                    5.1861
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90388
GaussianMLPPolicy/KLAfter                            0.00482589
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000174431
GaussianMLPPolicy/LossBefore                         6.07967e-09
GaussianMLPPolicy/dLoss                             -0.000174425
Iteration                                          276
MetaTest/Average/AverageDiscountedReturn           -50.8891
MetaTest/Average/AverageReturn                     -50.8891
MetaTest/Average/Iteration                         276
MetaTest/Average/MaxReturn                         -42.2249
MetaTest/Average/MinReturn                         -64.4055
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.21143
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.8891
MetaTest/__unnamed_task__/AverageReturn            -50.8891
MetaTest/__unnamed_task__/Iteration                276
MetaTest/__unnamed_task__/MaxReturn                -42.2249
MetaTest/__unnamed_task__/MinReturn                -64.4055
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.21143
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.864e+06
__unnamed_task__/AverageDiscountedReturn           -26.2308
__unnamed_task__/AverageReturn                     -48.7297
__unnamed_task__/Iteration                         276
__unnamed_task__/MaxReturn                         -40.6259
__unnamed_task__/MinReturn                         -63.9514
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.1861
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 13:50:44 | [maml_trainer] epoch #277 | Sampling for adapation and meta-testing...
2025-04-02 13:55:02 | [maml_trainer] epoch #277 | Finished meta-testing...
2025-04-02 13:55:02 | [maml_trainer] epoch #277 | Saving snapshot...
2025-04-02 13:55:24 | [maml_trainer] epoch #277 | Saved
2025-04-02 13:55:24 | [maml_trainer] epoch #277 | Time 344825.26 s
2025-04-02 13:55:24 | [maml_trainer] epoch #277 | EpochTime 1322.05 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.1895
Average/AverageReturn                              -48.5739
Average/Iteration                                  277
Average/MaxReturn                                  -41.0699
Average/MinReturn                                  -62.6201
Average/NumEpisodes                                 80
Average/StdReturn                                    4.34476
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90488
GaussianMLPPolicy/KLAfter                            0.00202145
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.16199e-05
GaussianMLPPolicy/LossBefore                        -5.30481e-09
GaussianMLPPolicy/dLoss                              3.16146e-05
Iteration                                          277
MetaTest/Average/AverageDiscountedReturn           -48.4783
MetaTest/Average/AverageReturn                     -48.4783
MetaTest/Average/Iteration                         277
MetaTest/Average/MaxReturn                         -40.8097
MetaTest/Average/MinReturn                         -56.8619
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.37991
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.4783
MetaTest/__unnamed_task__/AverageReturn            -48.4783
MetaTest/__unnamed_task__/Iteration                277
MetaTest/__unnamed_task__/MaxReturn                -40.8097
MetaTest/__unnamed_task__/MinReturn                -56.8619
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.37991
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.896e+06
__unnamed_task__/AverageDiscountedReturn           -26.1895
__unnamed_task__/AverageReturn                     -48.5739
__unnamed_task__/Iteration                         277
__unnamed_task__/MaxReturn                         -41.0699
__unnamed_task__/MinReturn                         -62.6201
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.34476
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 14:12:46 | [maml_trainer] epoch #278 | Sampling for adapation and meta-testing...
2025-04-02 14:17:07 | [maml_trainer] epoch #278 | Finished meta-testing...
2025-04-02 14:17:07 | [maml_trainer] epoch #278 | Saving snapshot...
2025-04-02 14:17:30 | [maml_trainer] epoch #278 | Saved
2025-04-02 14:17:30 | [maml_trainer] epoch #278 | Time 346151.96 s
2025-04-02 14:17:30 | [maml_trainer] epoch #278 | EpochTime 1326.70 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.7733
Average/AverageReturn                              -49.9802
Average/Iteration                                  278
Average/MaxReturn                                  -41.0076
Average/MinReturn                                  -70.6885
Average/NumEpisodes                                 80
Average/StdReturn                                    5.39043
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90508
GaussianMLPPolicy/KLAfter                            0.00193747
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.15001e-05
GaussianMLPPolicy/LossBefore                        -9.23872e-09
GaussianMLPPolicy/dLoss                             -7.15093e-05
Iteration                                          278
MetaTest/Average/AverageDiscountedReturn           -50.8262
MetaTest/Average/AverageReturn                     -50.8262
MetaTest/Average/Iteration                         278
MetaTest/Average/MaxReturn                         -41.0376
MetaTest/Average/MinReturn                         -62.016
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.64102
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.8262
MetaTest/__unnamed_task__/AverageReturn            -50.8262
MetaTest/__unnamed_task__/Iteration                278
MetaTest/__unnamed_task__/MaxReturn                -41.0376
MetaTest/__unnamed_task__/MinReturn                -62.016
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.64102
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.928e+06
__unnamed_task__/AverageDiscountedReturn           -26.7733
__unnamed_task__/AverageReturn                     -49.9802
__unnamed_task__/Iteration                         278
__unnamed_task__/MaxReturn                         -41.0076
__unnamed_task__/MinReturn                         -70.6885
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.39043
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 14:34:50 | [maml_trainer] epoch #279 | Sampling for adapation and meta-testing...
2025-04-02 14:39:09 | [maml_trainer] epoch #279 | Finished meta-testing...
2025-04-02 14:39:09 | [maml_trainer] epoch #279 | Saving snapshot...
2025-04-02 14:39:33 | [maml_trainer] epoch #279 | Saved
2025-04-02 14:39:33 | [maml_trainer] epoch #279 | Time 347474.23 s
2025-04-02 14:39:33 | [maml_trainer] epoch #279 | EpochTime 1322.26 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.4356
Average/AverageReturn                              -49.5131
Average/Iteration                                  279
Average/MaxReturn                                  -40.4128
Average/MinReturn                                  -69.4664
Average/NumEpisodes                                 80
Average/StdReturn                                    5.48627
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90595
GaussianMLPPolicy/KLAfter                            0.00234529
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.64441e-06
GaussianMLPPolicy/LossBefore                         4.11272e-09
GaussianMLPPolicy/dLoss                              7.64852e-06
Iteration                                          279
MetaTest/Average/AverageDiscountedReturn           -48.8925
MetaTest/Average/AverageReturn                     -48.8925
MetaTest/Average/Iteration                         279
MetaTest/Average/MaxReturn                         -42.8482
MetaTest/Average/MinReturn                         -64.678
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.51739
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.8925
MetaTest/__unnamed_task__/AverageReturn            -48.8925
MetaTest/__unnamed_task__/Iteration                279
MetaTest/__unnamed_task__/MaxReturn                -42.8482
MetaTest/__unnamed_task__/MinReturn                -64.678
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.51739
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.96e+06
__unnamed_task__/AverageDiscountedReturn           -26.4356
__unnamed_task__/AverageReturn                     -49.5131
__unnamed_task__/Iteration                         279
__unnamed_task__/MaxReturn                         -40.4128
__unnamed_task__/MinReturn                         -69.4664
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.48627
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 14:56:51 | [maml_trainer] epoch #280 | Sampling for adapation and meta-testing...
2025-04-02 15:01:10 | [maml_trainer] epoch #280 | Finished meta-testing...
2025-04-02 15:01:10 | [maml_trainer] epoch #280 | Saving snapshot...
2025-04-02 15:01:33 | [maml_trainer] epoch #280 | Saved
2025-04-02 15:01:33 | [maml_trainer] epoch #280 | Time 348794.88 s
2025-04-02 15:01:33 | [maml_trainer] epoch #280 | EpochTime 1320.65 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.5169
Average/AverageReturn                              -49.2464
Average/Iteration                                  280
Average/MaxReturn                                  -39.8391
Average/MinReturn                                  -70.0249
Average/NumEpisodes                                 80
Average/StdReturn                                    5.91072
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90711
GaussianMLPPolicy/KLAfter                            0.00185878
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000152559
GaussianMLPPolicy/LossBefore                        -9.17912e-09
GaussianMLPPolicy/dLoss                              0.00015255
Iteration                                          280
MetaTest/Average/AverageDiscountedReturn           -50.8607
MetaTest/Average/AverageReturn                     -50.8607
MetaTest/Average/Iteration                         280
MetaTest/Average/MaxReturn                         -41.9185
MetaTest/Average/MinReturn                         -72.7243
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.03265
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.8607
MetaTest/__unnamed_task__/AverageReturn            -50.8607
MetaTest/__unnamed_task__/Iteration                280
MetaTest/__unnamed_task__/MaxReturn                -41.9185
MetaTest/__unnamed_task__/MinReturn                -72.7243
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.03265
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.992e+06
__unnamed_task__/AverageDiscountedReturn           -26.5169
__unnamed_task__/AverageReturn                     -49.2464
__unnamed_task__/Iteration                         280
__unnamed_task__/MaxReturn                         -39.8391
__unnamed_task__/MinReturn                         -70.0249
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.91072
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 15:19:33 | [maml_trainer] epoch #281 | Sampling for adapation and meta-testing...
2025-04-02 15:24:06 | [maml_trainer] epoch #281 | Finished meta-testing...
2025-04-02 15:24:06 | [maml_trainer] epoch #281 | Saving snapshot...
2025-04-02 15:24:30 | [maml_trainer] epoch #281 | Saved
2025-04-02 15:24:30 | [maml_trainer] epoch #281 | Time 350171.80 s
2025-04-02 15:24:30 | [maml_trainer] epoch #281 | EpochTime 1376.92 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.2123
Average/AverageReturn                               -48.8811
Average/Iteration                                   281
Average/MaxReturn                                   -39.6329
Average/MinReturn                                   -66.8028
Average/NumEpisodes                                  80
Average/StdReturn                                     6.1411
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.90807
GaussianMLPPolicy/KLAfter                             0.00149685
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000168929
GaussianMLPPolicy/LossBefore                         -1.32918e-08
GaussianMLPPolicy/dLoss                               0.000168915
Iteration                                           281
MetaTest/Average/AverageDiscountedReturn            -52.8898
MetaTest/Average/AverageReturn                      -52.8898
MetaTest/Average/Iteration                          281
MetaTest/Average/MaxReturn                          -42.6931
MetaTest/Average/MinReturn                         -133.132
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           18.9595
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -52.8898
MetaTest/__unnamed_task__/AverageReturn             -52.8898
MetaTest/__unnamed_task__/Iteration                 281
MetaTest/__unnamed_task__/MaxReturn                 -42.6931
MetaTest/__unnamed_task__/MinReturn                -133.132
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  18.9595
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.024e+06
__unnamed_task__/AverageDiscountedReturn            -26.2123
__unnamed_task__/AverageReturn                      -48.8811
__unnamed_task__/Iteration                          281
__unnamed_task__/MaxReturn                          -39.6329
__unnamed_task__/MinReturn                          -66.8028
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            6.1411
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 15:42:38 | [maml_trainer] epoch #282 | Sampling for adapation and meta-testing...
2025-04-02 15:46:57 | [maml_trainer] epoch #282 | Finished meta-testing...
2025-04-02 15:46:57 | [maml_trainer] epoch #282 | Saving snapshot...
2025-04-02 15:47:19 | [maml_trainer] epoch #282 | Saved
2025-04-02 15:47:19 | [maml_trainer] epoch #282 | Time 351540.36 s
2025-04-02 15:47:19 | [maml_trainer] epoch #282 | EpochTime 1368.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.2305
Average/AverageReturn                              -48.7054
Average/Iteration                                  282
Average/MaxReturn                                  -40.7783
Average/MinReturn                                  -67.8972
Average/NumEpisodes                                 80
Average/StdReturn                                    5.23126
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90862
GaussianMLPPolicy/KLAfter                            0.00182642
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.23339e-05
GaussianMLPPolicy/LossBefore                        -8.34465e-10
GaussianMLPPolicy/dLoss                             -9.23347e-05
Iteration                                          282
MetaTest/Average/AverageDiscountedReturn           -50.0439
MetaTest/Average/AverageReturn                     -50.0439
MetaTest/Average/Iteration                         282
MetaTest/Average/MaxReturn                         -39.3647
MetaTest/Average/MinReturn                         -69.2753
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.15007
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.0439
MetaTest/__unnamed_task__/AverageReturn            -50.0439
MetaTest/__unnamed_task__/Iteration                282
MetaTest/__unnamed_task__/MaxReturn                -39.3647
MetaTest/__unnamed_task__/MinReturn                -69.2753
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.15007
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.056e+06
__unnamed_task__/AverageDiscountedReturn           -26.2305
__unnamed_task__/AverageReturn                     -48.7054
__unnamed_task__/Iteration                         282
__unnamed_task__/MaxReturn                         -40.7783
__unnamed_task__/MinReturn                         -67.8972
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.23126
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 16:05:12 | [maml_trainer] epoch #283 | Sampling for adapation and meta-testing...
2025-04-02 16:09:27 | [maml_trainer] epoch #283 | Finished meta-testing...
2025-04-02 16:09:27 | [maml_trainer] epoch #283 | Saving snapshot...
2025-04-02 16:09:51 | [maml_trainer] epoch #283 | Saved
2025-04-02 16:09:51 | [maml_trainer] epoch #283 | Time 352892.13 s
2025-04-02 16:09:51 | [maml_trainer] epoch #283 | EpochTime 1351.76 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -26.1196
Average/AverageReturn                              -48.1672
Average/Iteration                                  283
Average/MaxReturn                                  -38.4905
Average/MinReturn                                  -62.5557
Average/NumEpisodes                                 80
Average/StdReturn                                    4.31167
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91032
GaussianMLPPolicy/KLAfter                            0.00154456
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.59533e-05
GaussianMLPPolicy/LossBefore                         1.57952e-08
GaussianMLPPolicy/dLoss                             -4.59375e-05
Iteration                                          283
MetaTest/Average/AverageDiscountedReturn           -47.5351
MetaTest/Average/AverageReturn                     -47.5351
MetaTest/Average/Iteration                         283
MetaTest/Average/MaxReturn                         -42.1724
MetaTest/Average/MinReturn                         -56.7521
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           3.43449
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -47.5351
MetaTest/__unnamed_task__/AverageReturn            -47.5351
MetaTest/__unnamed_task__/Iteration                283
MetaTest/__unnamed_task__/MaxReturn                -42.1724
MetaTest/__unnamed_task__/MinReturn                -56.7521
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  3.43449
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.088e+06
__unnamed_task__/AverageDiscountedReturn           -26.1196
__unnamed_task__/AverageReturn                     -48.1672
__unnamed_task__/Iteration                         283
__unnamed_task__/MaxReturn                         -38.4905
__unnamed_task__/MinReturn                         -62.5557
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.31167
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 16:27:29 | [maml_trainer] epoch #284 | Sampling for adapation and meta-testing...
2025-04-02 16:33:17 | [maml_trainer] epoch #284 | Finished meta-testing...
2025-04-02 16:33:17 | [maml_trainer] epoch #284 | Saving snapshot...
2025-04-02 16:33:41 | [maml_trainer] epoch #284 | Saved
2025-04-02 16:33:41 | [maml_trainer] epoch #284 | Time 354322.20 s
2025-04-02 16:33:41 | [maml_trainer] epoch #284 | EpochTime 1430.07 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.8156
Average/AverageReturn                              -48.0001
Average/Iteration                                  284
Average/MaxReturn                                  -39.0615
Average/MinReturn                                  -62.9321
Average/NumEpisodes                                 80
Average/StdReturn                                    4.922
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9137
GaussianMLPPolicy/KLAfter                            0.0010886
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.62014e-05
GaussianMLPPolicy/LossBefore                         8.40425e-09
GaussianMLPPolicy/dLoss                              3.62098e-05
Iteration                                          284
MetaTest/Average/AverageDiscountedReturn           -50.5495
MetaTest/Average/AverageReturn                     -50.5495
MetaTest/Average/Iteration                         284
MetaTest/Average/MaxReturn                         -41.9135
MetaTest/Average/MinReturn                         -67.9562
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.47691
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -50.5495
MetaTest/__unnamed_task__/AverageReturn            -50.5495
MetaTest/__unnamed_task__/Iteration                284
MetaTest/__unnamed_task__/MaxReturn                -41.9135
MetaTest/__unnamed_task__/MinReturn                -67.9562
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.47691
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.12e+06
__unnamed_task__/AverageDiscountedReturn           -25.8156
__unnamed_task__/AverageReturn                     -48.0001
__unnamed_task__/Iteration                         284
__unnamed_task__/MaxReturn                         -39.0615
__unnamed_task__/MinReturn                         -62.9321
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           4.922
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 16:51:53 | [maml_trainer] epoch #285 | Sampling for adapation and meta-testing...
2025-04-02 16:56:26 | [maml_trainer] epoch #285 | Finished meta-testing...
2025-04-02 16:56:26 | [maml_trainer] epoch #285 | Saving snapshot...
2025-04-02 16:56:50 | [maml_trainer] epoch #285 | Saved
2025-04-02 16:56:50 | [maml_trainer] epoch #285 | Time 355711.54 s
2025-04-02 16:56:50 | [maml_trainer] epoch #285 | EpochTime 1389.33 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.473
Average/AverageReturn                               -50.0189
Average/Iteration                                   285
Average/MaxReturn                                   -37.336
Average/MinReturn                                  -142.088
Average/NumEpisodes                                  80
Average/StdReturn                                    12.1044
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.91708
GaussianMLPPolicy/KLAfter                             0.0014966
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -2.03779e-06
GaussianMLPPolicy/LossBefore                         -7.7486e-10
GaussianMLPPolicy/dLoss                               2.03702e-06
Iteration                                           285
MetaTest/Average/AverageDiscountedReturn            -46.0714
MetaTest/Average/AverageReturn                      -46.0714
MetaTest/Average/Iteration                          285
MetaTest/Average/MaxReturn                          -39.4447
MetaTest/Average/MinReturn                          -50.5485
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            3.3109
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -46.0714
MetaTest/__unnamed_task__/AverageReturn             -46.0714
MetaTest/__unnamed_task__/Iteration                 285
MetaTest/__unnamed_task__/MaxReturn                 -39.4447
MetaTest/__unnamed_task__/MinReturn                 -50.5485
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   3.3109
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.152e+06
__unnamed_task__/AverageDiscountedReturn            -26.473
__unnamed_task__/AverageReturn                      -50.0189
__unnamed_task__/Iteration                          285
__unnamed_task__/MaxReturn                          -37.336
__unnamed_task__/MinReturn                         -142.088
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           12.1044
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 17:14:49 | [maml_trainer] epoch #286 | Sampling for adapation and meta-testing...
2025-04-02 17:19:22 | [maml_trainer] epoch #286 | Finished meta-testing...
2025-04-02 17:19:22 | [maml_trainer] epoch #286 | Saving snapshot...
2025-04-02 17:19:49 | [maml_trainer] epoch #286 | Saved
2025-04-02 17:19:49 | [maml_trainer] epoch #286 | Time 357090.38 s
2025-04-02 17:19:49 | [maml_trainer] epoch #286 | EpochTime 1378.84 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.6658
Average/AverageReturn                              -47.6917
Average/Iteration                                  286
Average/MaxReturn                                  -39.5878
Average/MinReturn                                  -64.7366
Average/NumEpisodes                                 80
Average/StdReturn                                    5.18402
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9208
GaussianMLPPolicy/KLAfter                            0.00183224
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.06365e-05
GaussianMLPPolicy/LossBefore                         1.23978e-08
GaussianMLPPolicy/dLoss                             -5.06241e-05
Iteration                                          286
MetaTest/Average/AverageDiscountedReturn           -46.4445
MetaTest/Average/AverageReturn                     -46.4445
MetaTest/Average/Iteration                         286
MetaTest/Average/MaxReturn                         -39.2334
MetaTest/Average/MinReturn                         -56.7942
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.15157
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -46.4445
MetaTest/__unnamed_task__/AverageReturn            -46.4445
MetaTest/__unnamed_task__/Iteration                286
MetaTest/__unnamed_task__/MaxReturn                -39.2334
MetaTest/__unnamed_task__/MinReturn                -56.7942
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.15157
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.184e+06
__unnamed_task__/AverageDiscountedReturn           -25.6658
__unnamed_task__/AverageReturn                     -47.6917
__unnamed_task__/Iteration                         286
__unnamed_task__/MaxReturn                         -39.5878
__unnamed_task__/MinReturn                         -64.7366
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           5.18402
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 17:37:58 | [maml_trainer] epoch #287 | Sampling for adapation and meta-testing...
2025-04-02 17:42:31 | [maml_trainer] epoch #287 | Finished meta-testing...
2025-04-02 17:42:31 | [maml_trainer] epoch #287 | Saving snapshot...
2025-04-02 17:42:56 | [maml_trainer] epoch #287 | Saved
2025-04-02 17:42:56 | [maml_trainer] epoch #287 | Time 358477.53 s
2025-04-02 17:42:56 | [maml_trainer] epoch #287 | EpochTime 1387.15 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.0419
Average/AverageReturn                               -48.9799
Average/Iteration                                   287
Average/MaxReturn                                   -39.1297
Average/MinReturn                                  -103.325
Average/NumEpisodes                                  80
Average/StdReturn                                     7.94207
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.92395
GaussianMLPPolicy/KLAfter                             0.00222344
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           6.32061e-05
GaussianMLPPolicy/LossBefore                         -2.26498e-09
GaussianMLPPolicy/dLoss                              -6.32083e-05
Iteration                                           287
MetaTest/Average/AverageDiscountedReturn            -45.6884
MetaTest/Average/AverageReturn                      -45.6884
MetaTest/Average/Iteration                          287
MetaTest/Average/MaxReturn                          -39.1987
MetaTest/Average/MinReturn                          -55.0774
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            4.01793
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -45.6884
MetaTest/__unnamed_task__/AverageReturn             -45.6884
MetaTest/__unnamed_task__/Iteration                 287
MetaTest/__unnamed_task__/MaxReturn                 -39.1987
MetaTest/__unnamed_task__/MinReturn                 -55.0774
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   4.01793
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.216e+06
__unnamed_task__/AverageDiscountedReturn            -26.0419
__unnamed_task__/AverageReturn                      -48.9799
__unnamed_task__/Iteration                          287
__unnamed_task__/MaxReturn                          -39.1297
__unnamed_task__/MinReturn                         -103.325
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            7.94207
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 18:01:03 | [maml_trainer] epoch #288 | Sampling for adapation and meta-testing...
2025-04-02 18:05:38 | [maml_trainer] epoch #288 | Finished meta-testing...
2025-04-02 18:05:38 | [maml_trainer] epoch #288 | Saving snapshot...
2025-04-02 18:06:02 | [maml_trainer] epoch #288 | Saved
2025-04-02 18:06:02 | [maml_trainer] epoch #288 | Time 359863.62 s
2025-04-02 18:06:02 | [maml_trainer] epoch #288 | EpochTime 1386.08 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -25.9789
Average/AverageReturn                               -48.0169
Average/Iteration                                   288
Average/MaxReturn                                   -39.3356
Average/MinReturn                                   -88.601
Average/NumEpisodes                                  80
Average/StdReturn                                     6.99627
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.92908
GaussianMLPPolicy/KLAfter                             0.0024695
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           3.37029e-05
GaussianMLPPolicy/LossBefore                         -1.14441e-08
GaussianMLPPolicy/dLoss                              -3.37143e-05
Iteration                                           288
MetaTest/Average/AverageDiscountedReturn            -52.5435
MetaTest/Average/AverageReturn                      -52.5435
MetaTest/Average/Iteration                          288
MetaTest/Average/MaxReturn                          -43.1211
MetaTest/Average/MinReturn                         -118.104
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           15.5236
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -52.5435
MetaTest/__unnamed_task__/AverageReturn             -52.5435
MetaTest/__unnamed_task__/Iteration                 288
MetaTest/__unnamed_task__/MaxReturn                 -43.1211
MetaTest/__unnamed_task__/MinReturn                -118.104
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  15.5236
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.248e+06
__unnamed_task__/AverageDiscountedReturn            -25.9789
__unnamed_task__/AverageReturn                      -48.0169
__unnamed_task__/Iteration                          288
__unnamed_task__/MaxReturn                          -39.3356
__unnamed_task__/MinReturn                          -88.601
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            6.99627
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 18:24:16 | [maml_trainer] epoch #289 | Sampling for adapation and meta-testing...
2025-04-02 18:28:45 | [maml_trainer] epoch #289 | Finished meta-testing...
2025-04-02 18:28:45 | [maml_trainer] epoch #289 | Saving snapshot...
2025-04-02 18:29:09 | [maml_trainer] epoch #289 | Saved
2025-04-02 18:29:09 | [maml_trainer] epoch #289 | Time 361250.72 s
2025-04-02 18:29:09 | [maml_trainer] epoch #289 | EpochTime 1387.10 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.4067
Average/AverageReturn                               -49.7548
Average/Iteration                                   289
Average/MaxReturn                                   -39.6498
Average/MinReturn                                  -107.704
Average/NumEpisodes                                  80
Average/StdReturn                                     8.74835
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.9328
GaussianMLPPolicy/KLAfter                             0.0062735
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           2.69911e-06
GaussianMLPPolicy/LossBefore                         -4.76837e-10
GaussianMLPPolicy/dLoss                              -2.69958e-06
Iteration                                           289
MetaTest/Average/AverageDiscountedReturn            -48.2155
MetaTest/Average/AverageReturn                      -48.2155
MetaTest/Average/Iteration                          289
MetaTest/Average/MaxReturn                          -41.5586
MetaTest/Average/MinReturn                          -57.3633
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            4.71046
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -48.2155
MetaTest/__unnamed_task__/AverageReturn             -48.2155
MetaTest/__unnamed_task__/Iteration                 289
MetaTest/__unnamed_task__/MaxReturn                 -41.5586
MetaTest/__unnamed_task__/MinReturn                 -57.3633
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   4.71046
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.28e+06
__unnamed_task__/AverageDiscountedReturn            -26.4067
__unnamed_task__/AverageReturn                      -49.7548
__unnamed_task__/Iteration                          289
__unnamed_task__/MaxReturn                          -39.6498
__unnamed_task__/MinReturn                         -107.704
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.74835
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 18:47:10 | [maml_trainer] epoch #290 | Sampling for adapation and meta-testing...
2025-04-02 18:51:41 | [maml_trainer] epoch #290 | Finished meta-testing...
2025-04-02 18:51:41 | [maml_trainer] epoch #290 | Saving snapshot...
2025-04-02 18:52:04 | [maml_trainer] epoch #290 | Saved
2025-04-02 18:52:04 | [maml_trainer] epoch #290 | Time 362625.90 s
2025-04-02 18:52:04 | [maml_trainer] epoch #290 | EpochTime 1375.18 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.5525
Average/AverageReturn                               -51.1386
Average/Iteration                                   290
Average/MaxReturn                                   -38.3447
Average/MinReturn                                  -173.825
Average/NumEpisodes                                  80
Average/StdReturn                                    17.439
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93623
GaussianMLPPolicy/KLAfter                             0.00366376
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -0.000131047
GaussianMLPPolicy/LossBefore                         -2.98023e-11
GaussianMLPPolicy/dLoss                               0.000131047
Iteration                                           290
MetaTest/Average/AverageDiscountedReturn            -47.2773
MetaTest/Average/AverageReturn                      -47.2773
MetaTest/Average/Iteration                          290
MetaTest/Average/MaxReturn                          -38.4339
MetaTest/Average/MinReturn                          -61.9194
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.51573
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.2773
MetaTest/__unnamed_task__/AverageReturn             -47.2773
MetaTest/__unnamed_task__/Iteration                 290
MetaTest/__unnamed_task__/MaxReturn                 -38.4339
MetaTest/__unnamed_task__/MinReturn                 -61.9194
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.51573
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.312e+06
__unnamed_task__/AverageDiscountedReturn            -26.5525
__unnamed_task__/AverageReturn                      -51.1386
__unnamed_task__/Iteration                          290
__unnamed_task__/MaxReturn                          -38.3447
__unnamed_task__/MinReturn                         -173.825
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           17.439
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 19:09:58 | [maml_trainer] epoch #291 | Sampling for adapation and meta-testing...
2025-04-02 19:14:19 | [maml_trainer] epoch #291 | Finished meta-testing...
2025-04-02 19:14:19 | [maml_trainer] epoch #291 | Saving snapshot...
2025-04-02 19:14:42 | [maml_trainer] epoch #291 | Saved
2025-04-02 19:14:42 | [maml_trainer] epoch #291 | Time 363983.62 s
2025-04-02 19:14:42 | [maml_trainer] epoch #291 | EpochTime 1357.72 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -25.4922
Average/AverageReturn                               -47.3055
Average/Iteration                                   291
Average/MaxReturn                                   -37.5354
Average/MinReturn                                  -109.983
Average/NumEpisodes                                  80
Average/StdReturn                                     8.45124
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93633
GaussianMLPPolicy/KLAfter                             0.00245433
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -5.39911e-05
GaussianMLPPolicy/LossBefore                         -4.52995e-09
GaussianMLPPolicy/dLoss                               5.39866e-05
Iteration                                           291
MetaTest/Average/AverageDiscountedReturn            -53.745
MetaTest/Average/AverageReturn                      -53.745
MetaTest/Average/Iteration                          291
MetaTest/Average/MaxReturn                          -41.1172
MetaTest/Average/MinReturn                         -138.176
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                           20.1354
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -53.745
MetaTest/__unnamed_task__/AverageReturn             -53.745
MetaTest/__unnamed_task__/Iteration                 291
MetaTest/__unnamed_task__/MaxReturn                 -41.1172
MetaTest/__unnamed_task__/MinReturn                -138.176
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                  20.1354
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.344e+06
__unnamed_task__/AverageDiscountedReturn            -25.4922
__unnamed_task__/AverageReturn                      -47.3055
__unnamed_task__/Iteration                          291
__unnamed_task__/MaxReturn                          -37.5354
__unnamed_task__/MinReturn                         -109.983
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                            8.45124
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 19:32:50 | [maml_trainer] epoch #292 | Sampling for adapation and meta-testing...
2025-04-02 19:37:23 | [maml_trainer] epoch #292 | Finished meta-testing...
2025-04-02 19:37:23 | [maml_trainer] epoch #292 | Saving snapshot...
2025-04-02 19:37:47 | [maml_trainer] epoch #292 | Saved
2025-04-02 19:37:47 | [maml_trainer] epoch #292 | Time 365368.97 s
2025-04-02 19:37:47 | [maml_trainer] epoch #292 | EpochTime 1385.35 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.7045
Average/AverageReturn                               -51.7397
Average/Iteration                                   292
Average/MaxReturn                                   -34.5054
Average/MinReturn                                  -146.289
Average/NumEpisodes                                  80
Average/StdReturn                                    18.8845
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93646
GaussianMLPPolicy/KLAfter                             0.0011406
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           3.17672e-06
GaussianMLPPolicy/LossBefore                          1.07586e-08
GaussianMLPPolicy/dLoss                              -3.16596e-06
Iteration                                           292
MetaTest/Average/AverageDiscountedReturn            -47.8679
MetaTest/Average/AverageReturn                      -47.8679
MetaTest/Average/Iteration                          292
MetaTest/Average/MaxReturn                          -38.18
MetaTest/Average/MinReturn                          -62.3045
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.06281
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.8679
MetaTest/__unnamed_task__/AverageReturn             -47.8679
MetaTest/__unnamed_task__/Iteration                 292
MetaTest/__unnamed_task__/MaxReturn                 -38.18
MetaTest/__unnamed_task__/MinReturn                 -62.3045
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.06281
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.376e+06
__unnamed_task__/AverageDiscountedReturn            -26.7045
__unnamed_task__/AverageReturn                      -51.7397
__unnamed_task__/Iteration                          292
__unnamed_task__/MaxReturn                          -34.5054
__unnamed_task__/MinReturn                         -146.289
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           18.8845
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 19:55:51 | [maml_trainer] epoch #293 | Sampling for adapation and meta-testing...
2025-04-02 20:00:22 | [maml_trainer] epoch #293 | Finished meta-testing...
2025-04-02 20:00:22 | [maml_trainer] epoch #293 | Saving snapshot...
2025-04-02 20:00:46 | [maml_trainer] epoch #293 | Saved
2025-04-02 20:00:46 | [maml_trainer] epoch #293 | Time 366747.73 s
2025-04-02 20:00:46 | [maml_trainer] epoch #293 | EpochTime 1378.76 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.0364
Average/AverageReturn                               -49.1346
Average/Iteration                                   293
Average/MaxReturn                                   -36.0713
Average/MinReturn                                  -143.645
Average/NumEpisodes                                  80
Average/StdReturn                                    13.2531
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93599
GaussianMLPPolicy/KLAfter                             0.00111793
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           4.88499e-06
GaussianMLPPolicy/LossBefore                          3.06964e-09
GaussianMLPPolicy/dLoss                              -4.88192e-06
Iteration                                           293
MetaTest/Average/AverageDiscountedReturn            -47.6989
MetaTest/Average/AverageReturn                      -47.6989
MetaTest/Average/Iteration                          293
MetaTest/Average/MaxReturn                          -37.4278
MetaTest/Average/MinReturn                          -63.9098
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.76431
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.6989
MetaTest/__unnamed_task__/AverageReturn             -47.6989
MetaTest/__unnamed_task__/Iteration                 293
MetaTest/__unnamed_task__/MaxReturn                 -37.4278
MetaTest/__unnamed_task__/MinReturn                 -63.9098
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.76431
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.408e+06
__unnamed_task__/AverageDiscountedReturn            -26.0364
__unnamed_task__/AverageReturn                      -49.1346
__unnamed_task__/Iteration                          293
__unnamed_task__/MaxReturn                          -36.0713
__unnamed_task__/MinReturn                         -143.645
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           13.2531
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 20:18:48 | [maml_trainer] epoch #294 | Sampling for adapation and meta-testing...
2025-04-02 20:23:20 | [maml_trainer] epoch #294 | Finished meta-testing...
2025-04-02 20:23:20 | [maml_trainer] epoch #294 | Saving snapshot...
2025-04-02 20:23:42 | [maml_trainer] epoch #294 | Saved
2025-04-02 20:23:42 | [maml_trainer] epoch #294 | Time 368123.74 s
2025-04-02 20:23:42 | [maml_trainer] epoch #294 | EpochTime 1376.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.6417
Average/AverageReturn                              -48.123
Average/Iteration                                  294
Average/MaxReturn                                  -36.6812
Average/MinReturn                                  -68.639
Average/NumEpisodes                                 80
Average/StdReturn                                    6.58556
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93552
GaussianMLPPolicy/KLAfter                            0.0015276
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.90462e-05
GaussianMLPPolicy/LossBefore                         3.93391e-09
GaussianMLPPolicy/dLoss                             -8.90423e-05
Iteration                                          294
MetaTest/Average/AverageDiscountedReturn           -51.1748
MetaTest/Average/AverageReturn                     -51.1748
MetaTest/Average/Iteration                         294
MetaTest/Average/MaxReturn                         -40.2085
MetaTest/Average/MinReturn                         -73.783
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.98806
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -51.1748
MetaTest/__unnamed_task__/AverageReturn            -51.1748
MetaTest/__unnamed_task__/Iteration                294
MetaTest/__unnamed_task__/MaxReturn                -40.2085
MetaTest/__unnamed_task__/MinReturn                -73.783
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.98806
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.44e+06
__unnamed_task__/AverageDiscountedReturn           -25.6417
__unnamed_task__/AverageReturn                     -48.123
__unnamed_task__/Iteration                         294
__unnamed_task__/MaxReturn                         -36.6812
__unnamed_task__/MinReturn                         -68.639
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.58556
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:41:25 | [maml_trainer] epoch #295 | Sampling for adapation and meta-testing...
2025-04-02 20:45:55 | [maml_trainer] epoch #295 | Finished meta-testing...
2025-04-02 20:45:55 | [maml_trainer] epoch #295 | Saving snapshot...
2025-04-02 20:46:18 | [maml_trainer] epoch #295 | Saved
2025-04-02 20:46:18 | [maml_trainer] epoch #295 | Time 369479.81 s
2025-04-02 20:46:18 | [maml_trainer] epoch #295 | EpochTime 1356.07 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -25.743
Average/AverageReturn                               -48.7895
Average/Iteration                                   295
Average/MaxReturn                                   -38.3491
Average/MinReturn                                  -124.28
Average/NumEpisodes                                  80
Average/StdReturn                                    10.6129
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93439
GaussianMLPPolicy/KLAfter                             0.00235352
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.65149e-05
GaussianMLPPolicy/LossBefore                         -5.24521e-09
GaussianMLPPolicy/dLoss                              -1.65201e-05
Iteration                                           295
MetaTest/Average/AverageDiscountedReturn            -45.2038
MetaTest/Average/AverageReturn                      -45.2038
MetaTest/Average/Iteration                          295
MetaTest/Average/MaxReturn                          -37.089
MetaTest/Average/MinReturn                          -54.2342
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            4.49292
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -45.2038
MetaTest/__unnamed_task__/AverageReturn             -45.2038
MetaTest/__unnamed_task__/Iteration                 295
MetaTest/__unnamed_task__/MaxReturn                 -37.089
MetaTest/__unnamed_task__/MinReturn                 -54.2342
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   4.49292
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.472e+06
__unnamed_task__/AverageDiscountedReturn            -25.743
__unnamed_task__/AverageReturn                      -48.7895
__unnamed_task__/Iteration                          295
__unnamed_task__/MaxReturn                          -38.3491
__unnamed_task__/MinReturn                         -124.28
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           10.6129
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 21:04:23 | [maml_trainer] epoch #296 | Sampling for adapation and meta-testing...
2025-04-02 21:08:55 | [maml_trainer] epoch #296 | Finished meta-testing...
2025-04-02 21:08:55 | [maml_trainer] epoch #296 | Saving snapshot...
2025-04-02 21:09:20 | [maml_trainer] epoch #296 | Saved
2025-04-02 21:09:20 | [maml_trainer] epoch #296 | Time 370861.45 s
2025-04-02 21:09:20 | [maml_trainer] epoch #296 | EpochTime 1381.63 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -26.0854
Average/AverageReturn                               -49.3701
Average/Iteration                                   296
Average/MaxReturn                                   -38.7899
Average/MinReturn                                  -134.903
Average/NumEpisodes                                  80
Average/StdReturn                                    11.8654
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93593
GaussianMLPPolicy/KLAfter                             0.00308092
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                           1.97328e-05
GaussianMLPPolicy/LossBefore                         -9.53674e-10
GaussianMLPPolicy/dLoss                              -1.97338e-05
Iteration                                           296
MetaTest/Average/AverageDiscountedReturn            -44.7956
MetaTest/Average/AverageReturn                      -44.7956
MetaTest/Average/Iteration                          296
MetaTest/Average/MaxReturn                          -39.1654
MetaTest/Average/MinReturn                          -63.4034
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            5.61701
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -44.7956
MetaTest/__unnamed_task__/AverageReturn             -44.7956
MetaTest/__unnamed_task__/Iteration                 296
MetaTest/__unnamed_task__/MaxReturn                 -39.1654
MetaTest/__unnamed_task__/MinReturn                 -63.4034
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   5.61701
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.504e+06
__unnamed_task__/AverageDiscountedReturn            -26.0854
__unnamed_task__/AverageReturn                      -49.3701
__unnamed_task__/Iteration                          296
__unnamed_task__/MaxReturn                          -38.7899
__unnamed_task__/MinReturn                         -134.903
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           11.8654
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 21:27:29 | [maml_trainer] epoch #297 | Sampling for adapation and meta-testing...
2025-04-02 21:32:00 | [maml_trainer] epoch #297 | Finished meta-testing...
2025-04-02 21:32:00 | [maml_trainer] epoch #297 | Saving snapshot...
2025-04-02 21:32:23 | [maml_trainer] epoch #297 | Saved
2025-04-02 21:32:23 | [maml_trainer] epoch #297 | Time 372244.92 s
2025-04-02 21:32:23 | [maml_trainer] epoch #297 | EpochTime 1383.46 s
-------------------------------------------------  --------------
Average/AverageDiscountedReturn                     -25.7364
Average/AverageReturn                               -48.8253
Average/Iteration                                   297
Average/MaxReturn                                   -37.6423
Average/MinReturn                                  -132.916
Average/NumEpisodes                                  80
Average/StdReturn                                    14.9537
Average/TerminationRate                               0
GaussianMLPPolicy/Entropy                             9.93707
GaussianMLPPolicy/KLAfter                             0.0031288
GaussianMLPPolicy/KLBefore                            0
GaussianMLPPolicy/LossAfter                          -2.19094e-05
GaussianMLPPolicy/LossBefore                          5.66244e-10
GaussianMLPPolicy/dLoss                               2.191e-05
Iteration                                           297
MetaTest/Average/AverageDiscountedReturn            -47.9253
MetaTest/Average/AverageReturn                      -47.9253
MetaTest/Average/Iteration                          297
MetaTest/Average/MaxReturn                          -38.5407
MetaTest/Average/MinReturn                          -72.7897
MetaTest/Average/NumEpisodes                         20
MetaTest/Average/StdReturn                            7.75781
MetaTest/Average/TerminationRate                      0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -47.9253
MetaTest/__unnamed_task__/AverageReturn             -47.9253
MetaTest/__unnamed_task__/Iteration                 297
MetaTest/__unnamed_task__/MaxReturn                 -38.5407
MetaTest/__unnamed_task__/MinReturn                 -72.7897
MetaTest/__unnamed_task__/NumEpisodes                20
MetaTest/__unnamed_task__/StdReturn                   7.75781
MetaTest/__unnamed_task__/TerminationRate             0
TotalEnvSteps                                         9.536e+06
__unnamed_task__/AverageDiscountedReturn            -25.7364
__unnamed_task__/AverageReturn                      -48.8253
__unnamed_task__/Iteration                          297
__unnamed_task__/MaxReturn                          -37.6423
__unnamed_task__/MinReturn                         -132.916
__unnamed_task__/NumEpisodes                         80
__unnamed_task__/StdReturn                           14.9537
__unnamed_task__/TerminationRate                      0
-------------------------------------------------  --------------
2025-04-02 21:49:36 | [maml_trainer] epoch #298 | Sampling for adapation and meta-testing...
2025-04-02 21:53:54 | [maml_trainer] epoch #298 | Finished meta-testing...
2025-04-02 21:53:54 | [maml_trainer] epoch #298 | Saving snapshot...
2025-04-02 21:54:17 | [maml_trainer] epoch #298 | Saved
2025-04-02 21:54:17 | [maml_trainer] epoch #298 | Time 373558.66 s
2025-04-02 21:54:17 | [maml_trainer] epoch #298 | EpochTime 1313.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.1623
Average/AverageReturn                              -46.9454
Average/Iteration                                  298
Average/MaxReturn                                  -37.3561
Average/MinReturn                                  -78.9948
Average/NumEpisodes                                 80
Average/StdReturn                                    7.00752
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93768
GaussianMLPPolicy/KLAfter                            0.0032865
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.79315e-05
GaussianMLPPolicy/LossBefore                        -1.37091e-09
GaussianMLPPolicy/dLoss                             -3.79329e-05
Iteration                                          298
MetaTest/Average/AverageDiscountedReturn           -45.5467
MetaTest/Average/AverageReturn                     -45.5467
MetaTest/Average/Iteration                         298
MetaTest/Average/MaxReturn                         -36.9254
MetaTest/Average/MinReturn                         -61.482
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.34609
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -45.5467
MetaTest/__unnamed_task__/AverageReturn            -45.5467
MetaTest/__unnamed_task__/Iteration                298
MetaTest/__unnamed_task__/MaxReturn                -36.9254
MetaTest/__unnamed_task__/MinReturn                -61.482
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.34609
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.568e+06
__unnamed_task__/AverageDiscountedReturn           -25.1623
__unnamed_task__/AverageReturn                     -46.9454
__unnamed_task__/Iteration                         298
__unnamed_task__/MaxReturn                         -37.3561
__unnamed_task__/MinReturn                         -78.9948
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.00752
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:12:07 | [maml_trainer] epoch #299 | Sampling for adapation and meta-testing...
2025-04-02 22:16:28 | [maml_trainer] epoch #299 | Finished meta-testing...
2025-04-02 22:16:28 | [maml_trainer] epoch #299 | Saving snapshot...
2025-04-02 22:16:50 | [maml_trainer] epoch #299 | Saved
2025-04-02 22:16:50 | [maml_trainer] epoch #299 | Time 374911.22 s
2025-04-02 22:16:50 | [maml_trainer] epoch #299 | EpochTime 1352.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -25.3927
Average/AverageReturn                              -47.4834
Average/Iteration                                  299
Average/MaxReturn                                  -36.4694
Average/MinReturn                                  -74.2167
Average/NumEpisodes                                 80
Average/StdReturn                                    6.85447
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93769
GaussianMLPPolicy/KLAfter                            0.00222253
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.20724e-05
GaussianMLPPolicy/LossBefore                        -2.46763e-08
GaussianMLPPolicy/dLoss                              2.20478e-05
Iteration                                          299
MetaTest/Average/AverageDiscountedReturn           -47.1999
MetaTest/Average/AverageReturn                     -47.1999
MetaTest/Average/Iteration                         299
MetaTest/Average/MaxReturn                         -38.2831
MetaTest/Average/MinReturn                         -71.922
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.787
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -47.1999
MetaTest/__unnamed_task__/AverageReturn            -47.1999
MetaTest/__unnamed_task__/Iteration                299
MetaTest/__unnamed_task__/MaxReturn                -38.2831
MetaTest/__unnamed_task__/MinReturn                -71.922
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.787
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.6e+06
__unnamed_task__/AverageDiscountedReturn           -25.3927
__unnamed_task__/AverageReturn                     -47.4834
__unnamed_task__/Iteration                         299
__unnamed_task__/MaxReturn                         -36.4694
__unnamed_task__/MinReturn                         -74.2167
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.85447
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------