2025-04-02 13:45:18 | [maml_trainer] Logging to /home/h2khalil/MetaRL-Assistive-Robotics/data/local/experiment/maml_trainer_2
2025-04-02 13:52:58 | [maml_trainer] Obtaining samples...
2025-04-02 13:58:24 | [maml_trainer] epoch #0 | Sampling for adapation and meta-testing...
2025-04-02 13:59:44 | [maml_trainer] epoch #0 | Finished meta-testing...
2025-04-02 13:59:44 | [maml_trainer] epoch #0 | Saving snapshot...
2025-04-02 14:00:02 | [maml_trainer] epoch #0 | Saved
2025-04-02 14:00:02 | [maml_trainer] epoch #0 | Time 424.38 s
2025-04-02 14:00:02 | [maml_trainer] epoch #0 | EpochTime 424.38 s
-------------------------------------------------  ---------------
Average/AverageDiscountedReturn                      -40.2857
Average/AverageReturn                               -106.321
Average/Iteration                                      0
Average/MaxReturn                                    -72.5083
Average/MinReturn                                   -150.002
Average/NumEpisodes                                   80
Average/StdReturn                                     19.6817
Average/TerminationRate                                0
GaussianMLPPolicy/Entropy                              9.92576
GaussianMLPPolicy/KLAfter                              0.0352945
GaussianMLPPolicy/KLBefore                             0
GaussianMLPPolicy/LossAfter                            0.000188627
GaussianMLPPolicy/LossBefore                          -6.25849e-10
GaussianMLPPolicy/dLoss                               -0.000188627
Iteration                                              0
MetaTest/Average/AverageDiscountedReturn            -103.38
MetaTest/Average/AverageReturn                      -103.38
MetaTest/Average/Iteration                             0
MetaTest/Average/MaxReturn                           -78.3711
MetaTest/Average/MinReturn                          -130.707
MetaTest/Average/NumEpisodes                          20
MetaTest/Average/StdReturn                            13.5069
MetaTest/Average/TerminationRate                       0
MetaTest/__unnamed_task__/AverageDiscountedReturn   -103.38
MetaTest/__unnamed_task__/AverageReturn             -103.38
MetaTest/__unnamed_task__/Iteration                    0
MetaTest/__unnamed_task__/MaxReturn                  -78.3711
MetaTest/__unnamed_task__/MinReturn                 -130.707
MetaTest/__unnamed_task__/NumEpisodes                 20
MetaTest/__unnamed_task__/StdReturn                   13.5069
MetaTest/__unnamed_task__/TerminationRate              0
TotalEnvSteps                                      32000
__unnamed_task__/AverageDiscountedReturn             -40.2857
__unnamed_task__/AverageReturn                      -106.321
__unnamed_task__/Iteration                             0
__unnamed_task__/MaxReturn                           -72.5083
__unnamed_task__/MinReturn                          -150.002
__unnamed_task__/NumEpisodes                          80
__unnamed_task__/StdReturn                            19.6817
__unnamed_task__/TerminationRate                       0
-------------------------------------------------  ---------------
2025-04-02 14:05:36 | [maml_trainer] epoch #1 | Sampling for adapation and meta-testing...
2025-04-02 14:06:59 | [maml_trainer] epoch #1 | Finished meta-testing...
2025-04-02 14:06:59 | [maml_trainer] epoch #1 | Saving snapshot...
2025-04-02 14:07:20 | [maml_trainer] epoch #1 | Saved
2025-04-02 14:07:20 | [maml_trainer] epoch #1 | Time 862.38 s
2025-04-02 14:07:20 | [maml_trainer] epoch #1 | EpochTime 438.00 s
-------------------------------------------------  ---------------
Average/AverageDiscountedReturn                      -39.061
Average/AverageReturn                               -101.474
Average/Iteration                                      1
Average/MaxReturn                                    -63.4282
Average/MinReturn                                   -152.53
Average/NumEpisodes                                   80
Average/StdReturn                                     18.2648
Average/TerminationRate                                0
GaussianMLPPolicy/Entropy                              9.92983
GaussianMLPPolicy/KLAfter                              0.0201304
GaussianMLPPolicy/KLBefore                             0
GaussianMLPPolicy/LossAfter                            0.000104268
GaussianMLPPolicy/LossBefore                          -2.26498e-09
GaussianMLPPolicy/dLoss                               -0.00010427
Iteration                                              1
MetaTest/Average/AverageDiscountedReturn             -98.9382
MetaTest/Average/AverageReturn                       -98.9382
MetaTest/Average/Iteration                             1
MetaTest/Average/MaxReturn                           -75.0828
MetaTest/Average/MinReturn                          -128.008
MetaTest/Average/NumEpisodes                          20
MetaTest/Average/StdReturn                            15.5367
MetaTest/Average/TerminationRate                       0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -98.9382
MetaTest/__unnamed_task__/AverageReturn              -98.9382
MetaTest/__unnamed_task__/Iteration                    1
MetaTest/__unnamed_task__/MaxReturn                  -75.0828
MetaTest/__unnamed_task__/MinReturn                 -128.008
MetaTest/__unnamed_task__/NumEpisodes                 20
MetaTest/__unnamed_task__/StdReturn                   15.5367
MetaTest/__unnamed_task__/TerminationRate              0
TotalEnvSteps                                      64000
__unnamed_task__/AverageDiscountedReturn             -39.061
__unnamed_task__/AverageReturn                      -101.474
__unnamed_task__/Iteration                             1
__unnamed_task__/MaxReturn                           -63.4282
__unnamed_task__/MinReturn                          -152.53
__unnamed_task__/NumEpisodes                          80
__unnamed_task__/StdReturn                            18.2648
__unnamed_task__/TerminationRate                       0
-------------------------------------------------  ---------------
2025-04-02 14:12:53 | [maml_trainer] epoch #2 | Sampling for adapation and meta-testing...
2025-04-02 14:14:17 | [maml_trainer] epoch #2 | Finished meta-testing...
2025-04-02 14:14:17 | [maml_trainer] epoch #2 | Saving snapshot...
2025-04-02 14:14:37 | [maml_trainer] epoch #2 | Saved
2025-04-02 14:14:37 | [maml_trainer] epoch #2 | Time 1299.60 s
2025-04-02 14:14:37 | [maml_trainer] epoch #2 | EpochTime 437.21 s
-------------------------------------------------  ---------------
Average/AverageDiscountedReturn                      -37.789
Average/AverageReturn                                -98.2822
Average/Iteration                                      2
Average/MaxReturn                                    -62.8766
Average/MinReturn                                   -134.738
Average/NumEpisodes                                   80
Average/StdReturn                                     16.6256
Average/TerminationRate                                0
GaussianMLPPolicy/Entropy                              9.93524
GaussianMLPPolicy/KLAfter                              0.0135207
GaussianMLPPolicy/KLBefore                             0
GaussianMLPPolicy/LossAfter                            4.96046e-05
GaussianMLPPolicy/LossBefore                          -1.02818e-08
GaussianMLPPolicy/dLoss                               -4.96148e-05
Iteration                                              2
MetaTest/Average/AverageDiscountedReturn             -94.6955
MetaTest/Average/AverageReturn                       -94.6955
MetaTest/Average/Iteration                             2
MetaTest/Average/MaxReturn                           -72.3712
MetaTest/Average/MinReturn                          -133.005
MetaTest/Average/NumEpisodes                          20
MetaTest/Average/StdReturn                            16.9952
MetaTest/Average/TerminationRate                       0
MetaTest/__unnamed_task__/AverageDiscountedReturn    -94.6955
MetaTest/__unnamed_task__/AverageReturn              -94.6955
MetaTest/__unnamed_task__/Iteration                    2
MetaTest/__unnamed_task__/MaxReturn                  -72.3712
MetaTest/__unnamed_task__/MinReturn                 -133.005
MetaTest/__unnamed_task__/NumEpisodes                 20
MetaTest/__unnamed_task__/StdReturn                   16.9952
MetaTest/__unnamed_task__/TerminationRate              0
TotalEnvSteps                                      96000
__unnamed_task__/AverageDiscountedReturn             -37.789
__unnamed_task__/AverageReturn                       -98.2822
__unnamed_task__/Iteration                             2
__unnamed_task__/MaxReturn                           -62.8766
__unnamed_task__/MinReturn                          -134.738
__unnamed_task__/NumEpisodes                          80
__unnamed_task__/StdReturn                            16.6256
__unnamed_task__/TerminationRate                       0
-------------------------------------------------  ---------------
2025-04-02 14:20:09 | [maml_trainer] epoch #3 | Sampling for adapation and meta-testing...
2025-04-02 14:21:32 | [maml_trainer] epoch #3 | Finished meta-testing...
2025-04-02 14:21:32 | [maml_trainer] epoch #3 | Saving snapshot...
2025-04-02 14:21:52 | [maml_trainer] epoch #3 | Saved
2025-04-02 14:21:52 | [maml_trainer] epoch #3 | Time 1734.14 s
2025-04-02 14:21:52 | [maml_trainer] epoch #3 | EpochTime 434.54 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -36.5387
Average/AverageReturn                                 -94.6952
Average/Iteration                                       3
Average/MaxReturn                                     -53.1432
Average/MinReturn                                    -133.797
Average/NumEpisodes                                    80
Average/StdReturn                                      17.8521
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.93997
GaussianMLPPolicy/KLAfter                               0.0232095
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -8.63165e-07
GaussianMLPPolicy/LossBefore                           -8.25524e-09
GaussianMLPPolicy/dLoss                                 8.5491e-07
Iteration                                               3
MetaTest/Average/AverageDiscountedReturn              -90.0885
MetaTest/Average/AverageReturn                        -90.0885
MetaTest/Average/Iteration                              3
MetaTest/Average/MaxReturn                            -70.1412
MetaTest/Average/MinReturn                           -122.009
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             13.673
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -90.0885
MetaTest/__unnamed_task__/AverageReturn               -90.0885
MetaTest/__unnamed_task__/Iteration                     3
MetaTest/__unnamed_task__/MaxReturn                   -70.1412
MetaTest/__unnamed_task__/MinReturn                  -122.009
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    13.673
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      128000
__unnamed_task__/AverageDiscountedReturn              -36.5387
__unnamed_task__/AverageReturn                        -94.6952
__unnamed_task__/Iteration                              3
__unnamed_task__/MaxReturn                            -53.1432
__unnamed_task__/MinReturn                           -133.797
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.8521
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 14:27:26 | [maml_trainer] epoch #4 | Sampling for adapation and meta-testing...
2025-04-02 14:28:50 | [maml_trainer] epoch #4 | Finished meta-testing...
2025-04-02 14:28:50 | [maml_trainer] epoch #4 | Saving snapshot...
2025-04-02 14:29:10 | [maml_trainer] epoch #4 | Saved
2025-04-02 14:29:10 | [maml_trainer] epoch #4 | Time 2172.34 s
2025-04-02 14:29:10 | [maml_trainer] epoch #4 | EpochTime 438.20 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -35.9369
Average/AverageReturn                                 -92.5914
Average/Iteration                                       4
Average/MaxReturn                                     -46.1069
Average/MinReturn                                    -145.418
Average/NumEpisodes                                    80
Average/StdReturn                                      19.6243
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.94542
GaussianMLPPolicy/KLAfter                               0.0319889
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             0.000123046
GaussianMLPPolicy/LossBefore                           -4.36604e-09
GaussianMLPPolicy/dLoss                                -0.00012305
Iteration                                               4
MetaTest/Average/AverageDiscountedReturn              -91.5655
MetaTest/Average/AverageReturn                        -91.5655
MetaTest/Average/Iteration                              4
MetaTest/Average/MaxReturn                            -65.3909
MetaTest/Average/MinReturn                           -124.684
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.0634
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -91.5655
MetaTest/__unnamed_task__/AverageReturn               -91.5655
MetaTest/__unnamed_task__/Iteration                     4
MetaTest/__unnamed_task__/MaxReturn                   -65.3909
MetaTest/__unnamed_task__/MinReturn                  -124.684
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.0634
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      160000
__unnamed_task__/AverageDiscountedReturn              -35.9369
__unnamed_task__/AverageReturn                        -92.5914
__unnamed_task__/Iteration                              4
__unnamed_task__/MaxReturn                            -46.1069
__unnamed_task__/MinReturn                           -145.418
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             19.6243
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 14:34:46 | [maml_trainer] epoch #5 | Sampling for adapation and meta-testing...
2025-04-02 14:36:08 | [maml_trainer] epoch #5 | Finished meta-testing...
2025-04-02 14:36:08 | [maml_trainer] epoch #5 | Saving snapshot...
2025-04-02 14:36:29 | [maml_trainer] epoch #5 | Saved
2025-04-02 14:36:29 | [maml_trainer] epoch #5 | Time 2611.14 s
2025-04-02 14:36:29 | [maml_trainer] epoch #5 | EpochTime 438.79 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -33.8114
Average/AverageReturn                                 -87.8835
Average/Iteration                                       5
Average/MaxReturn                                     -38.3391
Average/MinReturn                                    -132.135
Average/NumEpisodes                                    80
Average/StdReturn                                      16.0984
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.95093
GaussianMLPPolicy/KLAfter                               0.0242466
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             6.85896e-05
GaussianMLPPolicy/LossBefore                            3.45707e-09
GaussianMLPPolicy/dLoss                                -6.85861e-05
Iteration                                               5
MetaTest/Average/AverageDiscountedReturn              -82.0524
MetaTest/Average/AverageReturn                        -82.0524
MetaTest/Average/Iteration                              5
MetaTest/Average/MaxReturn                            -52.4803
MetaTest/Average/MinReturn                           -125.233
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.2624
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -82.0524
MetaTest/__unnamed_task__/AverageReturn               -82.0524
MetaTest/__unnamed_task__/Iteration                     5
MetaTest/__unnamed_task__/MaxReturn                   -52.4803
MetaTest/__unnamed_task__/MinReturn                  -125.233
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.2624
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      192000
__unnamed_task__/AverageDiscountedReturn              -33.8114
__unnamed_task__/AverageReturn                        -87.8835
__unnamed_task__/Iteration                              5
__unnamed_task__/MaxReturn                            -38.3391
__unnamed_task__/MinReturn                           -132.135
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             16.0984
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 14:42:02 | [maml_trainer] epoch #6 | Sampling for adapation and meta-testing...
2025-04-02 14:43:27 | [maml_trainer] epoch #6 | Finished meta-testing...
2025-04-02 14:43:27 | [maml_trainer] epoch #6 | Saving snapshot...
2025-04-02 14:43:47 | [maml_trainer] epoch #6 | Saved
2025-04-02 14:43:47 | [maml_trainer] epoch #6 | Time 3049.42 s
2025-04-02 14:43:47 | [maml_trainer] epoch #6 | EpochTime 438.28 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -32.1834
Average/AverageReturn                                 -81.7478
Average/Iteration                                       6
Average/MaxReturn                                     -28.0771
Average/MinReturn                                    -126.066
Average/NumEpisodes                                    80
Average/StdReturn                                      17.5887
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.95524
GaussianMLPPolicy/KLAfter                               0.0232031
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             0.000240112
GaussianMLPPolicy/LossBefore                            6.91414e-09
GaussianMLPPolicy/dLoss                                -0.000240105
Iteration                                               6
MetaTest/Average/AverageDiscountedReturn              -71.208
MetaTest/Average/AverageReturn                        -71.208
MetaTest/Average/Iteration                              6
MetaTest/Average/MaxReturn                            -35.6478
MetaTest/Average/MinReturn                           -112.513
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             18.899
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -71.208
MetaTest/__unnamed_task__/AverageReturn               -71.208
MetaTest/__unnamed_task__/Iteration                     6
MetaTest/__unnamed_task__/MaxReturn                   -35.6478
MetaTest/__unnamed_task__/MinReturn                  -112.513
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    18.899
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      224000
__unnamed_task__/AverageDiscountedReturn              -32.1834
__unnamed_task__/AverageReturn                        -81.7478
__unnamed_task__/Iteration                              6
__unnamed_task__/MaxReturn                            -28.0771
__unnamed_task__/MinReturn                           -126.066
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.5887
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 14:49:23 | [maml_trainer] epoch #7 | Sampling for adapation and meta-testing...
2025-04-02 14:50:46 | [maml_trainer] epoch #7 | Finished meta-testing...
2025-04-02 14:50:46 | [maml_trainer] epoch #7 | Saving snapshot...
2025-04-02 14:51:05 | [maml_trainer] epoch #7 | Saved
2025-04-02 14:51:05 | [maml_trainer] epoch #7 | Time 3487.65 s
2025-04-02 14:51:05 | [maml_trainer] epoch #7 | EpochTime 438.22 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -30.6886
Average/AverageReturn                                 -76.3881
Average/Iteration                                       7
Average/MaxReturn                                     -29.8284
Average/MinReturn                                    -115.643
Average/NumEpisodes                                    80
Average/StdReturn                                      17.1587
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96034
GaussianMLPPolicy/KLAfter                               0.0157956
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             1.92125e-05
GaussianMLPPolicy/LossBefore                           -3.96371e-09
GaussianMLPPolicy/dLoss                                -1.92164e-05
Iteration                                               7
MetaTest/Average/AverageDiscountedReturn              -74.3218
MetaTest/Average/AverageReturn                        -74.3218
MetaTest/Average/Iteration                              7
MetaTest/Average/MaxReturn                            -55.395
MetaTest/Average/MinReturn                           -102.926
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             11.8749
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -74.3218
MetaTest/__unnamed_task__/AverageReturn               -74.3218
MetaTest/__unnamed_task__/Iteration                     7
MetaTest/__unnamed_task__/MaxReturn                   -55.395
MetaTest/__unnamed_task__/MinReturn                  -102.926
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    11.8749
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      256000
__unnamed_task__/AverageDiscountedReturn              -30.6886
__unnamed_task__/AverageReturn                        -76.3881
__unnamed_task__/Iteration                              7
__unnamed_task__/MaxReturn                            -29.8284
__unnamed_task__/MinReturn                           -115.643
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.1587
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 14:56:38 | [maml_trainer] epoch #8 | Sampling for adapation and meta-testing...
2025-04-02 14:58:01 | [maml_trainer] epoch #8 | Finished meta-testing...
2025-04-02 14:58:01 | [maml_trainer] epoch #8 | Saving snapshot...
2025-04-02 14:58:21 | [maml_trainer] epoch #8 | Saved
2025-04-02 14:58:21 | [maml_trainer] epoch #8 | Time 3923.65 s
2025-04-02 14:58:21 | [maml_trainer] epoch #8 | EpochTime 435.99 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -30.0909
Average/AverageReturn                                 -73.6748
Average/Iteration                                       8
Average/MaxReturn                                     -33.2851
Average/MinReturn                                    -116.034
Average/NumEpisodes                                    80
Average/StdReturn                                      17.394
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.9613
GaussianMLPPolicy/KLAfter                               0.0169462
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -7.33053e-05
GaussianMLPPolicy/LossBefore                            1.87755e-09
GaussianMLPPolicy/dLoss                                 7.33072e-05
Iteration                                               8
MetaTest/Average/AverageDiscountedReturn              -72.4223
MetaTest/Average/AverageReturn                        -72.4223
MetaTest/Average/Iteration                              8
MetaTest/Average/MaxReturn                            -35.1502
MetaTest/Average/MinReturn                           -108.248
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             20.2816
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -72.4223
MetaTest/__unnamed_task__/AverageReturn               -72.4223
MetaTest/__unnamed_task__/Iteration                     8
MetaTest/__unnamed_task__/MaxReturn                   -35.1502
MetaTest/__unnamed_task__/MinReturn                  -108.248
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    20.2816
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      288000
__unnamed_task__/AverageDiscountedReturn              -30.0909
__unnamed_task__/AverageReturn                        -73.6748
__unnamed_task__/Iteration                              8
__unnamed_task__/MaxReturn                            -33.2851
__unnamed_task__/MinReturn                           -116.034
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.394
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:04:00 | [maml_trainer] epoch #9 | Sampling for adapation and meta-testing...
2025-04-02 15:05:27 | [maml_trainer] epoch #9 | Finished meta-testing...
2025-04-02 15:05:27 | [maml_trainer] epoch #9 | Saving snapshot...
2025-04-02 15:05:48 | [maml_trainer] epoch #9 | Saved
2025-04-02 15:05:48 | [maml_trainer] epoch #9 | Time 4370.41 s
2025-04-02 15:05:48 | [maml_trainer] epoch #9 | EpochTime 446.76 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -27.9603
Average/AverageReturn                                 -64.4378
Average/Iteration                                       9
Average/MaxReturn                                     -21.2583
Average/MinReturn                                    -110.174
Average/NumEpisodes                                    80
Average/StdReturn                                      17.7726
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96363
GaussianMLPPolicy/KLAfter                               0.0104727
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             9.19302e-05
GaussianMLPPolicy/LossBefore                           -1.2219e-09
GaussianMLPPolicy/dLoss                                -9.19314e-05
Iteration                                               9
MetaTest/Average/AverageDiscountedReturn              -63.6072
MetaTest/Average/AverageReturn                        -63.6072
MetaTest/Average/Iteration                              9
MetaTest/Average/MaxReturn                            -45.0368
MetaTest/Average/MinReturn                            -88.9944
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             11.8703
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -63.6072
MetaTest/__unnamed_task__/AverageReturn               -63.6072
MetaTest/__unnamed_task__/Iteration                     9
MetaTest/__unnamed_task__/MaxReturn                   -45.0368
MetaTest/__unnamed_task__/MinReturn                   -88.9944
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    11.8703
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      320000
__unnamed_task__/AverageDiscountedReturn              -27.9603
__unnamed_task__/AverageReturn                        -64.4378
__unnamed_task__/Iteration                              9
__unnamed_task__/MaxReturn                            -21.2583
__unnamed_task__/MinReturn                           -110.174
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.7726
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:11:37 | [maml_trainer] epoch #10 | Sampling for adapation and meta-testing...
2025-04-02 15:13:05 | [maml_trainer] epoch #10 | Finished meta-testing...
2025-04-02 15:13:05 | [maml_trainer] epoch #10 | Saving snapshot...
2025-04-02 15:13:26 | [maml_trainer] epoch #10 | Saved
2025-04-02 15:13:26 | [maml_trainer] epoch #10 | Time 4828.16 s
2025-04-02 15:13:26 | [maml_trainer] epoch #10 | EpochTime 457.74 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -26.0895
Average/AverageReturn                                 -60.6789
Average/Iteration                                      10
Average/MaxReturn                                     -33.7186
Average/MinReturn                                     -93.3737
Average/NumEpisodes                                    80
Average/StdReturn                                      13.3663
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96589
GaussianMLPPolicy/KLAfter                               0.0112622
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -9.42797e-05
GaussianMLPPolicy/LossBefore                           -1.10269e-08
GaussianMLPPolicy/dLoss                                 9.42686e-05
Iteration                                              10
MetaTest/Average/AverageDiscountedReturn              -54.2535
MetaTest/Average/AverageReturn                        -54.2535
MetaTest/Average/Iteration                             10
MetaTest/Average/MaxReturn                            -29.9755
MetaTest/Average/MinReturn                            -86.9711
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.0625
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -54.2535
MetaTest/__unnamed_task__/AverageReturn               -54.2535
MetaTest/__unnamed_task__/Iteration                    10
MetaTest/__unnamed_task__/MaxReturn                   -29.9755
MetaTest/__unnamed_task__/MinReturn                   -86.9711
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.0625
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      352000
__unnamed_task__/AverageDiscountedReturn              -26.0895
__unnamed_task__/AverageReturn                        -60.6789
__unnamed_task__/Iteration                             10
__unnamed_task__/MaxReturn                            -33.7186
__unnamed_task__/MinReturn                            -93.3737
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.3663
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:19:13 | [maml_trainer] epoch #11 | Sampling for adapation and meta-testing...
2025-04-02 15:20:41 | [maml_trainer] epoch #11 | Finished meta-testing...
2025-04-02 15:20:41 | [maml_trainer] epoch #11 | Saving snapshot...
2025-04-02 15:21:02 | [maml_trainer] epoch #11 | Saved
2025-04-02 15:21:02 | [maml_trainer] epoch #11 | Time 5284.53 s
2025-04-02 15:21:02 | [maml_trainer] epoch #11 | EpochTime 456.37 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -24.5232
Average/AverageReturn                                 -56.1248
Average/Iteration                                      11
Average/MaxReturn                                     -26.7654
Average/MinReturn                                     -86.5341
Average/NumEpisodes                                    80
Average/StdReturn                                      13.2961
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96678
GaussianMLPPolicy/KLAfter                               0.0120825
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000174274
GaussianMLPPolicy/LossBefore                           -9.38773e-09
GaussianMLPPolicy/dLoss                                 0.000174264
Iteration                                              11
MetaTest/Average/AverageDiscountedReturn              -53.4935
MetaTest/Average/AverageReturn                        -53.4935
MetaTest/Average/Iteration                             11
MetaTest/Average/MaxReturn                            -32.2421
MetaTest/Average/MinReturn                            -80.4587
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             14.532
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -53.4935
MetaTest/__unnamed_task__/AverageReturn               -53.4935
MetaTest/__unnamed_task__/Iteration                    11
MetaTest/__unnamed_task__/MaxReturn                   -32.2421
MetaTest/__unnamed_task__/MinReturn                   -80.4587
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    14.532
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      384000
__unnamed_task__/AverageDiscountedReturn              -24.5232
__unnamed_task__/AverageReturn                        -56.1248
__unnamed_task__/Iteration                             11
__unnamed_task__/MaxReturn                            -26.7654
__unnamed_task__/MinReturn                            -86.5341
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.2961
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:26:46 | [maml_trainer] epoch #12 | Sampling for adapation and meta-testing...
2025-04-02 15:28:12 | [maml_trainer] epoch #12 | Finished meta-testing...
2025-04-02 15:28:12 | [maml_trainer] epoch #12 | Saving snapshot...
2025-04-02 15:28:32 | [maml_trainer] epoch #12 | Saved
2025-04-02 15:28:32 | [maml_trainer] epoch #12 | Time 5734.63 s
2025-04-02 15:28:32 | [maml_trainer] epoch #12 | EpochTime 450.10 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -24.048
Average/AverageReturn                                 -54.9135
Average/Iteration                                      12
Average/MaxReturn                                      -1.16963
Average/MinReturn                                     -88.8953
Average/NumEpisodes                                    80
Average/StdReturn                                      14.4205
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.96975
GaussianMLPPolicy/KLAfter                               0.0108115
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000223943
GaussianMLPPolicy/LossBefore                           -5.00679e-09
GaussianMLPPolicy/dLoss                                 0.000223938
Iteration                                              12
MetaTest/Average/AverageDiscountedReturn              -47.8777
MetaTest/Average/AverageReturn                        -47.8777
MetaTest/Average/Iteration                             12
MetaTest/Average/MaxReturn                            -19.7344
MetaTest/Average/MinReturn                            -71.575
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             13.3723
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -47.8777
MetaTest/__unnamed_task__/AverageReturn               -47.8777
MetaTest/__unnamed_task__/Iteration                    12
MetaTest/__unnamed_task__/MaxReturn                   -19.7344
MetaTest/__unnamed_task__/MinReturn                   -71.575
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    13.3723
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      416000
__unnamed_task__/AverageDiscountedReturn              -24.048
__unnamed_task__/AverageReturn                        -54.9135
__unnamed_task__/Iteration                             12
__unnamed_task__/MaxReturn                             -1.16963
__unnamed_task__/MinReturn                            -88.8953
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             14.4205
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:34:24 | [maml_trainer] epoch #13 | Sampling for adapation and meta-testing...
2025-04-02 15:35:52 | [maml_trainer] epoch #13 | Finished meta-testing...
2025-04-02 15:35:52 | [maml_trainer] epoch #13 | Saving snapshot...
2025-04-02 15:36:14 | [maml_trainer] epoch #13 | Saved
2025-04-02 15:36:14 | [maml_trainer] epoch #13 | Time 6196.34 s
2025-04-02 15:36:14 | [maml_trainer] epoch #13 | EpochTime 461.71 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -22.242
Average/AverageReturn                                 -49.7107
Average/Iteration                                      13
Average/MaxReturn                                     -23.5815
Average/MinReturn                                     -89.7381
Average/NumEpisodes                                    80
Average/StdReturn                                      12.4535
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.97205
GaussianMLPPolicy/KLAfter                               0.0104842
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -4.08625e-05
GaussianMLPPolicy/LossBefore                            1.74344e-08
GaussianMLPPolicy/dLoss                                 4.08799e-05
Iteration                                              13
MetaTest/Average/AverageDiscountedReturn              -48.846
MetaTest/Average/AverageReturn                        -48.846
MetaTest/Average/Iteration                             13
MetaTest/Average/MaxReturn                            -33.0187
MetaTest/Average/MinReturn                            -76.9736
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             10.3726
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -48.846
MetaTest/__unnamed_task__/AverageReturn               -48.846
MetaTest/__unnamed_task__/Iteration                    13
MetaTest/__unnamed_task__/MaxReturn                   -33.0187
MetaTest/__unnamed_task__/MinReturn                   -76.9736
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    10.3726
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      448000
__unnamed_task__/AverageDiscountedReturn              -22.242
__unnamed_task__/AverageReturn                        -49.7107
__unnamed_task__/Iteration                             13
__unnamed_task__/MaxReturn                            -23.5815
__unnamed_task__/MinReturn                            -89.7381
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             12.4535
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:42:09 | [maml_trainer] epoch #14 | Sampling for adapation and meta-testing...
2025-04-02 15:43:33 | [maml_trainer] epoch #14 | Finished meta-testing...
2025-04-02 15:43:33 | [maml_trainer] epoch #14 | Saving snapshot...
2025-04-02 15:43:53 | [maml_trainer] epoch #14 | Saved
2025-04-02 15:43:53 | [maml_trainer] epoch #14 | Time 6655.02 s
2025-04-02 15:43:53 | [maml_trainer] epoch #14 | EpochTime 458.68 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -20.5863
Average/AverageReturn                                 -46.5944
Average/Iteration                                      14
Average/MaxReturn                                      -8.32939
Average/MinReturn                                     -85.2561
Average/NumEpisodes                                    80
Average/StdReturn                                      12.287
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.97527
GaussianMLPPolicy/KLAfter                               0.00564095
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -6.37284e-05
GaussianMLPPolicy/LossBefore                            1.12057e-08
GaussianMLPPolicy/dLoss                                 6.37396e-05
Iteration                                              14
MetaTest/Average/AverageDiscountedReturn              -47.7746
MetaTest/Average/AverageReturn                        -47.7746
MetaTest/Average/Iteration                             14
MetaTest/Average/MaxReturn                            -27.4652
MetaTest/Average/MinReturn                            -68.4596
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             11.5294
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -47.7746
MetaTest/__unnamed_task__/AverageReturn               -47.7746
MetaTest/__unnamed_task__/Iteration                    14
MetaTest/__unnamed_task__/MaxReturn                   -27.4652
MetaTest/__unnamed_task__/MinReturn                   -68.4596
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    11.5294
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      480000
__unnamed_task__/AverageDiscountedReturn              -20.5863
__unnamed_task__/AverageReturn                        -46.5944
__unnamed_task__/Iteration                             14
__unnamed_task__/MaxReturn                             -8.32939
__unnamed_task__/MinReturn                            -85.2561
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             12.287
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:49:35 | [maml_trainer] epoch #15 | Sampling for adapation and meta-testing...
2025-04-02 15:51:03 | [maml_trainer] epoch #15 | Finished meta-testing...
2025-04-02 15:51:03 | [maml_trainer] epoch #15 | Saving snapshot...
2025-04-02 15:51:23 | [maml_trainer] epoch #15 | Saved
2025-04-02 15:51:23 | [maml_trainer] epoch #15 | Time 7105.23 s
2025-04-02 15:51:23 | [maml_trainer] epoch #15 | EpochTime 450.20 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -20.8721
Average/AverageReturn                                 -47.2043
Average/Iteration                                      15
Average/MaxReturn                                     -19.9091
Average/MinReturn                                     -83.5795
Average/NumEpisodes                                    80
Average/StdReturn                                      12.3718
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.9786
GaussianMLPPolicy/KLAfter                               0.00788591
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000247161
GaussianMLPPolicy/LossBefore                            1.42455e-08
GaussianMLPPolicy/dLoss                                 0.000247175
Iteration                                              15
MetaTest/Average/AverageDiscountedReturn              -48.3999
MetaTest/Average/AverageReturn                        -48.3999
MetaTest/Average/Iteration                             15
MetaTest/Average/MaxReturn                            -31.6868
MetaTest/Average/MinReturn                            -65.1542
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                              9.96446
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -48.3999
MetaTest/__unnamed_task__/AverageReturn               -48.3999
MetaTest/__unnamed_task__/Iteration                    15
MetaTest/__unnamed_task__/MaxReturn                   -31.6868
MetaTest/__unnamed_task__/MinReturn                   -65.1542
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                     9.96446
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      512000
__unnamed_task__/AverageDiscountedReturn              -20.8721
__unnamed_task__/AverageReturn                        -47.2043
__unnamed_task__/Iteration                             15
__unnamed_task__/MaxReturn                            -19.9091
__unnamed_task__/MinReturn                            -83.5795
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             12.3718
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 15:57:21 | [maml_trainer] epoch #16 | Sampling for adapation and meta-testing...
2025-04-02 15:58:51 | [maml_trainer] epoch #16 | Finished meta-testing...
2025-04-02 15:58:51 | [maml_trainer] epoch #16 | Saving snapshot...
2025-04-02 15:59:12 | [maml_trainer] epoch #16 | Saved
2025-04-02 15:59:12 | [maml_trainer] epoch #16 | Time 7574.78 s
2025-04-02 15:59:12 | [maml_trainer] epoch #16 | EpochTime 469.55 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -20.4886
Average/AverageReturn                                 -47.724
Average/Iteration                                      16
Average/MaxReturn                                     -11.9902
Average/MinReturn                                     -80.0682
Average/NumEpisodes                                    80
Average/StdReturn                                      13.8081
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98077
GaussianMLPPolicy/KLAfter                               0.00783644
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -8.25503e-05
GaussianMLPPolicy/LossBefore                           -1.21295e-08
GaussianMLPPolicy/dLoss                                 8.25382e-05
Iteration                                              16
MetaTest/Average/AverageDiscountedReturn              -53.7156
MetaTest/Average/AverageReturn                        -53.7156
MetaTest/Average/Iteration                             16
MetaTest/Average/MaxReturn                            -18.2111
MetaTest/Average/MinReturn                            -77.4959
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             13.8902
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -53.7156
MetaTest/__unnamed_task__/AverageReturn               -53.7156
MetaTest/__unnamed_task__/Iteration                    16
MetaTest/__unnamed_task__/MaxReturn                   -18.2111
MetaTest/__unnamed_task__/MinReturn                   -77.4959
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    13.8902
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      544000
__unnamed_task__/AverageDiscountedReturn              -20.4886
__unnamed_task__/AverageReturn                        -47.724
__unnamed_task__/Iteration                             16
__unnamed_task__/MaxReturn                            -11.9902
__unnamed_task__/MinReturn                            -80.0682
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.8081
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:04:55 | [maml_trainer] epoch #17 | Sampling for adapation and meta-testing...
2025-04-02 16:06:21 | [maml_trainer] epoch #17 | Finished meta-testing...
2025-04-02 16:06:21 | [maml_trainer] epoch #17 | Saving snapshot...
2025-04-02 16:06:40 | [maml_trainer] epoch #17 | Saved
2025-04-02 16:06:40 | [maml_trainer] epoch #17 | Time 8022.96 s
2025-04-02 16:06:40 | [maml_trainer] epoch #17 | EpochTime 448.18 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -21.4873
Average/AverageReturn                                 -49.4591
Average/Iteration                                      17
Average/MaxReturn                                     -14.5515
Average/MinReturn                                     -88.2621
Average/NumEpisodes                                    80
Average/StdReturn                                      13.7594
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98279
GaussianMLPPolicy/KLAfter                               0.00358154
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             3.53847e-05
GaussianMLPPolicy/LossBefore                            9.0003e-09
GaussianMLPPolicy/dLoss                                -3.53757e-05
Iteration                                              17
MetaTest/Average/AverageDiscountedReturn              -48.118
MetaTest/Average/AverageReturn                        -48.118
MetaTest/Average/Iteration                             17
MetaTest/Average/MaxReturn                            -25.9397
MetaTest/Average/MinReturn                            -83.1821
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             14.3323
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -48.118
MetaTest/__unnamed_task__/AverageReturn               -48.118
MetaTest/__unnamed_task__/Iteration                    17
MetaTest/__unnamed_task__/MaxReturn                   -25.9397
MetaTest/__unnamed_task__/MinReturn                   -83.1821
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    14.3323
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      576000
__unnamed_task__/AverageDiscountedReturn              -21.4873
__unnamed_task__/AverageReturn                        -49.4591
__unnamed_task__/Iteration                             17
__unnamed_task__/MaxReturn                            -14.5515
__unnamed_task__/MinReturn                            -88.2621
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.7594
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:12:20 | [maml_trainer] epoch #18 | Sampling for adapation and meta-testing...
2025-04-02 16:13:44 | [maml_trainer] epoch #18 | Finished meta-testing...
2025-04-02 16:13:44 | [maml_trainer] epoch #18 | Saving snapshot...
2025-04-02 16:14:03 | [maml_trainer] epoch #18 | Saved
2025-04-02 16:14:03 | [maml_trainer] epoch #18 | Time 8465.84 s
2025-04-02 16:14:03 | [maml_trainer] epoch #18 | EpochTime 442.88 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -19.9892
Average/AverageReturn                                 -47.1975
Average/Iteration                                      18
Average/MaxReturn                                      -5.71725
Average/MinReturn                                     -84.6149
Average/NumEpisodes                                    80
Average/StdReturn                                      13.5506
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98288
GaussianMLPPolicy/KLAfter                               0.00741562
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             6.22289e-05
GaussianMLPPolicy/LossBefore                           -6.07967e-09
GaussianMLPPolicy/dLoss                                -6.2235e-05
Iteration                                              18
MetaTest/Average/AverageDiscountedReturn              -50.3331
MetaTest/Average/AverageReturn                        -50.3331
MetaTest/Average/Iteration                             18
MetaTest/Average/MaxReturn                            -33.7117
MetaTest/Average/MinReturn                            -66.9821
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             10.3601
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -50.3331
MetaTest/__unnamed_task__/AverageReturn               -50.3331
MetaTest/__unnamed_task__/Iteration                    18
MetaTest/__unnamed_task__/MaxReturn                   -33.7117
MetaTest/__unnamed_task__/MinReturn                   -66.9821
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    10.3601
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      608000
__unnamed_task__/AverageDiscountedReturn              -19.9892
__unnamed_task__/AverageReturn                        -47.1975
__unnamed_task__/Iteration                             18
__unnamed_task__/MaxReturn                             -5.71725
__unnamed_task__/MinReturn                            -84.6149
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.5506
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:19:39 | [maml_trainer] epoch #19 | Sampling for adapation and meta-testing...
2025-04-02 16:21:03 | [maml_trainer] epoch #19 | Finished meta-testing...
2025-04-02 16:21:03 | [maml_trainer] epoch #19 | Saving snapshot...
2025-04-02 16:21:24 | [maml_trainer] epoch #19 | Saved
2025-04-02 16:21:24 | [maml_trainer] epoch #19 | Time 8905.98 s
2025-04-02 16:21:24 | [maml_trainer] epoch #19 | EpochTime 440.14 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -21.1342
Average/AverageReturn                                 -51.7012
Average/Iteration                                      19
Average/MaxReturn                                     -23.2172
Average/MinReturn                                     -84.2754
Average/NumEpisodes                                    80
Average/StdReturn                                      13.8437
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98431
GaussianMLPPolicy/KLAfter                               0.00616102
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             9.59737e-05
GaussianMLPPolicy/LossBefore                           -2.80142e-09
GaussianMLPPolicy/dLoss                                -9.59765e-05
Iteration                                              19
MetaTest/Average/AverageDiscountedReturn              -49.6763
MetaTest/Average/AverageReturn                        -49.6763
MetaTest/Average/Iteration                             19
MetaTest/Average/MaxReturn                            -18.3285
MetaTest/Average/MinReturn                            -81.7329
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             13.6254
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -49.6763
MetaTest/__unnamed_task__/AverageReturn               -49.6763
MetaTest/__unnamed_task__/Iteration                    19
MetaTest/__unnamed_task__/MaxReturn                   -18.3285
MetaTest/__unnamed_task__/MinReturn                   -81.7329
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    13.6254
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      640000
__unnamed_task__/AverageDiscountedReturn              -21.1342
__unnamed_task__/AverageReturn                        -51.7012
__unnamed_task__/Iteration                             19
__unnamed_task__/MaxReturn                            -23.2172
__unnamed_task__/MinReturn                            -84.2754
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.8437
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:27:36 | [maml_trainer] epoch #20 | Sampling for adapation and meta-testing...
2025-04-02 16:29:39 | [maml_trainer] epoch #20 | Finished meta-testing...
2025-04-02 16:29:39 | [maml_trainer] epoch #20 | Saving snapshot...
2025-04-02 16:30:07 | [maml_trainer] epoch #20 | Saved
2025-04-02 16:30:07 | [maml_trainer] epoch #20 | Time 9429.36 s
2025-04-02 16:30:07 | [maml_trainer] epoch #20 | EpochTime 523.37 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -20.4741
Average/AverageReturn                                 -49.8087
Average/Iteration                                      20
Average/MaxReturn                                     -14.8797
Average/MinReturn                                     -79.3515
Average/NumEpisodes                                    80
Average/StdReturn                                      14.4902
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98573
GaussianMLPPolicy/KLAfter                               0.00586922
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -1.50178e-05
GaussianMLPPolicy/LossBefore                           -2.8491e-08
GaussianMLPPolicy/dLoss                                 1.49893e-05
Iteration                                              20
MetaTest/Average/AverageDiscountedReturn              -57.8758
MetaTest/Average/AverageReturn                        -57.8758
MetaTest/Average/Iteration                             20
MetaTest/Average/MaxReturn                            -31.6822
MetaTest/Average/MinReturn                            -98.2409
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             16.233
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -57.8758
MetaTest/__unnamed_task__/AverageReturn               -57.8758
MetaTest/__unnamed_task__/Iteration                    20
MetaTest/__unnamed_task__/MaxReturn                   -31.6822
MetaTest/__unnamed_task__/MinReturn                   -98.2409
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    16.233
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      672000
__unnamed_task__/AverageDiscountedReturn              -20.4741
__unnamed_task__/AverageReturn                        -49.8087
__unnamed_task__/Iteration                             20
__unnamed_task__/MaxReturn                            -14.8797
__unnamed_task__/MinReturn                            -79.3515
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             14.4902
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:36:54 | [maml_trainer] epoch #21 | Sampling for adapation and meta-testing...
2025-04-02 16:38:23 | [maml_trainer] epoch #21 | Finished meta-testing...
2025-04-02 16:38:23 | [maml_trainer] epoch #21 | Saving snapshot...
2025-04-02 16:38:44 | [maml_trainer] epoch #21 | Saved
2025-04-02 16:38:44 | [maml_trainer] epoch #21 | Time 9946.20 s
2025-04-02 16:38:44 | [maml_trainer] epoch #21 | EpochTime 516.84 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -21.8769
Average/AverageReturn                                 -54.6404
Average/Iteration                                      21
Average/MaxReturn                                     -25.3388
Average/MinReturn                                     -86.2781
Average/NumEpisodes                                    80
Average/StdReturn                                      15.1089
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98798
GaussianMLPPolicy/KLAfter                               0.00540618
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             0.000125856
GaussianMLPPolicy/LossBefore                            7.92742e-09
GaussianMLPPolicy/dLoss                                -0.000125848
Iteration                                              21
MetaTest/Average/AverageDiscountedReturn              -62.6328
MetaTest/Average/AverageReturn                        -62.6328
MetaTest/Average/Iteration                             21
MetaTest/Average/MaxReturn                            -33.118
MetaTest/Average/MinReturn                            -99.7727
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             18.9384
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -62.6328
MetaTest/__unnamed_task__/AverageReturn               -62.6328
MetaTest/__unnamed_task__/Iteration                    21
MetaTest/__unnamed_task__/MaxReturn                   -33.118
MetaTest/__unnamed_task__/MinReturn                   -99.7727
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    18.9384
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      704000
__unnamed_task__/AverageDiscountedReturn              -21.8769
__unnamed_task__/AverageReturn                        -54.6404
__unnamed_task__/Iteration                             21
__unnamed_task__/MaxReturn                            -25.3388
__unnamed_task__/MinReturn                            -86.2781
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             15.1089
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:44:42 | [maml_trainer] epoch #22 | Sampling for adapation and meta-testing...
2025-04-02 16:46:15 | [maml_trainer] epoch #22 | Finished meta-testing...
2025-04-02 16:46:15 | [maml_trainer] epoch #22 | Saving snapshot...
2025-04-02 16:46:36 | [maml_trainer] epoch #22 | Saved
2025-04-02 16:46:36 | [maml_trainer] epoch #22 | Time 10418.41 s
2025-04-02 16:46:36 | [maml_trainer] epoch #22 | EpochTime 472.20 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -21.0592
Average/AverageReturn                                 -53.3162
Average/Iteration                                      22
Average/MaxReturn                                     -16.2946
Average/MinReturn                                     -86.9996
Average/NumEpisodes                                    80
Average/StdReturn                                      17.0866
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98927
GaussianMLPPolicy/KLAfter                               0.0101861
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             2.00344e-05
GaussianMLPPolicy/LossBefore                           -9.47714e-09
GaussianMLPPolicy/dLoss                                -2.00439e-05
Iteration                                              22
MetaTest/Average/AverageDiscountedReturn              -52.3263
MetaTest/Average/AverageReturn                        -52.3263
MetaTest/Average/Iteration                             22
MetaTest/Average/MaxReturn                             -6.16666
MetaTest/Average/MinReturn                            -95.7249
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             19.8507
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -52.3263
MetaTest/__unnamed_task__/AverageReturn               -52.3263
MetaTest/__unnamed_task__/Iteration                    22
MetaTest/__unnamed_task__/MaxReturn                    -6.16666
MetaTest/__unnamed_task__/MinReturn                   -95.7249
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    19.8507
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      736000
__unnamed_task__/AverageDiscountedReturn              -21.0592
__unnamed_task__/AverageReturn                        -53.3162
__unnamed_task__/Iteration                             22
__unnamed_task__/MaxReturn                            -16.2946
__unnamed_task__/MinReturn                            -86.9996
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.0866
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 16:52:39 | [maml_trainer] epoch #23 | Sampling for adapation and meta-testing...
2025-04-02 16:54:10 | [maml_trainer] epoch #23 | Finished meta-testing...
2025-04-02 16:54:10 | [maml_trainer] epoch #23 | Saving snapshot...
2025-04-02 16:54:31 | [maml_trainer] epoch #23 | Saved
2025-04-02 16:54:31 | [maml_trainer] epoch #23 | Time 10893.22 s
2025-04-02 16:54:31 | [maml_trainer] epoch #23 | EpochTime 474.81 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -21.5016
Average/AverageReturn                                 -55.0622
Average/Iteration                                      23
Average/MaxReturn                                      -5.55675
Average/MinReturn                                     -95.1882
Average/NumEpisodes                                    80
Average/StdReturn                                      17.1435
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.98991
GaussianMLPPolicy/KLAfter                               0.00793389
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             0.000166197
GaussianMLPPolicy/LossBefore                            4.70877e-09
GaussianMLPPolicy/dLoss                                -0.000166192
Iteration                                              23
MetaTest/Average/AverageDiscountedReturn              -55.298
MetaTest/Average/AverageReturn                        -55.298
MetaTest/Average/Iteration                             23
MetaTest/Average/MaxReturn                            -27.2043
MetaTest/Average/MinReturn                            -94.044
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.9316
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -55.298
MetaTest/__unnamed_task__/AverageReturn               -55.298
MetaTest/__unnamed_task__/Iteration                    23
MetaTest/__unnamed_task__/MaxReturn                   -27.2043
MetaTest/__unnamed_task__/MinReturn                   -94.044
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.9316
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      768000
__unnamed_task__/AverageDiscountedReturn              -21.5016
__unnamed_task__/AverageReturn                        -55.0622
__unnamed_task__/Iteration                             23
__unnamed_task__/MaxReturn                             -5.55675
__unnamed_task__/MinReturn                            -95.1882
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             17.1435
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:00:34 | [maml_trainer] epoch #24 | Sampling for adapation and meta-testing...
2025-04-02 17:02:05 | [maml_trainer] epoch #24 | Finished meta-testing...
2025-04-02 17:02:05 | [maml_trainer] epoch #24 | Saving snapshot...
2025-04-02 17:02:25 | [maml_trainer] epoch #24 | Saved
2025-04-02 17:02:25 | [maml_trainer] epoch #24 | Time 11367.39 s
2025-04-02 17:02:25 | [maml_trainer] epoch #24 | EpochTime 474.17 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -21.9132
Average/AverageReturn                                 -56.6954
Average/Iteration                                      24
Average/MaxReturn                                       0.517216
Average/MinReturn                                     -94.4109
Average/NumEpisodes                                    80
Average/StdReturn                                      18.4242
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99128
GaussianMLPPolicy/KLAfter                               0.00964961
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.000113122
GaussianMLPPolicy/LossBefore                           -2.31266e-08
GaussianMLPPolicy/dLoss                                 0.000113098
Iteration                                              24
MetaTest/Average/AverageDiscountedReturn              -56.3885
MetaTest/Average/AverageReturn                        -56.3885
MetaTest/Average/Iteration                             24
MetaTest/Average/MaxReturn                            -31.4536
MetaTest/Average/MinReturn                            -91.8113
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.8316
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -56.3885
MetaTest/__unnamed_task__/AverageReturn               -56.3885
MetaTest/__unnamed_task__/Iteration                    24
MetaTest/__unnamed_task__/MaxReturn                   -31.4536
MetaTest/__unnamed_task__/MinReturn                   -91.8113
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.8316
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      800000
__unnamed_task__/AverageDiscountedReturn              -21.9132
__unnamed_task__/AverageReturn                        -56.6954
__unnamed_task__/Iteration                             24
__unnamed_task__/MaxReturn                              0.517216
__unnamed_task__/MinReturn                            -94.4109
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             18.4242
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:08:22 | [maml_trainer] epoch #25 | Sampling for adapation and meta-testing...
2025-04-02 17:09:46 | [maml_trainer] epoch #25 | Finished meta-testing...
2025-04-02 17:09:46 | [maml_trainer] epoch #25 | Saving snapshot...
2025-04-02 17:10:08 | [maml_trainer] epoch #25 | Saved
2025-04-02 17:10:08 | [maml_trainer] epoch #25 | Time 11830.16 s
2025-04-02 17:10:08 | [maml_trainer] epoch #25 | EpochTime 462.77 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -20.9843
Average/AverageReturn                                 -54.9349
Average/Iteration                                      25
Average/MaxReturn                                     -21.1848
Average/MinReturn                                     -95.1646
Average/NumEpisodes                                    80
Average/StdReturn                                      16.4727
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99405
GaussianMLPPolicy/KLAfter                               0.00842431
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -6.92002e-05
GaussianMLPPolicy/LossBefore                            7.95722e-09
GaussianMLPPolicy/dLoss                                 6.92082e-05
Iteration                                              25
MetaTest/Average/AverageDiscountedReturn              -45.4068
MetaTest/Average/AverageReturn                        -45.4068
MetaTest/Average/Iteration                             25
MetaTest/Average/MaxReturn                             20.5466
MetaTest/Average/MinReturn                            -71.3081
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             19.4979
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -45.4068
MetaTest/__unnamed_task__/AverageReturn               -45.4068
MetaTest/__unnamed_task__/Iteration                    25
MetaTest/__unnamed_task__/MaxReturn                    20.5466
MetaTest/__unnamed_task__/MinReturn                   -71.3081
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    19.4979
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      832000
__unnamed_task__/AverageDiscountedReturn              -20.9843
__unnamed_task__/AverageReturn                        -54.9349
__unnamed_task__/Iteration                             25
__unnamed_task__/MaxReturn                            -21.1848
__unnamed_task__/MinReturn                            -95.1646
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             16.4727
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:16:09 | [maml_trainer] epoch #26 | Sampling for adapation and meta-testing...
2025-04-02 17:17:39 | [maml_trainer] epoch #26 | Finished meta-testing...
2025-04-02 17:17:39 | [maml_trainer] epoch #26 | Saving snapshot...
2025-04-02 17:18:01 | [maml_trainer] epoch #26 | Saved
2025-04-02 17:18:01 | [maml_trainer] epoch #26 | Time 12303.55 s
2025-04-02 17:18:01 | [maml_trainer] epoch #26 | EpochTime 473.38 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -20.978
Average/AverageReturn                                 -53.6062
Average/Iteration                                      26
Average/MaxReturn                                      23.3987
Average/MinReturn                                     -97.5123
Average/NumEpisodes                                    80
Average/StdReturn                                      18.9487
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99562
GaussianMLPPolicy/KLAfter                               0.00611855
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -0.00022539
GaussianMLPPolicy/LossBefore                            2.66284e-08
GaussianMLPPolicy/dLoss                                 0.000225417
Iteration                                              26
MetaTest/Average/AverageDiscountedReturn              -40.4543
MetaTest/Average/AverageReturn                        -40.4543
MetaTest/Average/Iteration                             26
MetaTest/Average/MaxReturn                             -4.08434
MetaTest/Average/MinReturn                            -67.3082
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.5428
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -40.4543
MetaTest/__unnamed_task__/AverageReturn               -40.4543
MetaTest/__unnamed_task__/Iteration                    26
MetaTest/__unnamed_task__/MaxReturn                    -4.08434
MetaTest/__unnamed_task__/MinReturn                   -67.3082
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.5428
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      864000
__unnamed_task__/AverageDiscountedReturn              -20.978
__unnamed_task__/AverageReturn                        -53.6062
__unnamed_task__/Iteration                             26
__unnamed_task__/MaxReturn                             23.3987
__unnamed_task__/MinReturn                            -97.5123
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             18.9487
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:24:20 | [maml_trainer] epoch #27 | Sampling for adapation and meta-testing...
2025-04-02 17:25:52 | [maml_trainer] epoch #27 | Finished meta-testing...
2025-04-02 17:25:52 | [maml_trainer] epoch #27 | Saving snapshot...
2025-04-02 17:26:12 | [maml_trainer] epoch #27 | Saved
2025-04-02 17:26:12 | [maml_trainer] epoch #27 | Time 12794.57 s
2025-04-02 17:26:12 | [maml_trainer] epoch #27 | EpochTime 491.01 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -19.8947
Average/AverageReturn                                 -48.6148
Average/Iteration                                      27
Average/MaxReturn                                      -9.00478
Average/MinReturn                                     -81.0772
Average/NumEpisodes                                    80
Average/StdReturn                                      13.8745
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99663
GaussianMLPPolicy/KLAfter                               0.00612761
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -8.4546e-05
GaussianMLPPolicy/LossBefore                           -1.71959e-08
GaussianMLPPolicy/dLoss                                 8.45288e-05
Iteration                                              27
MetaTest/Average/AverageDiscountedReturn              -48.4645
MetaTest/Average/AverageReturn                        -48.4645
MetaTest/Average/Iteration                             27
MetaTest/Average/MaxReturn                              0.254689
MetaTest/Average/MinReturn                            -77.7094
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             17.7466
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -48.4645
MetaTest/__unnamed_task__/AverageReturn               -48.4645
MetaTest/__unnamed_task__/Iteration                    27
MetaTest/__unnamed_task__/MaxReturn                     0.254689
MetaTest/__unnamed_task__/MinReturn                   -77.7094
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    17.7466
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      896000
__unnamed_task__/AverageDiscountedReturn              -19.8947
__unnamed_task__/AverageReturn                        -48.6148
__unnamed_task__/Iteration                             27
__unnamed_task__/MaxReturn                             -9.00478
__unnamed_task__/MinReturn                            -81.0772
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             13.8745
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:32:16 | [maml_trainer] epoch #28 | Sampling for adapation and meta-testing...
2025-04-02 17:33:45 | [maml_trainer] epoch #28 | Finished meta-testing...
2025-04-02 17:33:45 | [maml_trainer] epoch #28 | Saving snapshot...
2025-04-02 17:34:05 | [maml_trainer] epoch #28 | Saved
2025-04-02 17:34:05 | [maml_trainer] epoch #28 | Time 13267.84 s
2025-04-02 17:34:05 | [maml_trainer] epoch #28 | EpochTime 473.27 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -19.6976
Average/AverageReturn                                 -46.637
Average/Iteration                                      28
Average/MaxReturn                                     -17.2486
Average/MinReturn                                     -90.0363
Average/NumEpisodes                                    80
Average/StdReturn                                      15.0707
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.9975
GaussianMLPPolicy/KLAfter                               0.00648991
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             1.62359e-05
GaussianMLPPolicy/LossBefore                           -8.88109e-09
GaussianMLPPolicy/dLoss                                -1.62448e-05
Iteration                                              28
MetaTest/Average/AverageDiscountedReturn              -45.3535
MetaTest/Average/AverageReturn                        -45.3535
MetaTest/Average/Iteration                             28
MetaTest/Average/MaxReturn                            -24.0665
MetaTest/Average/MinReturn                            -77.7647
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             15.8217
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -45.3535
MetaTest/__unnamed_task__/AverageReturn               -45.3535
MetaTest/__unnamed_task__/Iteration                    28
MetaTest/__unnamed_task__/MaxReturn                   -24.0665
MetaTest/__unnamed_task__/MinReturn                   -77.7647
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    15.8217
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      928000
__unnamed_task__/AverageDiscountedReturn              -19.6976
__unnamed_task__/AverageReturn                        -46.637
__unnamed_task__/Iteration                             28
__unnamed_task__/MaxReturn                            -17.2486
__unnamed_task__/MinReturn                            -90.0363
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             15.0707
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:40:02 | [maml_trainer] epoch #29 | Sampling for adapation and meta-testing...
2025-04-02 17:41:33 | [maml_trainer] epoch #29 | Finished meta-testing...
2025-04-02 17:41:33 | [maml_trainer] epoch #29 | Saving snapshot...
2025-04-02 17:41:55 | [maml_trainer] epoch #29 | Saved
2025-04-02 17:41:55 | [maml_trainer] epoch #29 | Time 13737.39 s
2025-04-02 17:41:55 | [maml_trainer] epoch #29 | EpochTime 469.55 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -18.4245
Average/AverageReturn                                 -42.3334
Average/Iteration                                      29
Average/MaxReturn                                       2.71932
Average/MinReturn                                     -81.4739
Average/NumEpisodes                                    80
Average/StdReturn                                      15.9254
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99869
GaussianMLPPolicy/KLAfter                               0.00747835
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                            -9.76563e-06
GaussianMLPPolicy/LossBefore                            8.49366e-09
GaussianMLPPolicy/dLoss                                 9.77412e-06
Iteration                                              29
MetaTest/Average/AverageDiscountedReturn              -38.0101
MetaTest/Average/AverageReturn                        -38.0101
MetaTest/Average/Iteration                             29
MetaTest/Average/MaxReturn                            -11.8788
MetaTest/Average/MinReturn                            -75.8875
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             13.5926
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -38.0101
MetaTest/__unnamed_task__/AverageReturn               -38.0101
MetaTest/__unnamed_task__/Iteration                    29
MetaTest/__unnamed_task__/MaxReturn                   -11.8788
MetaTest/__unnamed_task__/MinReturn                   -75.8875
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    13.5926
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      960000
__unnamed_task__/AverageDiscountedReturn              -18.4245
__unnamed_task__/AverageReturn                        -42.3334
__unnamed_task__/Iteration                             29
__unnamed_task__/MaxReturn                              2.71932
__unnamed_task__/MinReturn                            -81.4739
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             15.9254
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:48:00 | [maml_trainer] epoch #30 | Sampling for adapation and meta-testing...
2025-04-02 17:49:32 | [maml_trainer] epoch #30 | Finished meta-testing...
2025-04-02 17:49:32 | [maml_trainer] epoch #30 | Saving snapshot...
2025-04-02 17:49:53 | [maml_trainer] epoch #30 | Saved
2025-04-02 17:49:53 | [maml_trainer] epoch #30 | Time 14215.47 s
2025-04-02 17:49:53 | [maml_trainer] epoch #30 | EpochTime 478.07 s
-------------------------------------------------  ----------------
Average/AverageDiscountedReturn                       -18.1606
Average/AverageReturn                                 -41.1763
Average/Iteration                                      30
Average/MaxReturn                                      -9.82888
Average/MinReturn                                     -79.2711
Average/NumEpisodes                                    80
Average/StdReturn                                      12.3334
Average/TerminationRate                                 0
GaussianMLPPolicy/Entropy                               9.99939
GaussianMLPPolicy/KLAfter                               0.00445089
GaussianMLPPolicy/KLBefore                              0
GaussianMLPPolicy/LossAfter                             8.46949e-05
GaussianMLPPolicy/LossBefore                           -1.5825e-08
GaussianMLPPolicy/dLoss                                -8.47107e-05
Iteration                                              30
MetaTest/Average/AverageDiscountedReturn              -41.674
MetaTest/Average/AverageReturn                        -41.674
MetaTest/Average/Iteration                             30
MetaTest/Average/MaxReturn                            -23.776
MetaTest/Average/MinReturn                            -72.3616
MetaTest/Average/NumEpisodes                           20
MetaTest/Average/StdReturn                             12.7033
MetaTest/Average/TerminationRate                        0
MetaTest/__unnamed_task__/AverageDiscountedReturn     -41.674
MetaTest/__unnamed_task__/AverageReturn               -41.674
MetaTest/__unnamed_task__/Iteration                    30
MetaTest/__unnamed_task__/MaxReturn                   -23.776
MetaTest/__unnamed_task__/MinReturn                   -72.3616
MetaTest/__unnamed_task__/NumEpisodes                  20
MetaTest/__unnamed_task__/StdReturn                    12.7033
MetaTest/__unnamed_task__/TerminationRate               0
TotalEnvSteps                                      992000
__unnamed_task__/AverageDiscountedReturn              -18.1606
__unnamed_task__/AverageReturn                        -41.1763
__unnamed_task__/Iteration                             30
__unnamed_task__/MaxReturn                             -9.82888
__unnamed_task__/MinReturn                            -79.2711
__unnamed_task__/NumEpisodes                           80
__unnamed_task__/StdReturn                             12.3334
__unnamed_task__/TerminationRate                        0
-------------------------------------------------  ----------------
2025-04-02 17:55:58 | [maml_trainer] epoch #31 | Sampling for adapation and meta-testing...
2025-04-02 17:57:29 | [maml_trainer] epoch #31 | Finished meta-testing...
2025-04-02 17:57:29 | [maml_trainer] epoch #31 | Saving snapshot...
2025-04-02 17:57:51 | [maml_trainer] epoch #31 | Saved
2025-04-02 17:57:51 | [maml_trainer] epoch #31 | Time 14693.45 s
2025-04-02 17:57:51 | [maml_trainer] epoch #31 | EpochTime 477.98 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.8073
Average/AverageReturn                              -42.7406
Average/Iteration                                   31
Average/MaxReturn                                  -13.6966
Average/MinReturn                                  -77.8376
Average/NumEpisodes                                 80
Average/StdReturn                                   14.3799
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0011
GaussianMLPPolicy/KLAfter                            0.00411553
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.71134e-05
GaussianMLPPolicy/LossBefore                        -2.23517e-09
GaussianMLPPolicy/dLoss                             -1.71157e-05
Iteration                                           31
MetaTest/Average/AverageDiscountedReturn           -42.2444
MetaTest/Average/AverageReturn                     -42.2444
MetaTest/Average/Iteration                          31
MetaTest/Average/MaxReturn                          -7.00079
MetaTest/Average/MinReturn                         -92.4289
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          18.2952
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.2444
MetaTest/__unnamed_task__/AverageReturn            -42.2444
MetaTest/__unnamed_task__/Iteration                 31
MetaTest/__unnamed_task__/MaxReturn                 -7.00079
MetaTest/__unnamed_task__/MinReturn                -92.4289
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 18.2952
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.024e+06
__unnamed_task__/AverageDiscountedReturn           -18.8073
__unnamed_task__/AverageReturn                     -42.7406
__unnamed_task__/Iteration                          31
__unnamed_task__/MaxReturn                         -13.6966
__unnamed_task__/MinReturn                         -77.8376
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.3799
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:03:59 | [maml_trainer] epoch #32 | Sampling for adapation and meta-testing...
2025-04-02 18:05:32 | [maml_trainer] epoch #32 | Finished meta-testing...
2025-04-02 18:05:32 | [maml_trainer] epoch #32 | Saving snapshot...
2025-04-02 18:05:53 | [maml_trainer] epoch #32 | Saved
2025-04-02 18:05:53 | [maml_trainer] epoch #32 | Time 15175.64 s
2025-04-02 18:05:53 | [maml_trainer] epoch #32 | EpochTime 482.19 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.8578
Average/AverageReturn                              -43.0394
Average/Iteration                                   32
Average/MaxReturn                                  -17.8346
Average/MinReturn                                  -82.1993
Average/NumEpisodes                                 80
Average/StdReturn                                   12.6271
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0007
GaussianMLPPolicy/KLAfter                            0.00582217
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.38794e-06
GaussianMLPPolicy/LossBefore                         2.11596e-09
GaussianMLPPolicy/dLoss                             -7.38582e-06
Iteration                                           32
MetaTest/Average/AverageDiscountedReturn           -38.9374
MetaTest/Average/AverageReturn                     -38.9374
MetaTest/Average/Iteration                          32
MetaTest/Average/MaxReturn                         -18.7136
MetaTest/Average/MinReturn                         -52.348
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.4078
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.9374
MetaTest/__unnamed_task__/AverageReturn            -38.9374
MetaTest/__unnamed_task__/Iteration                 32
MetaTest/__unnamed_task__/MaxReturn                -18.7136
MetaTest/__unnamed_task__/MinReturn                -52.348
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.4078
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.056e+06
__unnamed_task__/AverageDiscountedReturn           -18.8578
__unnamed_task__/AverageReturn                     -43.0394
__unnamed_task__/Iteration                          32
__unnamed_task__/MaxReturn                         -17.8346
__unnamed_task__/MinReturn                         -82.1993
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.6271
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:11:59 | [maml_trainer] epoch #33 | Sampling for adapation and meta-testing...
2025-04-02 18:13:31 | [maml_trainer] epoch #33 | Finished meta-testing...
2025-04-02 18:13:31 | [maml_trainer] epoch #33 | Saving snapshot...
2025-04-02 18:13:51 | [maml_trainer] epoch #33 | Saved
2025-04-02 18:13:51 | [maml_trainer] epoch #33 | Time 15653.70 s
2025-04-02 18:13:51 | [maml_trainer] epoch #33 | EpochTime 478.05 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.8317
Average/AverageReturn                              -41.9216
Average/Iteration                                   33
Average/MaxReturn                                   -7.29547
Average/MinReturn                                  -68.2222
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4731
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0013
GaussianMLPPolicy/KLAfter                            0.00816652
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000205678
GaussianMLPPolicy/LossBefore                         1.81794e-09
GaussianMLPPolicy/dLoss                              0.00020568
Iteration                                           33
MetaTest/Average/AverageDiscountedReturn           -42.8248
MetaTest/Average/AverageReturn                     -42.8248
MetaTest/Average/Iteration                          33
MetaTest/Average/MaxReturn                         -21.289
MetaTest/Average/MinReturn                         -65.3199
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.8921
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.8248
MetaTest/__unnamed_task__/AverageReturn            -42.8248
MetaTest/__unnamed_task__/Iteration                 33
MetaTest/__unnamed_task__/MaxReturn                -21.289
MetaTest/__unnamed_task__/MinReturn                -65.3199
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.8921
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.088e+06
__unnamed_task__/AverageDiscountedReturn           -18.8317
__unnamed_task__/AverageReturn                     -41.9216
__unnamed_task__/Iteration                          33
__unnamed_task__/MaxReturn                          -7.29547
__unnamed_task__/MinReturn                         -68.2222
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4731
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:19:55 | [maml_trainer] epoch #34 | Sampling for adapation and meta-testing...
2025-04-02 18:21:27 | [maml_trainer] epoch #34 | Finished meta-testing...
2025-04-02 18:21:27 | [maml_trainer] epoch #34 | Saving snapshot...
2025-04-02 18:21:49 | [maml_trainer] epoch #34 | Saved
2025-04-02 18:21:49 | [maml_trainer] epoch #34 | Time 16131.30 s
2025-04-02 18:21:49 | [maml_trainer] epoch #34 | EpochTime 477.59 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.2514
Average/AverageReturn                              -43.2864
Average/Iteration                                   34
Average/MaxReturn                                  -16.2884
Average/MinReturn                                  -91.3163
Average/NumEpisodes                                 80
Average/StdReturn                                   14.4985
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0013
GaussianMLPPolicy/KLAfter                            0.00578484
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.58118e-05
GaussianMLPPolicy/LossBefore                        -1.45137e-08
GaussianMLPPolicy/dLoss                             -8.58263e-05
Iteration                                           34
MetaTest/Average/AverageDiscountedReturn           -33.9359
MetaTest/Average/AverageReturn                     -33.9359
MetaTest/Average/Iteration                          34
MetaTest/Average/MaxReturn                          -5.12424
MetaTest/Average/MinReturn                         -65.3005
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.0781
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.9359
MetaTest/__unnamed_task__/AverageReturn            -33.9359
MetaTest/__unnamed_task__/Iteration                 34
MetaTest/__unnamed_task__/MaxReturn                 -5.12424
MetaTest/__unnamed_task__/MinReturn                -65.3005
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.0781
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.12e+06
__unnamed_task__/AverageDiscountedReturn           -19.2514
__unnamed_task__/AverageReturn                     -43.2864
__unnamed_task__/Iteration                          34
__unnamed_task__/MaxReturn                         -16.2884
__unnamed_task__/MinReturn                         -91.3163
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.4985
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:27:49 | [maml_trainer] epoch #35 | Sampling for adapation and meta-testing...
2025-04-02 18:29:19 | [maml_trainer] epoch #35 | Finished meta-testing...
2025-04-02 18:29:19 | [maml_trainer] epoch #35 | Saving snapshot...
2025-04-02 18:29:41 | [maml_trainer] epoch #35 | Saved
2025-04-02 18:29:41 | [maml_trainer] epoch #35 | Time 16603.30 s
2025-04-02 18:29:41 | [maml_trainer] epoch #35 | EpochTime 472.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.3884
Average/AverageReturn                              -44.8496
Average/Iteration                                   35
Average/MaxReturn                                   14.2588
Average/MinReturn                                  -81.3204
Average/NumEpisodes                                 80
Average/StdReturn                                   15.4006
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0015
GaussianMLPPolicy/KLAfter                            0.00522996
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.33016e-05
GaussianMLPPolicy/LossBefore                         1.19805e-08
GaussianMLPPolicy/dLoss                             -5.32896e-05
Iteration                                           35
MetaTest/Average/AverageDiscountedReturn           -43.4544
MetaTest/Average/AverageReturn                     -43.4544
MetaTest/Average/Iteration                          35
MetaTest/Average/MaxReturn                         -12.1476
MetaTest/Average/MinReturn                         -79.8924
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          16.1353
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.4544
MetaTest/__unnamed_task__/AverageReturn            -43.4544
MetaTest/__unnamed_task__/Iteration                 35
MetaTest/__unnamed_task__/MaxReturn                -12.1476
MetaTest/__unnamed_task__/MinReturn                -79.8924
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 16.1353
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.152e+06
__unnamed_task__/AverageDiscountedReturn           -19.3884
__unnamed_task__/AverageReturn                     -44.8496
__unnamed_task__/Iteration                          35
__unnamed_task__/MaxReturn                          14.2588
__unnamed_task__/MinReturn                         -81.3204
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.4006
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:35:49 | [maml_trainer] epoch #36 | Sampling for adapation and meta-testing...
2025-04-02 18:37:20 | [maml_trainer] epoch #36 | Finished meta-testing...
2025-04-02 18:37:20 | [maml_trainer] epoch #36 | Saving snapshot...
2025-04-02 18:37:40 | [maml_trainer] epoch #36 | Saved
2025-04-02 18:37:40 | [maml_trainer] epoch #36 | Time 17082.37 s
2025-04-02 18:37:40 | [maml_trainer] epoch #36 | EpochTime 479.06 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.5525
Average/AverageReturn                              -44.8012
Average/Iteration                                   36
Average/MaxReturn                                    6.09308
Average/MinReturn                                  -81.137
Average/NumEpisodes                                 80
Average/StdReturn                                   16.6554
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0018
GaussianMLPPolicy/KLAfter                            0.00241309
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000133774
GaussianMLPPolicy/LossBefore                         2.98024e-11
GaussianMLPPolicy/dLoss                              0.000133774
Iteration                                           36
MetaTest/Average/AverageDiscountedReturn           -43.6124
MetaTest/Average/AverageReturn                     -43.6124
MetaTest/Average/Iteration                          36
MetaTest/Average/MaxReturn                         -16.9561
MetaTest/Average/MinReturn                         -85.1516
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          16.2254
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.6124
MetaTest/__unnamed_task__/AverageReturn            -43.6124
MetaTest/__unnamed_task__/Iteration                 36
MetaTest/__unnamed_task__/MaxReturn                -16.9561
MetaTest/__unnamed_task__/MinReturn                -85.1516
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 16.2254
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.184e+06
__unnamed_task__/AverageDiscountedReturn           -19.5525
__unnamed_task__/AverageReturn                     -44.8012
__unnamed_task__/Iteration                          36
__unnamed_task__/MaxReturn                           6.09308
__unnamed_task__/MinReturn                         -81.137
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          16.6554
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:43:42 | [maml_trainer] epoch #37 | Sampling for adapation and meta-testing...
2025-04-02 18:45:13 | [maml_trainer] epoch #37 | Finished meta-testing...
2025-04-02 18:45:13 | [maml_trainer] epoch #37 | Saving snapshot...
2025-04-02 18:45:35 | [maml_trainer] epoch #37 | Saved
2025-04-02 18:45:35 | [maml_trainer] epoch #37 | Time 17557.14 s
2025-04-02 18:45:35 | [maml_trainer] epoch #37 | EpochTime 474.78 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.5405
Average/AverageReturn                              -45.3016
Average/Iteration                                   37
Average/MaxReturn                                  -15.4621
Average/MinReturn                                  -87.0647
Average/NumEpisodes                                 80
Average/StdReturn                                   15.4132
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0018
GaussianMLPPolicy/KLAfter                            0.00192757
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.6965e-05
GaussianMLPPolicy/LossBefore                         7.12276e-09
GaussianMLPPolicy/dLoss                             -1.69579e-05
Iteration                                           37
MetaTest/Average/AverageDiscountedReturn           -44.646
MetaTest/Average/AverageReturn                     -44.646
MetaTest/Average/Iteration                          37
MetaTest/Average/MaxReturn                         -13.4186
MetaTest/Average/MinReturn                         -70.8636
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.6465
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -44.646
MetaTest/__unnamed_task__/AverageReturn            -44.646
MetaTest/__unnamed_task__/Iteration                 37
MetaTest/__unnamed_task__/MaxReturn                -13.4186
MetaTest/__unnamed_task__/MinReturn                -70.8636
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.6465
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.216e+06
__unnamed_task__/AverageDiscountedReturn           -19.5405
__unnamed_task__/AverageReturn                     -45.3016
__unnamed_task__/Iteration                          37
__unnamed_task__/MaxReturn                         -15.4621
__unnamed_task__/MinReturn                         -87.0647
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.4132
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:51:41 | [maml_trainer] epoch #38 | Sampling for adapation and meta-testing...
2025-04-02 18:53:10 | [maml_trainer] epoch #38 | Finished meta-testing...
2025-04-02 18:53:10 | [maml_trainer] epoch #38 | Saving snapshot...
2025-04-02 18:53:30 | [maml_trainer] epoch #38 | Saved
2025-04-02 18:53:30 | [maml_trainer] epoch #38 | Time 18032.43 s
2025-04-02 18:53:30 | [maml_trainer] epoch #38 | EpochTime 475.29 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.6339
Average/AverageReturn                              -46.6624
Average/Iteration                                   38
Average/MaxReturn                                  -20.1083
Average/MinReturn                                  -84.4959
Average/NumEpisodes                                 80
Average/StdReturn                                   14.2857
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.002
GaussianMLPPolicy/KLAfter                            0.00203737
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.42455e-06
GaussianMLPPolicy/LossBefore                         1.68085e-08
GaussianMLPPolicy/dLoss                              6.44135e-06
Iteration                                           38
MetaTest/Average/AverageDiscountedReturn           -43.4401
MetaTest/Average/AverageReturn                     -43.4401
MetaTest/Average/Iteration                          38
MetaTest/Average/MaxReturn                         -12.1508
MetaTest/Average/MinReturn                         -76.3952
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.8531
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.4401
MetaTest/__unnamed_task__/AverageReturn            -43.4401
MetaTest/__unnamed_task__/Iteration                 38
MetaTest/__unnamed_task__/MaxReturn                -12.1508
MetaTest/__unnamed_task__/MinReturn                -76.3952
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.8531
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.248e+06
__unnamed_task__/AverageDiscountedReturn           -19.6339
__unnamed_task__/AverageReturn                     -46.6624
__unnamed_task__/Iteration                          38
__unnamed_task__/MaxReturn                         -20.1083
__unnamed_task__/MinReturn                         -84.4959
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.2857
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 18:59:34 | [maml_trainer] epoch #39 | Sampling for adapation and meta-testing...
2025-04-02 19:01:06 | [maml_trainer] epoch #39 | Finished meta-testing...
2025-04-02 19:01:06 | [maml_trainer] epoch #39 | Saving snapshot...
2025-04-02 19:01:28 | [maml_trainer] epoch #39 | Saved
2025-04-02 19:01:28 | [maml_trainer] epoch #39 | Time 18510.49 s
2025-04-02 19:01:28 | [maml_trainer] epoch #39 | EpochTime 478.06 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.7644
Average/AverageReturn                              -45.7446
Average/Iteration                                   39
Average/MaxReturn                                   -1.00908
Average/MinReturn                                  -89.8427
Average/NumEpisodes                                 80
Average/StdReturn                                   14.6905
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0024
GaussianMLPPolicy/KLAfter                            0.00145559
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000161865
GaussianMLPPolicy/LossBefore                        -4.85778e-09
GaussianMLPPolicy/dLoss                             -0.00016187
Iteration                                           39
MetaTest/Average/AverageDiscountedReturn           -39.8745
MetaTest/Average/AverageReturn                     -39.8745
MetaTest/Average/Iteration                          39
MetaTest/Average/MaxReturn                         -25.6001
MetaTest/Average/MinReturn                         -62.8462
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.81777
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.8745
MetaTest/__unnamed_task__/AverageReturn            -39.8745
MetaTest/__unnamed_task__/Iteration                 39
MetaTest/__unnamed_task__/MaxReturn                -25.6001
MetaTest/__unnamed_task__/MinReturn                -62.8462
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.81777
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.28e+06
__unnamed_task__/AverageDiscountedReturn           -19.7644
__unnamed_task__/AverageReturn                     -45.7446
__unnamed_task__/Iteration                          39
__unnamed_task__/MaxReturn                          -1.00908
__unnamed_task__/MinReturn                         -89.8427
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.6905
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:07:33 | [maml_trainer] epoch #40 | Sampling for adapation and meta-testing...
2025-04-02 19:09:01 | [maml_trainer] epoch #40 | Finished meta-testing...
2025-04-02 19:09:01 | [maml_trainer] epoch #40 | Saving snapshot...
2025-04-02 19:09:22 | [maml_trainer] epoch #40 | Saved
2025-04-02 19:09:22 | [maml_trainer] epoch #40 | Time 18984.10 s
2025-04-02 19:09:22 | [maml_trainer] epoch #40 | EpochTime 473.60 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.5941
Average/AverageReturn                              -45.6751
Average/Iteration                                   40
Average/MaxReturn                                  -12.3956
Average/MinReturn                                  -83.2399
Average/NumEpisodes                                 80
Average/StdReturn                                   15.9778
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0032
GaussianMLPPolicy/KLAfter                            0.0016975
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.07845e-05
GaussianMLPPolicy/LossBefore                         2.21431e-08
GaussianMLPPolicy/dLoss                             -1.07624e-05
Iteration                                           40
MetaTest/Average/AverageDiscountedReturn           -41.2322
MetaTest/Average/AverageReturn                     -41.2322
MetaTest/Average/Iteration                          40
MetaTest/Average/MaxReturn                         -17.7566
MetaTest/Average/MinReturn                         -63.391
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.1376
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.2322
MetaTest/__unnamed_task__/AverageReturn            -41.2322
MetaTest/__unnamed_task__/Iteration                 40
MetaTest/__unnamed_task__/MaxReturn                -17.7566
MetaTest/__unnamed_task__/MinReturn                -63.391
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.1376
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.312e+06
__unnamed_task__/AverageDiscountedReturn           -19.5941
__unnamed_task__/AverageReturn                     -45.6751
__unnamed_task__/Iteration                          40
__unnamed_task__/MaxReturn                         -12.3956
__unnamed_task__/MinReturn                         -83.2399
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.9778
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:15:08 | [maml_trainer] epoch #41 | Sampling for adapation and meta-testing...
2025-04-02 19:16:35 | [maml_trainer] epoch #41 | Finished meta-testing...
2025-04-02 19:16:35 | [maml_trainer] epoch #41 | Saving snapshot...
2025-04-02 19:16:55 | [maml_trainer] epoch #41 | Saved
2025-04-02 19:16:55 | [maml_trainer] epoch #41 | Time 19437.19 s
2025-04-02 19:16:55 | [maml_trainer] epoch #41 | EpochTime 453.09 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -20.8102
Average/AverageReturn                              -48.8397
Average/Iteration                                   41
Average/MaxReturn                                    1.58137
Average/MinReturn                                  -87.9838
Average/NumEpisodes                                 80
Average/StdReturn                                   17.1146
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.005
GaussianMLPPolicy/KLAfter                            0.00221944
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.13773e-05
GaussianMLPPolicy/LossBefore                        -7.00355e-09
GaussianMLPPolicy/dLoss                             -8.13843e-05
Iteration                                           41
MetaTest/Average/AverageDiscountedReturn           -48.6111
MetaTest/Average/AverageReturn                     -48.6111
MetaTest/Average/Iteration                          41
MetaTest/Average/MaxReturn                         -33.5807
MetaTest/Average/MinReturn                         -68.3198
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.381
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -48.6111
MetaTest/__unnamed_task__/AverageReturn            -48.6111
MetaTest/__unnamed_task__/Iteration                 41
MetaTest/__unnamed_task__/MaxReturn                -33.5807
MetaTest/__unnamed_task__/MinReturn                -68.3198
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.381
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.344e+06
__unnamed_task__/AverageDiscountedReturn           -20.8102
__unnamed_task__/AverageReturn                     -48.8397
__unnamed_task__/Iteration                          41
__unnamed_task__/MaxReturn                           1.58137
__unnamed_task__/MinReturn                         -87.9838
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          17.1146
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:22:57 | [maml_trainer] epoch #42 | Sampling for adapation and meta-testing...
2025-04-02 19:24:29 | [maml_trainer] epoch #42 | Finished meta-testing...
2025-04-02 19:24:29 | [maml_trainer] epoch #42 | Saving snapshot...
2025-04-02 19:24:51 | [maml_trainer] epoch #42 | Saved
2025-04-02 19:24:51 | [maml_trainer] epoch #42 | Time 19913.96 s
2025-04-02 19:24:51 | [maml_trainer] epoch #42 | EpochTime 476.76 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.0073
Average/AverageReturn                              -44.8036
Average/Iteration                                   42
Average/MaxReturn                                  111.789
Average/MinReturn                                  -83.5409
Average/NumEpisodes                                 80
Average/StdReturn                                   23.8489
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0074
GaussianMLPPolicy/KLAfter                            0.00225797
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.49142e-06
GaussianMLPPolicy/LossBefore                         1.37091e-09
GaussianMLPPolicy/dLoss                              8.4928e-06
Iteration                                           42
MetaTest/Average/AverageDiscountedReturn           -43.9458
MetaTest/Average/AverageReturn                     -43.9458
MetaTest/Average/Iteration                          42
MetaTest/Average/MaxReturn                           0.446834
MetaTest/Average/MinReturn                         -68.8958
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.538
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.9458
MetaTest/__unnamed_task__/AverageReturn            -43.9458
MetaTest/__unnamed_task__/Iteration                 42
MetaTest/__unnamed_task__/MaxReturn                  0.446834
MetaTest/__unnamed_task__/MinReturn                -68.8958
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.538
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.376e+06
__unnamed_task__/AverageDiscountedReturn           -19.0073
__unnamed_task__/AverageReturn                     -44.8036
__unnamed_task__/Iteration                          42
__unnamed_task__/MaxReturn                         111.789
__unnamed_task__/MinReturn                         -83.5409
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          23.8489
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:30:57 | [maml_trainer] epoch #43 | Sampling for adapation and meta-testing...
2025-04-02 19:32:29 | [maml_trainer] epoch #43 | Finished meta-testing...
2025-04-02 19:32:29 | [maml_trainer] epoch #43 | Saving snapshot...
2025-04-02 19:32:51 | [maml_trainer] epoch #43 | Saved
2025-04-02 19:32:51 | [maml_trainer] epoch #43 | Time 20393.43 s
2025-04-02 19:32:51 | [maml_trainer] epoch #43 | EpochTime 479.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -20.4428
Average/AverageReturn                              -49.0745
Average/Iteration                                   43
Average/MaxReturn                                   -4.70335
Average/MinReturn                                  -98.5063
Average/NumEpisodes                                 80
Average/StdReturn                                   17.2571
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0091
GaussianMLPPolicy/KLAfter                            0.00280714
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000109138
GaussianMLPPolicy/LossBefore                        -2.86102e-09
GaussianMLPPolicy/dLoss                              0.000109135
Iteration                                           43
MetaTest/Average/AverageDiscountedReturn           -34.2625
MetaTest/Average/AverageReturn                     -34.2625
MetaTest/Average/Iteration                          43
MetaTest/Average/MaxReturn                          47.2825
MetaTest/Average/MinReturn                         -76.5779
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          25.9503
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.2625
MetaTest/__unnamed_task__/AverageReturn            -34.2625
MetaTest/__unnamed_task__/Iteration                 43
MetaTest/__unnamed_task__/MaxReturn                 47.2825
MetaTest/__unnamed_task__/MinReturn                -76.5779
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 25.9503
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.408e+06
__unnamed_task__/AverageDiscountedReturn           -20.4428
__unnamed_task__/AverageReturn                     -49.0745
__unnamed_task__/Iteration                          43
__unnamed_task__/MaxReturn                          -4.70335
__unnamed_task__/MinReturn                         -98.5063
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          17.2571
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:38:57 | [maml_trainer] epoch #44 | Sampling for adapation and meta-testing...
2025-04-02 19:40:29 | [maml_trainer] epoch #44 | Finished meta-testing...
2025-04-02 19:40:29 | [maml_trainer] epoch #44 | Saving snapshot...
2025-04-02 19:40:50 | [maml_trainer] epoch #44 | Saved
2025-04-02 19:40:50 | [maml_trainer] epoch #44 | Time 20872.48 s
2025-04-02 19:40:50 | [maml_trainer] epoch #44 | EpochTime 479.04 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.1898
Average/AverageReturn                              -44.2029
Average/Iteration                                   44
Average/MaxReturn                                   -3.42646
Average/MinReturn                                  -75.6662
Average/NumEpisodes                                 80
Average/StdReturn                                   14.6949
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0084
GaussianMLPPolicy/KLAfter                            0.00214961
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.85343e-05
GaussianMLPPolicy/LossBefore                        -2.39611e-08
GaussianMLPPolicy/dLoss                             -6.85583e-05
Iteration                                           44
MetaTest/Average/AverageDiscountedReturn           -38.3354
MetaTest/Average/AverageReturn                     -38.3354
MetaTest/Average/Iteration                          44
MetaTest/Average/MaxReturn                          16.3489
MetaTest/Average/MinReturn                         -76.3305
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          17.5691
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.3354
MetaTest/__unnamed_task__/AverageReturn            -38.3354
MetaTest/__unnamed_task__/Iteration                 44
MetaTest/__unnamed_task__/MaxReturn                 16.3489
MetaTest/__unnamed_task__/MinReturn                -76.3305
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 17.5691
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.44e+06
__unnamed_task__/AverageDiscountedReturn           -19.1898
__unnamed_task__/AverageReturn                     -44.2029
__unnamed_task__/Iteration                          44
__unnamed_task__/MaxReturn                          -3.42646
__unnamed_task__/MinReturn                         -75.6662
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.6949
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:46:45 | [maml_trainer] epoch #45 | Sampling for adapation and meta-testing...
2025-04-02 19:48:16 | [maml_trainer] epoch #45 | Finished meta-testing...
2025-04-02 19:48:16 | [maml_trainer] epoch #45 | Saving snapshot...
2025-04-02 19:48:39 | [maml_trainer] epoch #45 | Saved
2025-04-02 19:48:39 | [maml_trainer] epoch #45 | Time 21341.00 s
2025-04-02 19:48:39 | [maml_trainer] epoch #45 | EpochTime 468.52 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.5305
Average/AverageReturn                              -44.0774
Average/Iteration                                   45
Average/MaxReturn                                   -2.64878
Average/MinReturn                                  -81.6317
Average/NumEpisodes                                 80
Average/StdReturn                                   14.2659
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0086
GaussianMLPPolicy/KLAfter                            0.00416845
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.00475e-05
GaussianMLPPolicy/LossBefore                         6.94394e-09
GaussianMLPPolicy/dLoss                             -7.00405e-05
Iteration                                           45
MetaTest/Average/AverageDiscountedReturn           -42.3016
MetaTest/Average/AverageReturn                     -42.3016
MetaTest/Average/Iteration                          45
MetaTest/Average/MaxReturn                         -10.5363
MetaTest/Average/MinReturn                         -71.3769
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          16.151
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.3016
MetaTest/__unnamed_task__/AverageReturn            -42.3016
MetaTest/__unnamed_task__/Iteration                 45
MetaTest/__unnamed_task__/MaxReturn                -10.5363
MetaTest/__unnamed_task__/MinReturn                -71.3769
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 16.151
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.472e+06
__unnamed_task__/AverageDiscountedReturn           -18.5305
__unnamed_task__/AverageReturn                     -44.0774
__unnamed_task__/Iteration                          45
__unnamed_task__/MaxReturn                          -2.64878
__unnamed_task__/MinReturn                         -81.6317
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.2659
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 19:54:48 | [maml_trainer] epoch #46 | Sampling for adapation and meta-testing...
2025-04-02 19:56:20 | [maml_trainer] epoch #46 | Finished meta-testing...
2025-04-02 19:56:20 | [maml_trainer] epoch #46 | Saving snapshot...
2025-04-02 19:56:42 | [maml_trainer] epoch #46 | Saved
2025-04-02 19:56:42 | [maml_trainer] epoch #46 | Time 21824.11 s
2025-04-02 19:56:42 | [maml_trainer] epoch #46 | EpochTime 483.11 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.4227
Average/AverageReturn                              -42.8413
Average/Iteration                                   46
Average/MaxReturn                                   -8.2572
Average/MinReturn                                  -99.3025
Average/NumEpisodes                                 80
Average/StdReturn                                   15.1644
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0078
GaussianMLPPolicy/KLAfter                            0.00525632
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.53786e-05
GaussianMLPPolicy/LossBefore                         3.12924e-09
GaussianMLPPolicy/dLoss                              8.53817e-05
Iteration                                           46
MetaTest/Average/AverageDiscountedReturn           -44.0515
MetaTest/Average/AverageReturn                     -44.0515
MetaTest/Average/Iteration                          46
MetaTest/Average/MaxReturn                         -22.5637
MetaTest/Average/MinReturn                         -61.7641
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.7156
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -44.0515
MetaTest/__unnamed_task__/AverageReturn            -44.0515
MetaTest/__unnamed_task__/Iteration                 46
MetaTest/__unnamed_task__/MaxReturn                -22.5637
MetaTest/__unnamed_task__/MinReturn                -61.7641
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.7156
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.504e+06
__unnamed_task__/AverageDiscountedReturn           -18.4227
__unnamed_task__/AverageReturn                     -42.8413
__unnamed_task__/Iteration                          46
__unnamed_task__/MaxReturn                          -8.2572
__unnamed_task__/MinReturn                         -99.3025
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.1644
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:02:50 | [maml_trainer] epoch #47 | Sampling for adapation and meta-testing...
2025-04-02 20:04:22 | [maml_trainer] epoch #47 | Finished meta-testing...
2025-04-02 20:04:22 | [maml_trainer] epoch #47 | Saving snapshot...
2025-04-02 20:04:43 | [maml_trainer] epoch #47 | Saved
2025-04-02 20:04:43 | [maml_trainer] epoch #47 | Time 22305.13 s
2025-04-02 20:04:43 | [maml_trainer] epoch #47 | EpochTime 481.01 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.0385
Average/AverageReturn                              -41.7071
Average/Iteration                                   47
Average/MaxReturn                                   91.4526
Average/MinReturn                                  -82.7276
Average/NumEpisodes                                 80
Average/StdReturn                                   21.1976
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0077
GaussianMLPPolicy/KLAfter                            0.00603047
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.48917e-05
GaussianMLPPolicy/LossBefore                         3.44217e-09
GaussianMLPPolicy/dLoss                             -4.48883e-05
Iteration                                           47
MetaTest/Average/AverageDiscountedReturn           -43.9257
MetaTest/Average/AverageReturn                     -43.9257
MetaTest/Average/Iteration                          47
MetaTest/Average/MaxReturn                         -20.9292
MetaTest/Average/MinReturn                         -67.3976
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.1758
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.9257
MetaTest/__unnamed_task__/AverageReturn            -43.9257
MetaTest/__unnamed_task__/Iteration                 47
MetaTest/__unnamed_task__/MaxReturn                -20.9292
MetaTest/__unnamed_task__/MinReturn                -67.3976
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.1758
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.536e+06
__unnamed_task__/AverageDiscountedReturn           -18.0385
__unnamed_task__/AverageReturn                     -41.7071
__unnamed_task__/Iteration                          47
__unnamed_task__/MaxReturn                          91.4526
__unnamed_task__/MinReturn                         -82.7276
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          21.1976
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:10:48 | [maml_trainer] epoch #48 | Sampling for adapation and meta-testing...
2025-04-02 20:12:20 | [maml_trainer] epoch #48 | Finished meta-testing...
2025-04-02 20:12:20 | [maml_trainer] epoch #48 | Saving snapshot...
2025-04-02 20:12:41 | [maml_trainer] epoch #48 | Saved
2025-04-02 20:12:41 | [maml_trainer] epoch #48 | Time 22783.83 s
2025-04-02 20:12:41 | [maml_trainer] epoch #48 | EpochTime 478.70 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.7074
Average/AverageReturn                              -40.1016
Average/Iteration                                   48
Average/MaxReturn                                   38.4037
Average/MinReturn                                  -76.4653
Average/NumEpisodes                                 80
Average/StdReturn                                   17.0931
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0075
GaussianMLPPolicy/KLAfter                            0.00574314
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.14418e-05
GaussianMLPPolicy/LossBefore                         1.93715e-08
GaussianMLPPolicy/dLoss                              1.14612e-05
Iteration                                           48
MetaTest/Average/AverageDiscountedReturn           -42.4988
MetaTest/Average/AverageReturn                     -42.4988
MetaTest/Average/Iteration                          48
MetaTest/Average/MaxReturn                         -24.8375
MetaTest/Average/MinReturn                         -67.1745
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.9251
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.4988
MetaTest/__unnamed_task__/AverageReturn            -42.4988
MetaTest/__unnamed_task__/Iteration                 48
MetaTest/__unnamed_task__/MaxReturn                -24.8375
MetaTest/__unnamed_task__/MinReturn                -67.1745
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.9251
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.568e+06
__unnamed_task__/AverageDiscountedReturn           -17.7074
__unnamed_task__/AverageReturn                     -40.1016
__unnamed_task__/Iteration                          48
__unnamed_task__/MaxReturn                          38.4037
__unnamed_task__/MinReturn                         -76.4653
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          17.0931
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:18:42 | [maml_trainer] epoch #49 | Sampling for adapation and meta-testing...
2025-04-02 20:20:15 | [maml_trainer] epoch #49 | Finished meta-testing...
2025-04-02 20:20:15 | [maml_trainer] epoch #49 | Saving snapshot...
2025-04-02 20:20:35 | [maml_trainer] epoch #49 | Saved
2025-04-02 20:20:35 | [maml_trainer] epoch #49 | Time 23257.82 s
2025-04-02 20:20:35 | [maml_trainer] epoch #49 | EpochTime 473.98 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.798
Average/AverageReturn                              -40.9482
Average/Iteration                                   49
Average/MaxReturn                                   11.5178
Average/MinReturn                                  -79.7529
Average/NumEpisodes                                 80
Average/StdReturn                                   14.5245
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0061
GaussianMLPPolicy/KLAfter                            0.00795525
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000319918
GaussianMLPPolicy/LossBefore                         2.28286e-08
GaussianMLPPolicy/dLoss                              0.000319941
Iteration                                           49
MetaTest/Average/AverageDiscountedReturn           -38.2858
MetaTest/Average/AverageReturn                     -38.2858
MetaTest/Average/Iteration                          49
MetaTest/Average/MaxReturn                         -18.2733
MetaTest/Average/MinReturn                         -71.3676
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.673
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.2858
MetaTest/__unnamed_task__/AverageReturn            -38.2858
MetaTest/__unnamed_task__/Iteration                 49
MetaTest/__unnamed_task__/MaxReturn                -18.2733
MetaTest/__unnamed_task__/MinReturn                -71.3676
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.673
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.6e+06
__unnamed_task__/AverageDiscountedReturn           -17.798
__unnamed_task__/AverageReturn                     -40.9482
__unnamed_task__/Iteration                          49
__unnamed_task__/MaxReturn                          11.5178
__unnamed_task__/MinReturn                         -79.7529
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.5245
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:26:33 | [maml_trainer] epoch #50 | Sampling for adapation and meta-testing...
2025-04-02 20:28:01 | [maml_trainer] epoch #50 | Finished meta-testing...
2025-04-02 20:28:01 | [maml_trainer] epoch #50 | Saving snapshot...
2025-04-02 20:28:22 | [maml_trainer] epoch #50 | Saved
2025-04-02 20:28:22 | [maml_trainer] epoch #50 | Time 23724.94 s
2025-04-02 20:28:22 | [maml_trainer] epoch #50 | EpochTime 467.12 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.8195
Average/AverageReturn                              -40.4067
Average/Iteration                                   50
Average/MaxReturn                                   -8.6914
Average/MinReturn                                  -71.2312
Average/NumEpisodes                                 80
Average/StdReturn                                   14.1414
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0043
GaussianMLPPolicy/KLAfter                            0.00673606
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000120578
GaussianMLPPolicy/LossBefore                        -3.24845e-09
GaussianMLPPolicy/dLoss                              0.000120575
Iteration                                           50
MetaTest/Average/AverageDiscountedReturn           -39.9869
MetaTest/Average/AverageReturn                     -39.9869
MetaTest/Average/Iteration                          50
MetaTest/Average/MaxReturn                         -16.5843
MetaTest/Average/MinReturn                         -68.198
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.8823
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.9869
MetaTest/__unnamed_task__/AverageReturn            -39.9869
MetaTest/__unnamed_task__/Iteration                 50
MetaTest/__unnamed_task__/MaxReturn                -16.5843
MetaTest/__unnamed_task__/MinReturn                -68.198
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.8823
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.632e+06
__unnamed_task__/AverageDiscountedReturn           -17.8195
__unnamed_task__/AverageReturn                     -40.4067
__unnamed_task__/Iteration                          50
__unnamed_task__/MaxReturn                          -8.6914
__unnamed_task__/MinReturn                         -71.2312
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.1414
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:34:23 | [maml_trainer] epoch #51 | Sampling for adapation and meta-testing...
2025-04-02 20:35:55 | [maml_trainer] epoch #51 | Finished meta-testing...
2025-04-02 20:35:55 | [maml_trainer] epoch #51 | Saving snapshot...
2025-04-02 20:36:17 | [maml_trainer] epoch #51 | Saved
2025-04-02 20:36:17 | [maml_trainer] epoch #51 | Time 24199.38 s
2025-04-02 20:36:17 | [maml_trainer] epoch #51 | EpochTime 474.44 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.8358
Average/AverageReturn                              -40.455
Average/Iteration                                   51
Average/MaxReturn                                    1.64362
Average/MinReturn                                  -77.0096
Average/NumEpisodes                                 80
Average/StdReturn                                   14.408
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0021
GaussianMLPPolicy/KLAfter                            0.00251017
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000146318
GaussianMLPPolicy/LossBefore                         9.0003e-09
GaussianMLPPolicy/dLoss                              0.000146327
Iteration                                           51
MetaTest/Average/AverageDiscountedReturn           -40.8186
MetaTest/Average/AverageReturn                     -40.8186
MetaTest/Average/Iteration                          51
MetaTest/Average/MaxReturn                          -1.49979
MetaTest/Average/MinReturn                         -73.4131
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.9214
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.8186
MetaTest/__unnamed_task__/AverageReturn            -40.8186
MetaTest/__unnamed_task__/Iteration                 51
MetaTest/__unnamed_task__/MaxReturn                 -1.49979
MetaTest/__unnamed_task__/MinReturn                -73.4131
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.9214
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.664e+06
__unnamed_task__/AverageDiscountedReturn           -17.8358
__unnamed_task__/AverageReturn                     -40.455
__unnamed_task__/Iteration                          51
__unnamed_task__/MaxReturn                           1.64362
__unnamed_task__/MinReturn                         -77.0096
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.408
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:42:25 | [maml_trainer] epoch #52 | Sampling for adapation and meta-testing...
2025-04-02 20:43:58 | [maml_trainer] epoch #52 | Finished meta-testing...
2025-04-02 20:43:58 | [maml_trainer] epoch #52 | Saving snapshot...
2025-04-02 20:44:19 | [maml_trainer] epoch #52 | Saved
2025-04-02 20:44:19 | [maml_trainer] epoch #52 | Time 24681.52 s
2025-04-02 20:44:19 | [maml_trainer] epoch #52 | EpochTime 482.14 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.8891
Average/AverageReturn                              -43.7323
Average/Iteration                                   52
Average/MaxReturn                                  -10.3893
Average/MinReturn                                  -76.8542
Average/NumEpisodes                                 80
Average/StdReturn                                   12.8202
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                           10.0001
GaussianMLPPolicy/KLAfter                            0.00210334
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.26961e-05
GaussianMLPPolicy/LossBefore                        -6.67572e-09
GaussianMLPPolicy/dLoss                              1.26894e-05
Iteration                                           52
MetaTest/Average/AverageDiscountedReturn           -42.4598
MetaTest/Average/AverageReturn                     -42.4598
MetaTest/Average/Iteration                          52
MetaTest/Average/MaxReturn                         -26.4454
MetaTest/Average/MinReturn                         -61.1317
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.3025
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.4598
MetaTest/__unnamed_task__/AverageReturn            -42.4598
MetaTest/__unnamed_task__/Iteration                 52
MetaTest/__unnamed_task__/MaxReturn                -26.4454
MetaTest/__unnamed_task__/MinReturn                -61.1317
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.3025
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.696e+06
__unnamed_task__/AverageDiscountedReturn           -18.8891
__unnamed_task__/AverageReturn                     -43.7323
__unnamed_task__/Iteration                          52
__unnamed_task__/MaxReturn                         -10.3893
__unnamed_task__/MinReturn                         -76.8542
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.8202
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:50:34 | [maml_trainer] epoch #53 | Sampling for adapation and meta-testing...
2025-04-02 20:52:07 | [maml_trainer] epoch #53 | Finished meta-testing...
2025-04-02 20:52:07 | [maml_trainer] epoch #53 | Saving snapshot...
2025-04-02 20:52:28 | [maml_trainer] epoch #53 | Saved
2025-04-02 20:52:28 | [maml_trainer] epoch #53 | Time 25170.70 s
2025-04-02 20:52:28 | [maml_trainer] epoch #53 | EpochTime 489.18 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.8041
Average/AverageReturn                              -41.9028
Average/Iteration                                   53
Average/MaxReturn                                  -20.092
Average/MinReturn                                  -83.4709
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6239
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99762
GaussianMLPPolicy/KLAfter                            0.00171712
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000137987
GaussianMLPPolicy/LossBefore                        -9.50694e-09
GaussianMLPPolicy/dLoss                              0.000137978
Iteration                                           53
MetaTest/Average/AverageDiscountedReturn           -46.937
MetaTest/Average/AverageReturn                     -46.937
MetaTest/Average/Iteration                          53
MetaTest/Average/MaxReturn                         -27.1601
MetaTest/Average/MinReturn                         -77.1411
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.6362
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -46.937
MetaTest/__unnamed_task__/AverageReturn            -46.937
MetaTest/__unnamed_task__/Iteration                 53
MetaTest/__unnamed_task__/MaxReturn                -27.1601
MetaTest/__unnamed_task__/MinReturn                -77.1411
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.6362
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.728e+06
__unnamed_task__/AverageDiscountedReturn           -17.8041
__unnamed_task__/AverageReturn                     -41.9028
__unnamed_task__/Iteration                          53
__unnamed_task__/MaxReturn                         -20.092
__unnamed_task__/MinReturn                         -83.4709
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6239
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 20:58:40 | [maml_trainer] epoch #54 | Sampling for adapation and meta-testing...
2025-04-02 21:00:09 | [maml_trainer] epoch #54 | Finished meta-testing...
2025-04-02 21:00:09 | [maml_trainer] epoch #54 | Saving snapshot...
2025-04-02 21:00:32 | [maml_trainer] epoch #54 | Saved
2025-04-02 21:00:32 | [maml_trainer] epoch #54 | Time 25654.23 s
2025-04-02 21:00:32 | [maml_trainer] epoch #54 | EpochTime 483.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.6603
Average/AverageReturn                              -40.5722
Average/Iteration                                   54
Average/MaxReturn                                   15.9293
Average/MinReturn                                  -64.4573
Average/NumEpisodes                                 80
Average/StdReturn                                   13.0328
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99431
GaussianMLPPolicy/KLAfter                            0.00119713
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.387e-05
GaussianMLPPolicy/LossBefore                         1.18017e-08
GaussianMLPPolicy/dLoss                              3.38818e-05
Iteration                                           54
MetaTest/Average/AverageDiscountedReturn           -37.5142
MetaTest/Average/AverageReturn                     -37.5142
MetaTest/Average/Iteration                          54
MetaTest/Average/MaxReturn                         -13.7525
MetaTest/Average/MinReturn                         -64.5996
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.5512
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.5142
MetaTest/__unnamed_task__/AverageReturn            -37.5142
MetaTest/__unnamed_task__/Iteration                 54
MetaTest/__unnamed_task__/MaxReturn                -13.7525
MetaTest/__unnamed_task__/MinReturn                -64.5996
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.5512
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.76e+06
__unnamed_task__/AverageDiscountedReturn           -17.6603
__unnamed_task__/AverageReturn                     -40.5722
__unnamed_task__/Iteration                          54
__unnamed_task__/MaxReturn                          15.9293
__unnamed_task__/MinReturn                         -64.4573
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.0328
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:06:39 | [maml_trainer] epoch #55 | Sampling for adapation and meta-testing...
2025-04-02 21:08:13 | [maml_trainer] epoch #55 | Finished meta-testing...
2025-04-02 21:08:13 | [maml_trainer] epoch #55 | Saving snapshot...
2025-04-02 21:08:35 | [maml_trainer] epoch #55 | Saved
2025-04-02 21:08:35 | [maml_trainer] epoch #55 | Time 26137.93 s
2025-04-02 21:08:35 | [maml_trainer] epoch #55 | EpochTime 483.69 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.0121
Average/AverageReturn                              -39.4175
Average/Iteration                                   55
Average/MaxReturn                                    8.72458
Average/MinReturn                                  -73.2583
Average/NumEpisodes                                 80
Average/StdReturn                                   13.9
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.99134
GaussianMLPPolicy/KLAfter                            0.00126455
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000104351
GaussianMLPPolicy/LossBefore                        -1.74642e-08
GaussianMLPPolicy/dLoss                              0.000104333
Iteration                                           55
MetaTest/Average/AverageDiscountedReturn           -35.3312
MetaTest/Average/AverageReturn                     -35.3312
MetaTest/Average/Iteration                          55
MetaTest/Average/MaxReturn                          38.8443
MetaTest/Average/MinReturn                         -63.0523
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          20.6629
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.3312
MetaTest/__unnamed_task__/AverageReturn            -35.3312
MetaTest/__unnamed_task__/Iteration                 55
MetaTest/__unnamed_task__/MaxReturn                 38.8443
MetaTest/__unnamed_task__/MinReturn                -63.0523
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 20.6629
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.792e+06
__unnamed_task__/AverageDiscountedReturn           -17.0121
__unnamed_task__/AverageReturn                     -39.4175
__unnamed_task__/Iteration                          55
__unnamed_task__/MaxReturn                           8.72458
__unnamed_task__/MinReturn                         -73.2583
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.9
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:14:49 | [maml_trainer] epoch #56 | Sampling for adapation and meta-testing...
2025-04-02 21:16:21 | [maml_trainer] epoch #56 | Finished meta-testing...
2025-04-02 21:16:21 | [maml_trainer] epoch #56 | Saving snapshot...
2025-04-02 21:16:42 | [maml_trainer] epoch #56 | Saved
2025-04-02 21:16:42 | [maml_trainer] epoch #56 | Time 26624.49 s
2025-04-02 21:16:42 | [maml_trainer] epoch #56 | EpochTime 486.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7748
Average/AverageReturn                              -39.3114
Average/Iteration                                   56
Average/MaxReturn                                    4.61241
Average/MinReturn                                  -77.203
Average/NumEpisodes                                 80
Average/StdReturn                                   13.8286
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98951
GaussianMLPPolicy/KLAfter                            0.00198677
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.10429e-05
GaussianMLPPolicy/LossBefore                        -1.49012e-09
GaussianMLPPolicy/dLoss                              3.10414e-05
Iteration                                           56
MetaTest/Average/AverageDiscountedReturn           -41.0579
MetaTest/Average/AverageReturn                     -41.0579
MetaTest/Average/Iteration                          56
MetaTest/Average/MaxReturn                           5.54115
MetaTest/Average/MinReturn                         -63.094
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.8612
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.0579
MetaTest/__unnamed_task__/AverageReturn            -41.0579
MetaTest/__unnamed_task__/Iteration                 56
MetaTest/__unnamed_task__/MaxReturn                  5.54115
MetaTest/__unnamed_task__/MinReturn                -63.094
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.8612
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.824e+06
__unnamed_task__/AverageDiscountedReturn           -16.7748
__unnamed_task__/AverageReturn                     -39.3114
__unnamed_task__/Iteration                          56
__unnamed_task__/MaxReturn                           4.61241
__unnamed_task__/MinReturn                         -77.203
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.8286
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:22:53 | [maml_trainer] epoch #57 | Sampling for adapation and meta-testing...
2025-04-02 21:24:26 | [maml_trainer] epoch #57 | Finished meta-testing...
2025-04-02 21:24:26 | [maml_trainer] epoch #57 | Saving snapshot...
2025-04-02 21:24:49 | [maml_trainer] epoch #57 | Saved
2025-04-02 21:24:49 | [maml_trainer] epoch #57 | Time 27111.19 s
2025-04-02 21:24:49 | [maml_trainer] epoch #57 | EpochTime 486.70 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.55
Average/AverageReturn                              -41.0559
Average/Iteration                                   57
Average/MaxReturn                                    5.77807
Average/MinReturn                                  -73.2814
Average/NumEpisodes                                 80
Average/StdReturn                                   14.1116
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98782
GaussianMLPPolicy/KLAfter                            0.00323137
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000116357
GaussianMLPPolicy/LossBefore                        -1.19209e-10
GaussianMLPPolicy/dLoss                              0.000116357
Iteration                                           57
MetaTest/Average/AverageDiscountedReturn           -41.7192
MetaTest/Average/AverageReturn                     -41.7192
MetaTest/Average/Iteration                          57
MetaTest/Average/MaxReturn                         -20.5166
MetaTest/Average/MinReturn                         -62.0176
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.0142
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.7192
MetaTest/__unnamed_task__/AverageReturn            -41.7192
MetaTest/__unnamed_task__/Iteration                 57
MetaTest/__unnamed_task__/MaxReturn                -20.5166
MetaTest/__unnamed_task__/MinReturn                -62.0176
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.0142
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.856e+06
__unnamed_task__/AverageDiscountedReturn           -17.55
__unnamed_task__/AverageReturn                     -41.0559
__unnamed_task__/Iteration                          57
__unnamed_task__/MaxReturn                           5.77807
__unnamed_task__/MinReturn                         -73.2814
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.1116
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:31:04 | [maml_trainer] epoch #58 | Sampling for adapation and meta-testing...
2025-04-02 21:32:34 | [maml_trainer] epoch #58 | Finished meta-testing...
2025-04-02 21:32:34 | [maml_trainer] epoch #58 | Saving snapshot...
2025-04-02 21:32:55 | [maml_trainer] epoch #58 | Saved
2025-04-02 21:32:55 | [maml_trainer] epoch #58 | Time 27597.96 s
2025-04-02 21:32:55 | [maml_trainer] epoch #58 | EpochTime 486.77 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5336
Average/AverageReturn                              -40.0304
Average/Iteration                                   58
Average/MaxReturn                                    2.04219
Average/MinReturn                                  -72.2847
Average/NumEpisodes                                 80
Average/StdReturn                                   12.7998
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98719
GaussianMLPPolicy/KLAfter                            0.00498967
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000133069
GaussianMLPPolicy/LossBefore                         1.01328e-09
GaussianMLPPolicy/dLoss                             -0.000133068
Iteration                                           58
MetaTest/Average/AverageDiscountedReturn           -40.9204
MetaTest/Average/AverageReturn                     -40.9204
MetaTest/Average/Iteration                          58
MetaTest/Average/MaxReturn                         -24.2372
MetaTest/Average/MinReturn                         -82.6656
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.1306
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.9204
MetaTest/__unnamed_task__/AverageReturn            -40.9204
MetaTest/__unnamed_task__/Iteration                 58
MetaTest/__unnamed_task__/MaxReturn                -24.2372
MetaTest/__unnamed_task__/MinReturn                -82.6656
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.1306
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.888e+06
__unnamed_task__/AverageDiscountedReturn           -17.5336
__unnamed_task__/AverageReturn                     -40.0304
__unnamed_task__/Iteration                          58
__unnamed_task__/MaxReturn                           2.04219
__unnamed_task__/MinReturn                         -72.2847
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.7998
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:38:51 | [maml_trainer] epoch #59 | Sampling for adapation and meta-testing...
2025-04-02 21:40:20 | [maml_trainer] epoch #59 | Finished meta-testing...
2025-04-02 21:40:20 | [maml_trainer] epoch #59 | Saving snapshot...
2025-04-02 21:40:41 | [maml_trainer] epoch #59 | Saved
2025-04-02 21:40:41 | [maml_trainer] epoch #59 | Time 28063.25 s
2025-04-02 21:40:41 | [maml_trainer] epoch #59 | EpochTime 465.29 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.6379
Average/AverageReturn                              -37.54
Average/Iteration                                   59
Average/MaxReturn                                    6.18578
Average/MinReturn                                  -64.8999
Average/NumEpisodes                                 80
Average/StdReturn                                   12.7921
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98467
GaussianMLPPolicy/KLAfter                            0.00384119
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.04382e-05
GaussianMLPPolicy/LossBefore                         1.96397e-08
GaussianMLPPolicy/dLoss                              8.04578e-05
Iteration                                           59
MetaTest/Average/AverageDiscountedReturn           -39.0978
MetaTest/Average/AverageReturn                     -39.0978
MetaTest/Average/Iteration                          59
MetaTest/Average/MaxReturn                          24.9568
MetaTest/Average/MinReturn                         -60.0183
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          19.0399
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.0978
MetaTest/__unnamed_task__/AverageReturn            -39.0978
MetaTest/__unnamed_task__/Iteration                 59
MetaTest/__unnamed_task__/MaxReturn                 24.9568
MetaTest/__unnamed_task__/MinReturn                -60.0183
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 19.0399
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.92e+06
__unnamed_task__/AverageDiscountedReturn           -16.6379
__unnamed_task__/AverageReturn                     -37.54
__unnamed_task__/Iteration                          59
__unnamed_task__/MaxReturn                           6.18578
__unnamed_task__/MinReturn                         -64.8999
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.7921
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:46:37 | [maml_trainer] epoch #60 | Sampling for adapation and meta-testing...
2025-04-02 21:48:04 | [maml_trainer] epoch #60 | Finished meta-testing...
2025-04-02 21:48:04 | [maml_trainer] epoch #60 | Saving snapshot...
2025-04-02 21:48:25 | [maml_trainer] epoch #60 | Saved
2025-04-02 21:48:25 | [maml_trainer] epoch #60 | Time 28527.67 s
2025-04-02 21:48:25 | [maml_trainer] epoch #60 | EpochTime 464.42 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.2271
Average/AverageReturn                              -39.4297
Average/Iteration                                   60
Average/MaxReturn                                  -13.9089
Average/MinReturn                                  -69.983
Average/NumEpisodes                                 80
Average/StdReturn                                   10.6151
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.98185
GaussianMLPPolicy/KLAfter                            0.00319016
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000109662
GaussianMLPPolicy/LossBefore                        -5.54323e-09
GaussianMLPPolicy/dLoss                              0.000109656
Iteration                                           60
MetaTest/Average/AverageDiscountedReturn           -43.4704
MetaTest/Average/AverageReturn                     -43.4704
MetaTest/Average/Iteration                          60
MetaTest/Average/MaxReturn                         -26.6324
MetaTest/Average/MinReturn                         -83.954
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.494
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.4704
MetaTest/__unnamed_task__/AverageReturn            -43.4704
MetaTest/__unnamed_task__/Iteration                 60
MetaTest/__unnamed_task__/MaxReturn                -26.6324
MetaTest/__unnamed_task__/MinReturn                -83.954
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.494
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.952e+06
__unnamed_task__/AverageDiscountedReturn           -17.2271
__unnamed_task__/AverageReturn                     -39.4297
__unnamed_task__/Iteration                          60
__unnamed_task__/MaxReturn                         -13.9089
__unnamed_task__/MinReturn                         -69.983
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.6151
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 21:54:19 | [maml_trainer] epoch #61 | Sampling for adapation and meta-testing...
2025-04-02 21:55:47 | [maml_trainer] epoch #61 | Finished meta-testing...
2025-04-02 21:55:47 | [maml_trainer] epoch #61 | Saving snapshot...
2025-04-02 21:56:07 | [maml_trainer] epoch #61 | Saved
2025-04-02 21:56:07 | [maml_trainer] epoch #61 | Time 28989.21 s
2025-04-02 21:56:07 | [maml_trainer] epoch #61 | EpochTime 461.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.6405
Average/AverageReturn                              -38.2825
Average/Iteration                                   61
Average/MaxReturn                                   -2.68104
Average/MinReturn                                  -71.1585
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6675
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9792
GaussianMLPPolicy/KLAfter                            0.00272085
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.4413e-05
GaussianMLPPolicy/LossBefore                         1.37985e-08
GaussianMLPPolicy/dLoss                             -6.43992e-05
Iteration                                           61
MetaTest/Average/AverageDiscountedReturn           -40.2001
MetaTest/Average/AverageReturn                     -40.2001
MetaTest/Average/Iteration                          61
MetaTest/Average/MaxReturn                         -21.653
MetaTest/Average/MinReturn                         -59.8502
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.19073
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.2001
MetaTest/__unnamed_task__/AverageReturn            -40.2001
MetaTest/__unnamed_task__/Iteration                 61
MetaTest/__unnamed_task__/MaxReturn                -21.653
MetaTest/__unnamed_task__/MinReturn                -59.8502
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.19073
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        1.984e+06
__unnamed_task__/AverageDiscountedReturn           -16.6405
__unnamed_task__/AverageReturn                     -38.2825
__unnamed_task__/Iteration                          61
__unnamed_task__/MaxReturn                          -2.68104
__unnamed_task__/MinReturn                         -71.1585
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6675
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:01:59 | [maml_trainer] epoch #62 | Sampling for adapation and meta-testing...
2025-04-02 22:03:28 | [maml_trainer] epoch #62 | Finished meta-testing...
2025-04-02 22:03:28 | [maml_trainer] epoch #62 | Saving snapshot...
2025-04-02 22:03:50 | [maml_trainer] epoch #62 | Saved
2025-04-02 22:03:50 | [maml_trainer] epoch #62 | Time 29452.22 s
2025-04-02 22:03:50 | [maml_trainer] epoch #62 | EpochTime 463.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5615
Average/AverageReturn                              -40.3479
Average/Iteration                                   62
Average/MaxReturn                                   -4.81493
Average/MinReturn                                  -68.7044
Average/NumEpisodes                                 80
Average/StdReturn                                   12.4399
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97748
GaussianMLPPolicy/KLAfter                            0.00179534
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000100537
GaussianMLPPolicy/LossBefore                        -1.24276e-08
GaussianMLPPolicy/dLoss                              0.000100525
Iteration                                           62
MetaTest/Average/AverageDiscountedReturn           -40.8026
MetaTest/Average/AverageReturn                     -40.8026
MetaTest/Average/Iteration                          62
MetaTest/Average/MaxReturn                          -6.20687
MetaTest/Average/MinReturn                         -72.5519
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.2169
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.8026
MetaTest/__unnamed_task__/AverageReturn            -40.8026
MetaTest/__unnamed_task__/Iteration                 62
MetaTest/__unnamed_task__/MaxReturn                 -6.20687
MetaTest/__unnamed_task__/MinReturn                -72.5519
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.2169
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.016e+06
__unnamed_task__/AverageDiscountedReturn           -17.5615
__unnamed_task__/AverageReturn                     -40.3479
__unnamed_task__/Iteration                          62
__unnamed_task__/MaxReturn                          -4.81493
__unnamed_task__/MinReturn                         -68.7044
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.4399
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:10:22 | [maml_trainer] epoch #63 | Sampling for adapation and meta-testing...
2025-04-02 22:11:50 | [maml_trainer] epoch #63 | Finished meta-testing...
2025-04-02 22:11:50 | [maml_trainer] epoch #63 | Saving snapshot...
2025-04-02 22:12:12 | [maml_trainer] epoch #63 | Saved
2025-04-02 22:12:12 | [maml_trainer] epoch #63 | Time 29954.19 s
2025-04-02 22:12:12 | [maml_trainer] epoch #63 | EpochTime 501.97 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5248
Average/AverageReturn                              -37.9621
Average/Iteration                                   63
Average/MaxReturn                                   45.0245
Average/MinReturn                                  -64.4337
Average/NumEpisodes                                 80
Average/StdReturn                                   14.6074
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97436
GaussianMLPPolicy/KLAfter                            0.00259448
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.12332e-05
GaussianMLPPolicy/LossBefore                         1.20699e-08
GaussianMLPPolicy/dLoss                             -7.12211e-05
Iteration                                           63
MetaTest/Average/AverageDiscountedReturn           -36.4001
MetaTest/Average/AverageReturn                     -36.4001
MetaTest/Average/Iteration                          63
MetaTest/Average/MaxReturn                          -1.08814
MetaTest/Average/MinReturn                         -48.8931
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.2783
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.4001
MetaTest/__unnamed_task__/AverageReturn            -36.4001
MetaTest/__unnamed_task__/Iteration                 63
MetaTest/__unnamed_task__/MaxReturn                 -1.08814
MetaTest/__unnamed_task__/MinReturn                -48.8931
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.2783
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.048e+06
__unnamed_task__/AverageDiscountedReturn           -16.5248
__unnamed_task__/AverageReturn                     -37.9621
__unnamed_task__/Iteration                          63
__unnamed_task__/MaxReturn                          45.0245
__unnamed_task__/MinReturn                         -64.4337
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.6074
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:18:11 | [maml_trainer] epoch #64 | Sampling for adapation and meta-testing...
2025-04-02 22:19:39 | [maml_trainer] epoch #64 | Finished meta-testing...
2025-04-02 22:19:39 | [maml_trainer] epoch #64 | Saving snapshot...
2025-04-02 22:19:59 | [maml_trainer] epoch #64 | Saved
2025-04-02 22:19:59 | [maml_trainer] epoch #64 | Time 30421.14 s
2025-04-02 22:19:59 | [maml_trainer] epoch #64 | EpochTime 466.94 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5386
Average/AverageReturn                              -37.0669
Average/Iteration                                   64
Average/MaxReturn                                   -1.26593
Average/MinReturn                                  -64.5418
Average/NumEpisodes                                 80
Average/StdReturn                                   10.335
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97138
GaussianMLPPolicy/KLAfter                            0.00357038
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000130051
GaussianMLPPolicy/LossBefore                         1.7643e-08
GaussianMLPPolicy/dLoss                              0.000130069
Iteration                                           64
MetaTest/Average/AverageDiscountedReturn           -38.5091
MetaTest/Average/AverageReturn                     -38.5091
MetaTest/Average/Iteration                          64
MetaTest/Average/MaxReturn                         -27.6911
MetaTest/Average/MinReturn                         -59.7297
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.07574
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.5091
MetaTest/__unnamed_task__/AverageReturn            -38.5091
MetaTest/__unnamed_task__/Iteration                 64
MetaTest/__unnamed_task__/MaxReturn                -27.6911
MetaTest/__unnamed_task__/MinReturn                -59.7297
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.07574
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.08e+06
__unnamed_task__/AverageDiscountedReturn           -16.5386
__unnamed_task__/AverageReturn                     -37.0669
__unnamed_task__/Iteration                          64
__unnamed_task__/MaxReturn                          -1.26593
__unnamed_task__/MinReturn                         -64.5418
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.335
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:25:52 | [maml_trainer] epoch #65 | Sampling for adapation and meta-testing...
2025-04-02 22:27:22 | [maml_trainer] epoch #65 | Finished meta-testing...
2025-04-02 22:27:22 | [maml_trainer] epoch #65 | Saving snapshot...
2025-04-02 22:27:44 | [maml_trainer] epoch #65 | Saved
2025-04-02 22:27:44 | [maml_trainer] epoch #65 | Time 30886.58 s
2025-04-02 22:27:44 | [maml_trainer] epoch #65 | EpochTime 465.44 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9135
Average/AverageReturn                              -38.7397
Average/Iteration                                   65
Average/MaxReturn                                    2.06965
Average/MinReturn                                  -63.5179
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4032
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96936
GaussianMLPPolicy/KLAfter                            0.00398799
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000103308
GaussianMLPPolicy/LossBefore                        -2.77758e-08
GaussianMLPPolicy/dLoss                              0.00010328
Iteration                                           65
MetaTest/Average/AverageDiscountedReturn           -39.8771
MetaTest/Average/AverageReturn                     -39.8771
MetaTest/Average/Iteration                          65
MetaTest/Average/MaxReturn                         -11.0893
MetaTest/Average/MinReturn                         -64.5025
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.5833
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.8771
MetaTest/__unnamed_task__/AverageReturn            -39.8771
MetaTest/__unnamed_task__/Iteration                 65
MetaTest/__unnamed_task__/MaxReturn                -11.0893
MetaTest/__unnamed_task__/MinReturn                -64.5025
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.5833
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.112e+06
__unnamed_task__/AverageDiscountedReturn           -16.9135
__unnamed_task__/AverageReturn                     -38.7397
__unnamed_task__/Iteration                          65
__unnamed_task__/MaxReturn                           2.06965
__unnamed_task__/MinReturn                         -63.5179
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4032
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:33:52 | [maml_trainer] epoch #66 | Sampling for adapation and meta-testing...
2025-04-02 22:35:21 | [maml_trainer] epoch #66 | Finished meta-testing...
2025-04-02 22:35:21 | [maml_trainer] epoch #66 | Saving snapshot...
2025-04-02 22:35:42 | [maml_trainer] epoch #66 | Saved
2025-04-02 22:35:42 | [maml_trainer] epoch #66 | Time 31364.77 s
2025-04-02 22:35:42 | [maml_trainer] epoch #66 | EpochTime 478.18 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.1951
Average/AverageReturn                              -38.9947
Average/Iteration                                   66
Average/MaxReturn                                    9.86626
Average/MinReturn                                  -75.6201
Average/NumEpisodes                                 80
Average/StdReturn                                   13.2836
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96851
GaussianMLPPolicy/KLAfter                            0.00345285
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.98702e-05
GaussianMLPPolicy/LossBefore                        -1.13249e-09
GaussianMLPPolicy/dLoss                             -4.98713e-05
Iteration                                           66
MetaTest/Average/AverageDiscountedReturn           -41.2995
MetaTest/Average/AverageReturn                     -41.2995
MetaTest/Average/Iteration                          66
MetaTest/Average/MaxReturn                         -20.4457
MetaTest/Average/MinReturn                         -54.3312
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.9851
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.2995
MetaTest/__unnamed_task__/AverageReturn            -41.2995
MetaTest/__unnamed_task__/Iteration                 66
MetaTest/__unnamed_task__/MaxReturn                -20.4457
MetaTest/__unnamed_task__/MinReturn                -54.3312
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.9851
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.144e+06
__unnamed_task__/AverageDiscountedReturn           -17.1951
__unnamed_task__/AverageReturn                     -38.9947
__unnamed_task__/Iteration                          66
__unnamed_task__/MaxReturn                           9.86626
__unnamed_task__/MinReturn                         -75.6201
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.2836
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:41:37 | [maml_trainer] epoch #67 | Sampling for adapation and meta-testing...
2025-04-02 22:43:06 | [maml_trainer] epoch #67 | Finished meta-testing...
2025-04-02 22:43:06 | [maml_trainer] epoch #67 | Saving snapshot...
2025-04-02 22:43:28 | [maml_trainer] epoch #67 | Saved
2025-04-02 22:43:28 | [maml_trainer] epoch #67 | Time 31830.03 s
2025-04-02 22:43:28 | [maml_trainer] epoch #67 | EpochTime 465.26 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3391
Average/AverageReturn                              -37.3869
Average/Iteration                                   67
Average/MaxReturn                                    1.06043
Average/MinReturn                                  -68.7952
Average/NumEpisodes                                 80
Average/StdReturn                                   10.677
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96683
GaussianMLPPolicy/KLAfter                            0.00204147
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000103619
GaussianMLPPolicy/LossBefore                         2.20537e-09
GaussianMLPPolicy/dLoss                             -0.000103617
Iteration                                           67
MetaTest/Average/AverageDiscountedReturn           -38.5436
MetaTest/Average/AverageReturn                     -38.5436
MetaTest/Average/Iteration                          67
MetaTest/Average/MaxReturn                           0.163547
MetaTest/Average/MinReturn                         -65.3543
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.2567
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.5436
MetaTest/__unnamed_task__/AverageReturn            -38.5436
MetaTest/__unnamed_task__/Iteration                 67
MetaTest/__unnamed_task__/MaxReturn                  0.163547
MetaTest/__unnamed_task__/MinReturn                -65.3543
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.2567
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.176e+06
__unnamed_task__/AverageDiscountedReturn           -16.3391
__unnamed_task__/AverageReturn                     -37.3869
__unnamed_task__/Iteration                          67
__unnamed_task__/MaxReturn                           1.06043
__unnamed_task__/MinReturn                         -68.7952
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.677
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:49:27 | [maml_trainer] epoch #68 | Sampling for adapation and meta-testing...
2025-04-02 22:50:58 | [maml_trainer] epoch #68 | Finished meta-testing...
2025-04-02 22:50:58 | [maml_trainer] epoch #68 | Saving snapshot...
2025-04-02 22:51:20 | [maml_trainer] epoch #68 | Saved
2025-04-02 22:51:20 | [maml_trainer] epoch #68 | Time 32302.94 s
2025-04-02 22:51:20 | [maml_trainer] epoch #68 | EpochTime 472.91 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.1112
Average/AverageReturn                              -37.282
Average/Iteration                                   68
Average/MaxReturn                                   -8.17799
Average/MinReturn                                  -68.0425
Average/NumEpisodes                                 80
Average/StdReturn                                   11.3885
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96691
GaussianMLPPolicy/KLAfter                            0.00272044
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.48484e-05
GaussianMLPPolicy/LossBefore                        -1.10269e-08
GaussianMLPPolicy/dLoss                             -6.48594e-05
Iteration                                           68
MetaTest/Average/AverageDiscountedReturn           -43.6048
MetaTest/Average/AverageReturn                     -43.6048
MetaTest/Average/Iteration                          68
MetaTest/Average/MaxReturn                         -27.3714
MetaTest/Average/MinReturn                         -68.8329
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.8462
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.6048
MetaTest/__unnamed_task__/AverageReturn            -43.6048
MetaTest/__unnamed_task__/Iteration                 68
MetaTest/__unnamed_task__/MaxReturn                -27.3714
MetaTest/__unnamed_task__/MinReturn                -68.8329
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.8462
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.208e+06
__unnamed_task__/AverageDiscountedReturn           -16.1112
__unnamed_task__/AverageReturn                     -37.282
__unnamed_task__/Iteration                          68
__unnamed_task__/MaxReturn                          -8.17799
__unnamed_task__/MinReturn                         -68.0425
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.3885
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 22:57:23 | [maml_trainer] epoch #69 | Sampling for adapation and meta-testing...
2025-04-02 22:58:54 | [maml_trainer] epoch #69 | Finished meta-testing...
2025-04-02 22:58:54 | [maml_trainer] epoch #69 | Saving snapshot...
2025-04-02 22:59:13 | [maml_trainer] epoch #69 | Saved
2025-04-02 22:59:13 | [maml_trainer] epoch #69 | Time 32775.87 s
2025-04-02 22:59:13 | [maml_trainer] epoch #69 | EpochTime 472.93 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5656
Average/AverageReturn                              -39.8788
Average/Iteration                                   69
Average/MaxReturn                                    5.35179
Average/MinReturn                                  -66.4829
Average/NumEpisodes                                 80
Average/StdReturn                                   11.939
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9665
GaussianMLPPolicy/KLAfter                            0.00318406
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.38068e-05
GaussianMLPPolicy/LossBefore                         9.47714e-09
GaussianMLPPolicy/dLoss                              5.38163e-05
Iteration                                           69
MetaTest/Average/AverageDiscountedReturn           -42.9057
MetaTest/Average/AverageReturn                     -42.9057
MetaTest/Average/Iteration                          69
MetaTest/Average/MaxReturn                          -1.89653
MetaTest/Average/MinReturn                         -60.8691
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.0574
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.9057
MetaTest/__unnamed_task__/AverageReturn            -42.9057
MetaTest/__unnamed_task__/Iteration                 69
MetaTest/__unnamed_task__/MaxReturn                 -1.89653
MetaTest/__unnamed_task__/MinReturn                -60.8691
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.0574
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.24e+06
__unnamed_task__/AverageDiscountedReturn           -17.5656
__unnamed_task__/AverageReturn                     -39.8788
__unnamed_task__/Iteration                          69
__unnamed_task__/MaxReturn                           5.35179
__unnamed_task__/MinReturn                         -66.4829
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.939
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:05:09 | [maml_trainer] epoch #70 | Sampling for adapation and meta-testing...
2025-04-02 23:06:40 | [maml_trainer] epoch #70 | Finished meta-testing...
2025-04-02 23:06:40 | [maml_trainer] epoch #70 | Saving snapshot...
2025-04-02 23:07:02 | [maml_trainer] epoch #70 | Saved
2025-04-02 23:07:02 | [maml_trainer] epoch #70 | Time 33244.53 s
2025-04-02 23:07:02 | [maml_trainer] epoch #70 | EpochTime 468.66 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.1904
Average/AverageReturn                              -39.2252
Average/Iteration                                   70
Average/MaxReturn                                   -6.04391
Average/MinReturn                                  -67.8778
Average/NumEpisodes                                 80
Average/StdReturn                                   11.3896
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96567
GaussianMLPPolicy/KLAfter                            0.00360157
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000173519
GaussianMLPPolicy/LossBefore                        -9.11951e-09
GaussianMLPPolicy/dLoss                             -0.000173528
Iteration                                           70
MetaTest/Average/AverageDiscountedReturn           -35.8258
MetaTest/Average/AverageReturn                     -35.8258
MetaTest/Average/Iteration                          70
MetaTest/Average/MaxReturn                         116.32
MetaTest/Average/MinReturn                         -73.1053
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          37.4832
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.8258
MetaTest/__unnamed_task__/AverageReturn            -35.8258
MetaTest/__unnamed_task__/Iteration                 70
MetaTest/__unnamed_task__/MaxReturn                116.32
MetaTest/__unnamed_task__/MinReturn                -73.1053
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 37.4832
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.272e+06
__unnamed_task__/AverageDiscountedReturn           -17.1904
__unnamed_task__/AverageReturn                     -39.2252
__unnamed_task__/Iteration                          70
__unnamed_task__/MaxReturn                          -6.04391
__unnamed_task__/MinReturn                         -67.8778
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.3896
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:13:02 | [maml_trainer] epoch #71 | Sampling for adapation and meta-testing...
2025-04-02 23:14:33 | [maml_trainer] epoch #71 | Finished meta-testing...
2025-04-02 23:14:33 | [maml_trainer] epoch #71 | Saving snapshot...
2025-04-02 23:14:54 | [maml_trainer] epoch #71 | Saved
2025-04-02 23:14:54 | [maml_trainer] epoch #71 | Time 33716.89 s
2025-04-02 23:14:54 | [maml_trainer] epoch #71 | EpochTime 472.36 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.481
Average/AverageReturn                              -39.6169
Average/Iteration                                   71
Average/MaxReturn                                   -9.52422
Average/MinReturn                                  -68.4776
Average/NumEpisodes                                 80
Average/StdReturn                                   10.8253
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96463
GaussianMLPPolicy/KLAfter                            0.00204609
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.93513e-05
GaussianMLPPolicy/LossBefore                         4.11272e-09
GaussianMLPPolicy/dLoss                              9.93554e-05
Iteration                                           71
MetaTest/Average/AverageDiscountedReturn           -40.357
MetaTest/Average/AverageReturn                     -40.357
MetaTest/Average/Iteration                          71
MetaTest/Average/MaxReturn                         -27.1081
MetaTest/Average/MinReturn                         -59.6102
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.8354
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.357
MetaTest/__unnamed_task__/AverageReturn            -40.357
MetaTest/__unnamed_task__/Iteration                 71
MetaTest/__unnamed_task__/MaxReturn                -27.1081
MetaTest/__unnamed_task__/MinReturn                -59.6102
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.8354
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.304e+06
__unnamed_task__/AverageDiscountedReturn           -17.481
__unnamed_task__/AverageReturn                     -39.6169
__unnamed_task__/Iteration                          71
__unnamed_task__/MaxReturn                          -9.52422
__unnamed_task__/MinReturn                         -68.4776
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.8253
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:20:52 | [maml_trainer] epoch #72 | Sampling for adapation and meta-testing...
2025-04-02 23:22:20 | [maml_trainer] epoch #72 | Finished meta-testing...
2025-04-02 23:22:20 | [maml_trainer] epoch #72 | Saving snapshot...
2025-04-02 23:22:40 | [maml_trainer] epoch #72 | Saved
2025-04-02 23:22:40 | [maml_trainer] epoch #72 | Time 34182.58 s
2025-04-02 23:22:40 | [maml_trainer] epoch #72 | EpochTime 465.68 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8467
Average/AverageReturn                              -39.0216
Average/Iteration                                   72
Average/MaxReturn                                  -12.0807
Average/MinReturn                                  -80.1126
Average/NumEpisodes                                 80
Average/StdReturn                                   11.467
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96562
GaussianMLPPolicy/KLAfter                            0.00382142
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.76658e-05
GaussianMLPPolicy/LossBefore                        -3.69549e-09
GaussianMLPPolicy/dLoss                              3.76621e-05
Iteration                                           72
MetaTest/Average/AverageDiscountedReturn           -40.1844
MetaTest/Average/AverageReturn                     -40.1844
MetaTest/Average/Iteration                          72
MetaTest/Average/MaxReturn                          10.7804
MetaTest/Average/MinReturn                         -76.4069
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          16.1874
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.1844
MetaTest/__unnamed_task__/AverageReturn            -40.1844
MetaTest/__unnamed_task__/Iteration                 72
MetaTest/__unnamed_task__/MaxReturn                 10.7804
MetaTest/__unnamed_task__/MinReturn                -76.4069
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 16.1874
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.336e+06
__unnamed_task__/AverageDiscountedReturn           -16.8467
__unnamed_task__/AverageReturn                     -39.0216
__unnamed_task__/Iteration                          72
__unnamed_task__/MaxReturn                         -12.0807
__unnamed_task__/MinReturn                         -80.1126
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.467
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:28:48 | [maml_trainer] epoch #73 | Sampling for adapation and meta-testing...
2025-04-02 23:30:21 | [maml_trainer] epoch #73 | Finished meta-testing...
2025-04-02 23:30:21 | [maml_trainer] epoch #73 | Saving snapshot...
2025-04-02 23:30:42 | [maml_trainer] epoch #73 | Saved
2025-04-02 23:30:42 | [maml_trainer] epoch #73 | Time 34664.91 s
2025-04-02 23:30:42 | [maml_trainer] epoch #73 | EpochTime 482.33 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.941
Average/AverageReturn                              -40.2621
Average/Iteration                                   73
Average/MaxReturn                                    6.55845
Average/MinReturn                                  -76.3434
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1301
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96708
GaussianMLPPolicy/KLAfter                            0.00481048
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000214189
GaussianMLPPolicy/LossBefore                         3.12924e-09
GaussianMLPPolicy/dLoss                             -0.000214186
Iteration                                           73
MetaTest/Average/AverageDiscountedReturn           -38.9346
MetaTest/Average/AverageReturn                     -38.9346
MetaTest/Average/Iteration                          73
MetaTest/Average/MaxReturn                         -21.6439
MetaTest/Average/MinReturn                         -58.4505
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.64991
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.9346
MetaTest/__unnamed_task__/AverageReturn            -38.9346
MetaTest/__unnamed_task__/Iteration                 73
MetaTest/__unnamed_task__/MaxReturn                -21.6439
MetaTest/__unnamed_task__/MinReturn                -58.4505
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.64991
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.368e+06
__unnamed_task__/AverageDiscountedReturn           -17.941
__unnamed_task__/AverageReturn                     -40.2621
__unnamed_task__/Iteration                          73
__unnamed_task__/MaxReturn                           6.55845
__unnamed_task__/MinReturn                         -76.3434
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1301
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:36:52 | [maml_trainer] epoch #74 | Sampling for adapation and meta-testing...
2025-04-02 23:38:21 | [maml_trainer] epoch #74 | Finished meta-testing...
2025-04-02 23:38:21 | [maml_trainer] epoch #74 | Saving snapshot...
2025-04-02 23:38:42 | [maml_trainer] epoch #74 | Saved
2025-04-02 23:38:42 | [maml_trainer] epoch #74 | Time 35144.46 s
2025-04-02 23:38:42 | [maml_trainer] epoch #74 | EpochTime 479.54 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.7789
Average/AverageReturn                              -40.2635
Average/Iteration                                   74
Average/MaxReturn                                  -22.5067
Average/MinReturn                                  -64.4049
Average/NumEpisodes                                 80
Average/StdReturn                                    9.72514
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96813
GaussianMLPPolicy/KLAfter                            0.00519627
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.84288e-05
GaussianMLPPolicy/LossBefore                         1.21593e-08
GaussianMLPPolicy/dLoss                              8.8441e-05
Iteration                                           74
MetaTest/Average/AverageDiscountedReturn           -38.0654
MetaTest/Average/AverageReturn                     -38.0654
MetaTest/Average/Iteration                          74
MetaTest/Average/MaxReturn                         -11.5643
MetaTest/Average/MinReturn                         -53.8329
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.7607
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.0654
MetaTest/__unnamed_task__/AverageReturn            -38.0654
MetaTest/__unnamed_task__/Iteration                 74
MetaTest/__unnamed_task__/MaxReturn                -11.5643
MetaTest/__unnamed_task__/MinReturn                -53.8329
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.7607
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.4e+06
__unnamed_task__/AverageDiscountedReturn           -17.7789
__unnamed_task__/AverageReturn                     -40.2635
__unnamed_task__/Iteration                          74
__unnamed_task__/MaxReturn                         -22.5067
__unnamed_task__/MinReturn                         -64.4049
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.72514
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:44:35 | [maml_trainer] epoch #75 | Sampling for adapation and meta-testing...
2025-04-02 23:46:03 | [maml_trainer] epoch #75 | Finished meta-testing...
2025-04-02 23:46:03 | [maml_trainer] epoch #75 | Saving snapshot...
2025-04-02 23:46:23 | [maml_trainer] epoch #75 | Saved
2025-04-02 23:46:23 | [maml_trainer] epoch #75 | Time 35605.76 s
2025-04-02 23:46:23 | [maml_trainer] epoch #75 | EpochTime 461.30 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.8487
Average/AverageReturn                              -40.3312
Average/Iteration                                   75
Average/MaxReturn                                  -14.8407
Average/MinReturn                                  -74.7663
Average/NumEpisodes                                 80
Average/StdReturn                                   10.3171
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96973
GaussianMLPPolicy/KLAfter                            0.00442886
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000139342
GaussianMLPPolicy/LossBefore                        -2.0206e-08
GaussianMLPPolicy/dLoss                              0.000139322
Iteration                                           75
MetaTest/Average/AverageDiscountedReturn           -42.9911
MetaTest/Average/AverageReturn                     -42.9911
MetaTest/Average/Iteration                          75
MetaTest/Average/MaxReturn                         -22.5972
MetaTest/Average/MinReturn                         -67.5438
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.077
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.9911
MetaTest/__unnamed_task__/AverageReturn            -42.9911
MetaTest/__unnamed_task__/Iteration                 75
MetaTest/__unnamed_task__/MaxReturn                -22.5972
MetaTest/__unnamed_task__/MinReturn                -67.5438
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.077
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.432e+06
__unnamed_task__/AverageDiscountedReturn           -17.8487
__unnamed_task__/AverageReturn                     -40.3312
__unnamed_task__/Iteration                          75
__unnamed_task__/MaxReturn                         -14.8407
__unnamed_task__/MinReturn                         -74.7663
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.3171
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-02 23:52:47 | [maml_trainer] epoch #76 | Sampling for adapation and meta-testing...
2025-04-02 23:54:19 | [maml_trainer] epoch #76 | Finished meta-testing...
2025-04-02 23:54:19 | [maml_trainer] epoch #76 | Saving snapshot...
2025-04-02 23:54:41 | [maml_trainer] epoch #76 | Saved
2025-04-02 23:54:41 | [maml_trainer] epoch #76 | Time 36103.74 s
2025-04-02 23:54:41 | [maml_trainer] epoch #76 | EpochTime 497.98 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.0644
Average/AverageReturn                              -43.1444
Average/Iteration                                   76
Average/MaxReturn                                   -0.523522
Average/MinReturn                                  -73.5562
Average/NumEpisodes                                 80
Average/StdReturn                                   12.4047
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97084
GaussianMLPPolicy/KLAfter                            0.00370514
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000145807
GaussianMLPPolicy/LossBefore                        -8.31485e-09
GaussianMLPPolicy/dLoss                              0.000145798
Iteration                                           76
MetaTest/Average/AverageDiscountedReturn           -43.2937
MetaTest/Average/AverageReturn                     -43.2937
MetaTest/Average/Iteration                          76
MetaTest/Average/MaxReturn                         -27.0972
MetaTest/Average/MinReturn                         -71.584
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.0394
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.2937
MetaTest/__unnamed_task__/AverageReturn            -43.2937
MetaTest/__unnamed_task__/Iteration                 76
MetaTest/__unnamed_task__/MaxReturn                -27.0972
MetaTest/__unnamed_task__/MinReturn                -71.584
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.0394
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.464e+06
__unnamed_task__/AverageDiscountedReturn           -19.0644
__unnamed_task__/AverageReturn                     -43.1444
__unnamed_task__/Iteration                          76
__unnamed_task__/MaxReturn                          -0.523522
__unnamed_task__/MinReturn                         -73.5562
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.4047
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:00:47 | [maml_trainer] epoch #77 | Sampling for adapation and meta-testing...
2025-04-03 00:02:19 | [maml_trainer] epoch #77 | Finished meta-testing...
2025-04-03 00:02:19 | [maml_trainer] epoch #77 | Saving snapshot...
2025-04-03 00:02:41 | [maml_trainer] epoch #77 | Saved
2025-04-03 00:02:41 | [maml_trainer] epoch #77 | Time 36583.79 s
2025-04-03 00:02:41 | [maml_trainer] epoch #77 | EpochTime 480.05 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.0319
Average/AverageReturn                              -38.334
Average/Iteration                                   77
Average/MaxReturn                                   17.9983
Average/MinReturn                                  -70.4688
Average/NumEpisodes                                 80
Average/StdReturn                                   12.1729
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97165
GaussianMLPPolicy/KLAfter                            0.00254581
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000151719
GaussianMLPPolicy/LossBefore                         3.78489e-09
GaussianMLPPolicy/dLoss                             -0.000151715
Iteration                                           77
MetaTest/Average/AverageDiscountedReturn           -38.3163
MetaTest/Average/AverageReturn                     -38.3163
MetaTest/Average/Iteration                          77
MetaTest/Average/MaxReturn                         -24.5134
MetaTest/Average/MinReturn                         -69.7602
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.1457
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.3163
MetaTest/__unnamed_task__/AverageReturn            -38.3163
MetaTest/__unnamed_task__/Iteration                 77
MetaTest/__unnamed_task__/MaxReturn                -24.5134
MetaTest/__unnamed_task__/MinReturn                -69.7602
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.1457
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.496e+06
__unnamed_task__/AverageDiscountedReturn           -17.0319
__unnamed_task__/AverageReturn                     -38.334
__unnamed_task__/Iteration                          77
__unnamed_task__/MaxReturn                          17.9983
__unnamed_task__/MinReturn                         -70.4688
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.1729
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:08:50 | [maml_trainer] epoch #78 | Sampling for adapation and meta-testing...
2025-04-03 00:10:17 | [maml_trainer] epoch #78 | Finished meta-testing...
2025-04-03 00:10:17 | [maml_trainer] epoch #78 | Saving snapshot...
2025-04-03 00:10:37 | [maml_trainer] epoch #78 | Saved
2025-04-03 00:10:37 | [maml_trainer] epoch #78 | Time 37059.33 s
2025-04-03 00:10:37 | [maml_trainer] epoch #78 | EpochTime 475.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.8868
Average/AverageReturn                              -39.7274
Average/Iteration                                   78
Average/MaxReturn                                   16.9398
Average/MinReturn                                  -71.525
Average/NumEpisodes                                 80
Average/StdReturn                                   14.3776
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97151
GaussianMLPPolicy/KLAfter                            0.00231471
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.85463e-05
GaussianMLPPolicy/LossBefore                        -1.36793e-08
GaussianMLPPolicy/dLoss                              4.85326e-05
Iteration                                           78
MetaTest/Average/AverageDiscountedReturn           -41.2451
MetaTest/Average/AverageReturn                     -41.2451
MetaTest/Average/Iteration                          78
MetaTest/Average/MaxReturn                          -8.06256
MetaTest/Average/MinReturn                         -73.5816
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.0957
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.2451
MetaTest/__unnamed_task__/AverageReturn            -41.2451
MetaTest/__unnamed_task__/Iteration                 78
MetaTest/__unnamed_task__/MaxReturn                 -8.06256
MetaTest/__unnamed_task__/MinReturn                -73.5816
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.0957
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.528e+06
__unnamed_task__/AverageDiscountedReturn           -17.8868
__unnamed_task__/AverageReturn                     -39.7274
__unnamed_task__/Iteration                          78
__unnamed_task__/MaxReturn                          16.9398
__unnamed_task__/MinReturn                         -71.525
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.3776
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:16:41 | [maml_trainer] epoch #79 | Sampling for adapation and meta-testing...
2025-04-03 00:18:14 | [maml_trainer] epoch #79 | Finished meta-testing...
2025-04-03 00:18:14 | [maml_trainer] epoch #79 | Saving snapshot...
2025-04-03 00:18:37 | [maml_trainer] epoch #79 | Saved
2025-04-03 00:18:37 | [maml_trainer] epoch #79 | Time 37539.14 s
2025-04-03 00:18:37 | [maml_trainer] epoch #79 | EpochTime 479.80 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4206
Average/AverageReturn                              -39.2834
Average/Iteration                                   79
Average/MaxReturn                                  -16.3383
Average/MinReturn                                  -69.9098
Average/NumEpisodes                                 80
Average/StdReturn                                   10.4071
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.97058
GaussianMLPPolicy/KLAfter                            0.001783
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000148184
GaussianMLPPolicy/LossBefore                        -7.21216e-09
GaussianMLPPolicy/dLoss                              0.000148177
Iteration                                           79
MetaTest/Average/AverageDiscountedReturn           -39.3117
MetaTest/Average/AverageReturn                     -39.3117
MetaTest/Average/Iteration                          79
MetaTest/Average/MaxReturn                         -14.0643
MetaTest/Average/MinReturn                         -72.8687
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.8489
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.3117
MetaTest/__unnamed_task__/AverageReturn            -39.3117
MetaTest/__unnamed_task__/Iteration                 79
MetaTest/__unnamed_task__/MaxReturn                -14.0643
MetaTest/__unnamed_task__/MinReturn                -72.8687
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.8489
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.56e+06
__unnamed_task__/AverageDiscountedReturn           -17.4206
__unnamed_task__/AverageReturn                     -39.2834
__unnamed_task__/Iteration                          79
__unnamed_task__/MaxReturn                         -16.3383
__unnamed_task__/MinReturn                         -69.9098
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.4071
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:24:44 | [maml_trainer] epoch #80 | Sampling for adapation and meta-testing...
2025-04-03 00:26:11 | [maml_trainer] epoch #80 | Finished meta-testing...
2025-04-03 00:26:11 | [maml_trainer] epoch #80 | Saving snapshot...
2025-04-03 00:26:32 | [maml_trainer] epoch #80 | Saved
2025-04-03 00:26:32 | [maml_trainer] epoch #80 | Time 38014.67 s
2025-04-03 00:26:32 | [maml_trainer] epoch #80 | EpochTime 475.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9742
Average/AverageReturn                              -38.2115
Average/Iteration                                   80
Average/MaxReturn                                  -20.5498
Average/MinReturn                                  -72.1231
Average/NumEpisodes                                 80
Average/StdReturn                                    8.98315
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9692
GaussianMLPPolicy/KLAfter                            0.0033096
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000116493
GaussianMLPPolicy/LossBefore                        -1.52588e-08
GaussianMLPPolicy/dLoss                              0.000116478
Iteration                                           80
MetaTest/Average/AverageDiscountedReturn           -36.244
MetaTest/Average/AverageReturn                     -36.244
MetaTest/Average/Iteration                          80
MetaTest/Average/MaxReturn                         -12.7253
MetaTest/Average/MinReturn                         -60.0022
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.3907
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.244
MetaTest/__unnamed_task__/AverageReturn            -36.244
MetaTest/__unnamed_task__/Iteration                 80
MetaTest/__unnamed_task__/MaxReturn                -12.7253
MetaTest/__unnamed_task__/MinReturn                -60.0022
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.3907
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.592e+06
__unnamed_task__/AverageDiscountedReturn           -16.9742
__unnamed_task__/AverageReturn                     -38.2115
__unnamed_task__/Iteration                          80
__unnamed_task__/MaxReturn                         -20.5498
__unnamed_task__/MinReturn                         -72.1231
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.98315
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:32:33 | [maml_trainer] epoch #81 | Sampling for adapation and meta-testing...
2025-04-03 00:34:04 | [maml_trainer] epoch #81 | Finished meta-testing...
2025-04-03 00:34:04 | [maml_trainer] epoch #81 | Saving snapshot...
2025-04-03 00:34:26 | [maml_trainer] epoch #81 | Saved
2025-04-03 00:34:26 | [maml_trainer] epoch #81 | Time 38488.66 s
2025-04-03 00:34:26 | [maml_trainer] epoch #81 | EpochTime 473.99 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.84
Average/AverageReturn                              -39.9705
Average/Iteration                                   81
Average/MaxReturn                                   -1.97083
Average/MinReturn                                  -75.545
Average/NumEpisodes                                 80
Average/StdReturn                                   12.8274
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96797
GaussianMLPPolicy/KLAfter                            0.00287687
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000120789
GaussianMLPPolicy/LossBefore                        -1.42157e-08
GaussianMLPPolicy/dLoss                              0.000120775
Iteration                                           81
MetaTest/Average/AverageDiscountedReturn           -35.2234
MetaTest/Average/AverageReturn                     -35.2234
MetaTest/Average/Iteration                          81
MetaTest/Average/MaxReturn                          25.4606
MetaTest/Average/MinReturn                         -58.4673
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          16.0339
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.2234
MetaTest/__unnamed_task__/AverageReturn            -35.2234
MetaTest/__unnamed_task__/Iteration                 81
MetaTest/__unnamed_task__/MaxReturn                 25.4606
MetaTest/__unnamed_task__/MinReturn                -58.4673
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 16.0339
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.624e+06
__unnamed_task__/AverageDiscountedReturn           -17.84
__unnamed_task__/AverageReturn                     -39.9705
__unnamed_task__/Iteration                          81
__unnamed_task__/MaxReturn                          -1.97083
__unnamed_task__/MinReturn                         -75.545
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.8274
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:40:25 | [maml_trainer] epoch #82 | Sampling for adapation and meta-testing...
2025-04-03 00:41:52 | [maml_trainer] epoch #82 | Finished meta-testing...
2025-04-03 00:41:52 | [maml_trainer] epoch #82 | Saving snapshot...
2025-04-03 00:42:13 | [maml_trainer] epoch #82 | Saved
2025-04-03 00:42:13 | [maml_trainer] epoch #82 | Time 38955.54 s
2025-04-03 00:42:13 | [maml_trainer] epoch #82 | EpochTime 466.88 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.737
Average/AverageReturn                              -40.6813
Average/Iteration                                   82
Average/MaxReturn                                  -22.4546
Average/MinReturn                                  -62.1272
Average/NumEpisodes                                 80
Average/StdReturn                                   10.4495
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96778
GaussianMLPPolicy/KLAfter                            0.00331948
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.30062e-05
GaussianMLPPolicy/LossBefore                         2.09212e-08
GaussianMLPPolicy/dLoss                              6.30271e-05
Iteration                                           82
MetaTest/Average/AverageDiscountedReturn           -38.1407
MetaTest/Average/AverageReturn                     -38.1407
MetaTest/Average/Iteration                          82
MetaTest/Average/MaxReturn                         -27.6707
MetaTest/Average/MinReturn                         -51.8502
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.30499
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.1407
MetaTest/__unnamed_task__/AverageReturn            -38.1407
MetaTest/__unnamed_task__/Iteration                 82
MetaTest/__unnamed_task__/MaxReturn                -27.6707
MetaTest/__unnamed_task__/MinReturn                -51.8502
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.30499
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.656e+06
__unnamed_task__/AverageDiscountedReturn           -17.737
__unnamed_task__/AverageReturn                     -40.6813
__unnamed_task__/Iteration                          82
__unnamed_task__/MaxReturn                         -22.4546
__unnamed_task__/MinReturn                         -62.1272
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.4495
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:48:10 | [maml_trainer] epoch #83 | Sampling for adapation and meta-testing...
2025-04-03 00:49:41 | [maml_trainer] epoch #83 | Finished meta-testing...
2025-04-03 00:49:41 | [maml_trainer] epoch #83 | Saving snapshot...
2025-04-03 00:50:04 | [maml_trainer] epoch #83 | Saved
2025-04-03 00:50:04 | [maml_trainer] epoch #83 | Time 39426.67 s
2025-04-03 00:50:04 | [maml_trainer] epoch #83 | EpochTime 471.12 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7169
Average/AverageReturn                              -37.6061
Average/Iteration                                   83
Average/MaxReturn                                   -1.38749
Average/MinReturn                                  -62.4635
Average/NumEpisodes                                 80
Average/StdReturn                                   10.8496
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96721
GaussianMLPPolicy/KLAfter                            0.00546135
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000156121
GaussianMLPPolicy/LossBefore                         7.03335e-09
GaussianMLPPolicy/dLoss                              0.000156128
Iteration                                           83
MetaTest/Average/AverageDiscountedReturn           -36.4941
MetaTest/Average/AverageReturn                     -36.4941
MetaTest/Average/Iteration                          83
MetaTest/Average/MaxReturn                          -6.0855
MetaTest/Average/MinReturn                         -59.7931
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.8194
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.4941
MetaTest/__unnamed_task__/AverageReturn            -36.4941
MetaTest/__unnamed_task__/Iteration                 83
MetaTest/__unnamed_task__/MaxReturn                 -6.0855
MetaTest/__unnamed_task__/MinReturn                -59.7931
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.8194
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.688e+06
__unnamed_task__/AverageDiscountedReturn           -16.7169
__unnamed_task__/AverageReturn                     -37.6061
__unnamed_task__/Iteration                          83
__unnamed_task__/MaxReturn                          -1.38749
__unnamed_task__/MinReturn                         -62.4635
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.8496
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 00:56:11 | [maml_trainer] epoch #84 | Sampling for adapation and meta-testing...
2025-04-03 00:57:43 | [maml_trainer] epoch #84 | Finished meta-testing...
2025-04-03 00:57:43 | [maml_trainer] epoch #84 | Saving snapshot...
2025-04-03 00:58:05 | [maml_trainer] epoch #84 | Saved
2025-04-03 00:58:05 | [maml_trainer] epoch #84 | Time 39907.77 s
2025-04-03 00:58:05 | [maml_trainer] epoch #84 | EpochTime 481.09 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.6885
Average/AverageReturn                              -40.3584
Average/Iteration                                   84
Average/MaxReturn                                  -21.7419
Average/MinReturn                                  -60.8742
Average/NumEpisodes                                 80
Average/StdReturn                                    9.74539
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96617
GaussianMLPPolicy/KLAfter                            0.00498031
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.40185e-05
GaussianMLPPolicy/LossBefore                        -1.58548e-08
GaussianMLPPolicy/dLoss                             -1.40343e-05
Iteration                                           84
MetaTest/Average/AverageDiscountedReturn           -40.3169
MetaTest/Average/AverageReturn                     -40.3169
MetaTest/Average/Iteration                          84
MetaTest/Average/MaxReturn                         -12.9616
MetaTest/Average/MinReturn                         -57.7449
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.05376
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.3169
MetaTest/__unnamed_task__/AverageReturn            -40.3169
MetaTest/__unnamed_task__/Iteration                 84
MetaTest/__unnamed_task__/MaxReturn                -12.9616
MetaTest/__unnamed_task__/MinReturn                -57.7449
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.05376
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.72e+06
__unnamed_task__/AverageDiscountedReturn           -17.6885
__unnamed_task__/AverageReturn                     -40.3584
__unnamed_task__/Iteration                          84
__unnamed_task__/MaxReturn                         -21.7419
__unnamed_task__/MinReturn                         -60.8742
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.74539
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:04:13 | [maml_trainer] epoch #85 | Sampling for adapation and meta-testing...
2025-04-03 01:05:45 | [maml_trainer] epoch #85 | Finished meta-testing...
2025-04-03 01:05:45 | [maml_trainer] epoch #85 | Saving snapshot...
2025-04-03 01:06:06 | [maml_trainer] epoch #85 | Saved
2025-04-03 01:06:06 | [maml_trainer] epoch #85 | Time 40388.72 s
2025-04-03 01:06:06 | [maml_trainer] epoch #85 | EpochTime 480.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.3131
Average/AverageReturn                              -38.5108
Average/Iteration                                   85
Average/MaxReturn                                  -15.918
Average/MinReturn                                  -65.265
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1669
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96474
GaussianMLPPolicy/KLAfter                            0.00445755
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.24915e-05
GaussianMLPPolicy/LossBefore                         9.23872e-09
GaussianMLPPolicy/dLoss                             -2.24822e-05
Iteration                                           85
MetaTest/Average/AverageDiscountedReturn           -42.2694
MetaTest/Average/AverageReturn                     -42.2694
MetaTest/Average/Iteration                          85
MetaTest/Average/MaxReturn                         -25.5113
MetaTest/Average/MinReturn                         -60.6078
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.12376
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.2694
MetaTest/__unnamed_task__/AverageReturn            -42.2694
MetaTest/__unnamed_task__/Iteration                 85
MetaTest/__unnamed_task__/MaxReturn                -25.5113
MetaTest/__unnamed_task__/MinReturn                -60.6078
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.12376
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.752e+06
__unnamed_task__/AverageDiscountedReturn           -17.3131
__unnamed_task__/AverageReturn                     -38.5108
__unnamed_task__/Iteration                          85
__unnamed_task__/MaxReturn                         -15.918
__unnamed_task__/MinReturn                         -65.265
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1669
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:12:17 | [maml_trainer] epoch #86 | Sampling for adapation and meta-testing...
2025-04-03 01:13:47 | [maml_trainer] epoch #86 | Finished meta-testing...
2025-04-03 01:13:47 | [maml_trainer] epoch #86 | Saving snapshot...
2025-04-03 01:14:11 | [maml_trainer] epoch #86 | Saved
2025-04-03 01:14:11 | [maml_trainer] epoch #86 | Time 40873.23 s
2025-04-03 01:14:11 | [maml_trainer] epoch #86 | EpochTime 484.51 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9816
Average/AverageReturn                              -38.2496
Average/Iteration                                   86
Average/MaxReturn                                  -14.2024
Average/MinReturn                                  -55.8521
Average/NumEpisodes                                 80
Average/StdReturn                                    8.98548
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96435
GaussianMLPPolicy/KLAfter                            0.00747435
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000274682
GaussianMLPPolicy/LossBefore                         3.25441e-08
GaussianMLPPolicy/dLoss                              0.000274714
Iteration                                           86
MetaTest/Average/AverageDiscountedReturn           -39.0686
MetaTest/Average/AverageReturn                     -39.0686
MetaTest/Average/Iteration                          86
MetaTest/Average/MaxReturn                         -25.4661
MetaTest/Average/MinReturn                         -58.2677
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.72669
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.0686
MetaTest/__unnamed_task__/AverageReturn            -39.0686
MetaTest/__unnamed_task__/Iteration                 86
MetaTest/__unnamed_task__/MaxReturn                -25.4661
MetaTest/__unnamed_task__/MinReturn                -58.2677
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.72669
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.784e+06
__unnamed_task__/AverageDiscountedReturn           -16.9816
__unnamed_task__/AverageReturn                     -38.2496
__unnamed_task__/Iteration                          86
__unnamed_task__/MaxReturn                         -14.2024
__unnamed_task__/MinReturn                         -55.8521
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.98548
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:20:20 | [maml_trainer] epoch #87 | Sampling for adapation and meta-testing...
2025-04-03 01:21:50 | [maml_trainer] epoch #87 | Finished meta-testing...
2025-04-03 01:21:50 | [maml_trainer] epoch #87 | Saving snapshot...
2025-04-03 01:22:13 | [maml_trainer] epoch #87 | Saved
2025-04-03 01:22:13 | [maml_trainer] epoch #87 | Time 41355.57 s
2025-04-03 01:22:13 | [maml_trainer] epoch #87 | EpochTime 482.33 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7179
Average/AverageReturn                              -37.5968
Average/Iteration                                   87
Average/MaxReturn                                   17.3171
Average/MinReturn                                  -58.7711
Average/NumEpisodes                                 80
Average/StdReturn                                   10.7176
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96234
GaussianMLPPolicy/KLAfter                            0.00480663
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.88119e-05
GaussianMLPPolicy/LossBefore                        -1.40667e-08
GaussianMLPPolicy/dLoss                              7.87978e-05
Iteration                                           87
MetaTest/Average/AverageDiscountedReturn           -41.2215
MetaTest/Average/AverageReturn                     -41.2215
MetaTest/Average/Iteration                          87
MetaTest/Average/MaxReturn                         -26.1683
MetaTest/Average/MinReturn                         -56.379
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.62901
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.2215
MetaTest/__unnamed_task__/AverageReturn            -41.2215
MetaTest/__unnamed_task__/Iteration                 87
MetaTest/__unnamed_task__/MaxReturn                -26.1683
MetaTest/__unnamed_task__/MinReturn                -56.379
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.62901
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.816e+06
__unnamed_task__/AverageDiscountedReturn           -16.7179
__unnamed_task__/AverageReturn                     -37.5968
__unnamed_task__/Iteration                          87
__unnamed_task__/MaxReturn                          17.3171
__unnamed_task__/MinReturn                         -58.7711
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.7176
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:28:26 | [maml_trainer] epoch #88 | Sampling for adapation and meta-testing...
2025-04-03 01:29:58 | [maml_trainer] epoch #88 | Finished meta-testing...
2025-04-03 01:29:58 | [maml_trainer] epoch #88 | Saving snapshot...
2025-04-03 01:30:20 | [maml_trainer] epoch #88 | Saved
2025-04-03 01:30:20 | [maml_trainer] epoch #88 | Time 41842.29 s
2025-04-03 01:30:20 | [maml_trainer] epoch #88 | EpochTime 486.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.2335
Average/AverageReturn                              -39.0006
Average/Iteration                                   88
Average/MaxReturn                                  -21.1415
Average/MinReturn                                  -61.1567
Average/NumEpisodes                                 80
Average/StdReturn                                    7.96403
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.96081
GaussianMLPPolicy/KLAfter                            0.00845532
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.77112e-05
GaussianMLPPolicy/LossBefore                        -1.90139e-08
GaussianMLPPolicy/dLoss                              2.76922e-05
Iteration                                           88
MetaTest/Average/AverageDiscountedReturn           -38.1042
MetaTest/Average/AverageReturn                     -38.1042
MetaTest/Average/Iteration                          88
MetaTest/Average/MaxReturn                         -24.6621
MetaTest/Average/MinReturn                         -48.9639
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.58489
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.1042
MetaTest/__unnamed_task__/AverageReturn            -38.1042
MetaTest/__unnamed_task__/Iteration                 88
MetaTest/__unnamed_task__/MaxReturn                -24.6621
MetaTest/__unnamed_task__/MinReturn                -48.9639
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.58489
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.848e+06
__unnamed_task__/AverageDiscountedReturn           -17.2335
__unnamed_task__/AverageReturn                     -39.0006
__unnamed_task__/Iteration                          88
__unnamed_task__/MaxReturn                         -21.1415
__unnamed_task__/MinReturn                         -61.1567
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.96403
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:36:30 | [maml_trainer] epoch #89 | Sampling for adapation and meta-testing...
2025-04-03 01:38:03 | [maml_trainer] epoch #89 | Finished meta-testing...
2025-04-03 01:38:03 | [maml_trainer] epoch #89 | Saving snapshot...
2025-04-03 01:38:26 | [maml_trainer] epoch #89 | Saved
2025-04-03 01:38:26 | [maml_trainer] epoch #89 | Time 42328.69 s
2025-04-03 01:38:26 | [maml_trainer] epoch #89 | EpochTime 486.40 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.6787
Average/AverageReturn                              -38.0401
Average/Iteration                                   89
Average/MaxReturn                                   -6.8845
Average/MinReturn                                  -55.9867
Average/NumEpisodes                                 80
Average/StdReturn                                    9.54008
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95934
GaussianMLPPolicy/KLAfter                            0.00637081
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.06994e-05
GaussianMLPPolicy/LossBefore                         8.46386e-09
GaussianMLPPolicy/dLoss                              6.07079e-05
Iteration                                           89
MetaTest/Average/AverageDiscountedReturn           -38.0371
MetaTest/Average/AverageReturn                     -38.0371
MetaTest/Average/Iteration                          89
MetaTest/Average/MaxReturn                         -22.0211
MetaTest/Average/MinReturn                         -60.5028
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.67922
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.0371
MetaTest/__unnamed_task__/AverageReturn            -38.0371
MetaTest/__unnamed_task__/Iteration                 89
MetaTest/__unnamed_task__/MaxReturn                -22.0211
MetaTest/__unnamed_task__/MinReturn                -60.5028
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.67922
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.88e+06
__unnamed_task__/AverageDiscountedReturn           -16.6787
__unnamed_task__/AverageReturn                     -38.0401
__unnamed_task__/Iteration                          89
__unnamed_task__/MaxReturn                          -6.8845
__unnamed_task__/MinReturn                         -55.9867
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.54008
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:44:37 | [maml_trainer] epoch #90 | Sampling for adapation and meta-testing...
2025-04-03 01:46:08 | [maml_trainer] epoch #90 | Finished meta-testing...
2025-04-03 01:46:08 | [maml_trainer] epoch #90 | Saving snapshot...
2025-04-03 01:46:31 | [maml_trainer] epoch #90 | Saved
2025-04-03 01:46:31 | [maml_trainer] epoch #90 | Time 42813.42 s
2025-04-03 01:46:31 | [maml_trainer] epoch #90 | EpochTime 484.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.6413
Average/AverageReturn                              -38.3462
Average/Iteration                                   90
Average/MaxReturn                                   40.425
Average/MinReturn                                  -64.5802
Average/NumEpisodes                                 80
Average/StdReturn                                   13.7486
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95812
GaussianMLPPolicy/KLAfter                            0.00704054
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.07155e-05
GaussianMLPPolicy/LossBefore                        -7.03335e-09
GaussianMLPPolicy/dLoss                              4.07085e-05
Iteration                                           90
MetaTest/Average/AverageDiscountedReturn           -41.0455
MetaTest/Average/AverageReturn                     -41.0455
MetaTest/Average/Iteration                          90
MetaTest/Average/MaxReturn                         -28.3289
MetaTest/Average/MinReturn                         -59.8348
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.24932
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.0455
MetaTest/__unnamed_task__/AverageReturn            -41.0455
MetaTest/__unnamed_task__/Iteration                 90
MetaTest/__unnamed_task__/MaxReturn                -28.3289
MetaTest/__unnamed_task__/MinReturn                -59.8348
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.24932
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.912e+06
__unnamed_task__/AverageDiscountedReturn           -16.6413
__unnamed_task__/AverageReturn                     -38.3462
__unnamed_task__/Iteration                          90
__unnamed_task__/MaxReturn                          40.425
__unnamed_task__/MinReturn                         -64.5802
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.7486
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 01:52:41 | [maml_trainer] epoch #91 | Sampling for adapation and meta-testing...
2025-04-03 01:54:12 | [maml_trainer] epoch #91 | Finished meta-testing...
2025-04-03 01:54:12 | [maml_trainer] epoch #91 | Saving snapshot...
2025-04-03 01:54:34 | [maml_trainer] epoch #91 | Saved
2025-04-03 01:54:34 | [maml_trainer] epoch #91 | Time 43296.27 s
2025-04-03 01:54:34 | [maml_trainer] epoch #91 | EpochTime 482.85 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9422
Average/AverageReturn                              -39.1523
Average/Iteration                                   91
Average/MaxReturn                                  -16.2191
Average/MinReturn                                  -69.4358
Average/NumEpisodes                                 80
Average/StdReturn                                    9.72549
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9568
GaussianMLPPolicy/KLAfter                            0.00711864
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.85844e-05
GaussianMLPPolicy/LossBefore                        -8.52346e-09
GaussianMLPPolicy/dLoss                             -1.85929e-05
Iteration                                           91
MetaTest/Average/AverageDiscountedReturn           -38.3089
MetaTest/Average/AverageReturn                     -38.3089
MetaTest/Average/Iteration                          91
MetaTest/Average/MaxReturn                          -7.39314
MetaTest/Average/MinReturn                         -54.8926
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.38041
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.3089
MetaTest/__unnamed_task__/AverageReturn            -38.3089
MetaTest/__unnamed_task__/Iteration                 91
MetaTest/__unnamed_task__/MaxReturn                 -7.39314
MetaTest/__unnamed_task__/MinReturn                -54.8926
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.38041
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.944e+06
__unnamed_task__/AverageDiscountedReturn           -16.9422
__unnamed_task__/AverageReturn                     -39.1523
__unnamed_task__/Iteration                          91
__unnamed_task__/MaxReturn                         -16.2191
__unnamed_task__/MinReturn                         -69.4358
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.72549
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:00:46 | [maml_trainer] epoch #92 | Sampling for adapation and meta-testing...
2025-04-03 02:02:18 | [maml_trainer] epoch #92 | Finished meta-testing...
2025-04-03 02:02:18 | [maml_trainer] epoch #92 | Saving snapshot...
2025-04-03 02:02:42 | [maml_trainer] epoch #92 | Saved
2025-04-03 02:02:42 | [maml_trainer] epoch #92 | Time 43784.27 s
2025-04-03 02:02:42 | [maml_trainer] epoch #92 | EpochTime 487.99 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.6905
Average/AverageReturn                              -41.4997
Average/Iteration                                   92
Average/MaxReturn                                    0.47988
Average/MinReturn                                  -77.2686
Average/NumEpisodes                                 80
Average/StdReturn                                   11.2554
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95646
GaussianMLPPolicy/KLAfter                            0.0094993
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000202847
GaussianMLPPolicy/LossBefore                        -3.93391e-09
GaussianMLPPolicy/dLoss                             -0.000202851
Iteration                                           92
MetaTest/Average/AverageDiscountedReturn           -42.0118
MetaTest/Average/AverageReturn                     -42.0118
MetaTest/Average/Iteration                          92
MetaTest/Average/MaxReturn                         -22.1932
MetaTest/Average/MinReturn                         -59.2805
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.81092
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.0118
MetaTest/__unnamed_task__/AverageReturn            -42.0118
MetaTest/__unnamed_task__/Iteration                 92
MetaTest/__unnamed_task__/MaxReturn                -22.1932
MetaTest/__unnamed_task__/MinReturn                -59.2805
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.81092
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        2.976e+06
__unnamed_task__/AverageDiscountedReturn           -17.6905
__unnamed_task__/AverageReturn                     -41.4997
__unnamed_task__/Iteration                          92
__unnamed_task__/MaxReturn                           0.47988
__unnamed_task__/MinReturn                         -77.2686
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.2554
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:08:56 | [maml_trainer] epoch #93 | Sampling for adapation and meta-testing...
2025-04-03 02:10:29 | [maml_trainer] epoch #93 | Finished meta-testing...
2025-04-03 02:10:29 | [maml_trainer] epoch #93 | Saving snapshot...
2025-04-03 02:10:51 | [maml_trainer] epoch #93 | Saved
2025-04-03 02:10:51 | [maml_trainer] epoch #93 | Time 44273.83 s
2025-04-03 02:10:51 | [maml_trainer] epoch #93 | EpochTime 489.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.6756
Average/AverageReturn                              -40.9556
Average/Iteration                                   93
Average/MaxReturn                                   -3.58566
Average/MinReturn                                  -74.1306
Average/NumEpisodes                                 80
Average/StdReturn                                   11.3637
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95634
GaussianMLPPolicy/KLAfter                            0.00812104
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000198876
GaussianMLPPolicy/LossBefore                        -1.27554e-08
GaussianMLPPolicy/dLoss                              0.000198864
Iteration                                           93
MetaTest/Average/AverageDiscountedReturn           -42.7227
MetaTest/Average/AverageReturn                     -42.7227
MetaTest/Average/Iteration                          93
MetaTest/Average/MaxReturn                         -13.1534
MetaTest/Average/MinReturn                         -58.235
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.1203
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.7227
MetaTest/__unnamed_task__/AverageReturn            -42.7227
MetaTest/__unnamed_task__/Iteration                 93
MetaTest/__unnamed_task__/MaxReturn                -13.1534
MetaTest/__unnamed_task__/MinReturn                -58.235
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.1203
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.008e+06
__unnamed_task__/AverageDiscountedReturn           -17.6756
__unnamed_task__/AverageReturn                     -40.9556
__unnamed_task__/Iteration                          93
__unnamed_task__/MaxReturn                          -3.58566
__unnamed_task__/MinReturn                         -74.1306
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.3637
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:17:05 | [maml_trainer] epoch #94 | Sampling for adapation and meta-testing...
2025-04-03 02:18:36 | [maml_trainer] epoch #94 | Finished meta-testing...
2025-04-03 02:18:36 | [maml_trainer] epoch #94 | Saving snapshot...
2025-04-03 02:18:58 | [maml_trainer] epoch #94 | Saved
2025-04-03 02:18:58 | [maml_trainer] epoch #94 | Time 44760.28 s
2025-04-03 02:18:58 | [maml_trainer] epoch #94 | EpochTime 486.45 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5122
Average/AverageReturn                              -40.6333
Average/Iteration                                   94
Average/MaxReturn                                  -14.333
Average/MinReturn                                  -68.1628
Average/NumEpisodes                                 80
Average/StdReturn                                   11.5393
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95694
GaussianMLPPolicy/KLAfter                            0.00410401
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000115267
GaussianMLPPolicy/LossBefore                         1.57356e-08
GaussianMLPPolicy/dLoss                              0.000115283
Iteration                                           94
MetaTest/Average/AverageDiscountedReturn           -35.4743
MetaTest/Average/AverageReturn                     -35.4743
MetaTest/Average/Iteration                          94
MetaTest/Average/MaxReturn                         -16.552
MetaTest/Average/MinReturn                         -58.9191
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.1739
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.4743
MetaTest/__unnamed_task__/AverageReturn            -35.4743
MetaTest/__unnamed_task__/Iteration                 94
MetaTest/__unnamed_task__/MaxReturn                -16.552
MetaTest/__unnamed_task__/MinReturn                -58.9191
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.1739
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.04e+06
__unnamed_task__/AverageDiscountedReturn           -17.5122
__unnamed_task__/AverageReturn                     -40.6333
__unnamed_task__/Iteration                          94
__unnamed_task__/MaxReturn                         -14.333
__unnamed_task__/MinReturn                         -68.1628
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.5393
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:25:04 | [maml_trainer] epoch #95 | Sampling for adapation and meta-testing...
2025-04-03 02:26:35 | [maml_trainer] epoch #95 | Finished meta-testing...
2025-04-03 02:26:35 | [maml_trainer] epoch #95 | Saving snapshot...
2025-04-03 02:26:58 | [maml_trainer] epoch #95 | Saved
2025-04-03 02:26:58 | [maml_trainer] epoch #95 | Time 45240.66 s
2025-04-03 02:26:58 | [maml_trainer] epoch #95 | EpochTime 480.37 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.327
Average/AverageReturn                              -40.6006
Average/Iteration                                   95
Average/MaxReturn                                  -19.4044
Average/MinReturn                                  -64.523
Average/NumEpisodes                                 80
Average/StdReturn                                    8.63808
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95717
GaussianMLPPolicy/KLAfter                            0.00425012
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.36607e-05
GaussianMLPPolicy/LossBefore                        -2.02656e-08
GaussianMLPPolicy/dLoss                              2.36405e-05
Iteration                                           95
MetaTest/Average/AverageDiscountedReturn           -45.0415
MetaTest/Average/AverageReturn                     -45.0415
MetaTest/Average/Iteration                          95
MetaTest/Average/MaxReturn                         -30.6776
MetaTest/Average/MinReturn                         -74.0447
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.7524
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -45.0415
MetaTest/__unnamed_task__/AverageReturn            -45.0415
MetaTest/__unnamed_task__/Iteration                 95
MetaTest/__unnamed_task__/MaxReturn                -30.6776
MetaTest/__unnamed_task__/MinReturn                -74.0447
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.7524
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.072e+06
__unnamed_task__/AverageDiscountedReturn           -17.327
__unnamed_task__/AverageReturn                     -40.6006
__unnamed_task__/Iteration                          95
__unnamed_task__/MaxReturn                         -19.4044
__unnamed_task__/MinReturn                         -64.523
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.63808
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:33:03 | [maml_trainer] epoch #96 | Sampling for adapation and meta-testing...
2025-04-03 02:34:35 | [maml_trainer] epoch #96 | Finished meta-testing...
2025-04-03 02:34:35 | [maml_trainer] epoch #96 | Saving snapshot...
2025-04-03 02:34:58 | [maml_trainer] epoch #96 | Saved
2025-04-03 02:34:58 | [maml_trainer] epoch #96 | Time 45720.17 s
2025-04-03 02:34:58 | [maml_trainer] epoch #96 | EpochTime 479.51 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.2029
Average/AverageReturn                              -42.0354
Average/Iteration                                   96
Average/MaxReturn                                  -15.0672
Average/MinReturn                                  -66.8623
Average/NumEpisodes                                 80
Average/StdReturn                                    9.28551
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9579
GaussianMLPPolicy/KLAfter                            0.00620141
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.24029e-05
GaussianMLPPolicy/LossBefore                         5.90086e-09
GaussianMLPPolicy/dLoss                             -3.2397e-05
Iteration                                           96
MetaTest/Average/AverageDiscountedReturn           -39.9153
MetaTest/Average/AverageReturn                     -39.9153
MetaTest/Average/Iteration                          96
MetaTest/Average/MaxReturn                         -23.9463
MetaTest/Average/MinReturn                         -62.0674
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.12874
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.9153
MetaTest/__unnamed_task__/AverageReturn            -39.9153
MetaTest/__unnamed_task__/Iteration                 96
MetaTest/__unnamed_task__/MaxReturn                -23.9463
MetaTest/__unnamed_task__/MinReturn                -62.0674
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.12874
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.104e+06
__unnamed_task__/AverageDiscountedReturn           -18.2029
__unnamed_task__/AverageReturn                     -42.0354
__unnamed_task__/Iteration                          96
__unnamed_task__/MaxReturn                         -15.0672
__unnamed_task__/MinReturn                         -66.8623
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.28551
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:41:13 | [maml_trainer] epoch #97 | Sampling for adapation and meta-testing...
2025-04-03 02:42:46 | [maml_trainer] epoch #97 | Finished meta-testing...
2025-04-03 02:42:46 | [maml_trainer] epoch #97 | Saving snapshot...
2025-04-03 02:43:08 | [maml_trainer] epoch #97 | Saved
2025-04-03 02:43:08 | [maml_trainer] epoch #97 | Time 46210.28 s
2025-04-03 02:43:08 | [maml_trainer] epoch #97 | EpochTime 490.11 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.6243
Average/AverageReturn                              -40.5101
Average/Iteration                                   97
Average/MaxReturn                                   16.5683
Average/MinReturn                                  -78.6654
Average/NumEpisodes                                 80
Average/StdReturn                                   11.8464
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95824
GaussianMLPPolicy/KLAfter                            0.00639798
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000117659
GaussianMLPPolicy/LossBefore                         8.01682e-09
GaussianMLPPolicy/dLoss                              0.000117667
Iteration                                           97
MetaTest/Average/AverageDiscountedReturn           -38.3594
MetaTest/Average/AverageReturn                     -38.3594
MetaTest/Average/Iteration                          97
MetaTest/Average/MaxReturn                         -13.2402
MetaTest/Average/MinReturn                         -51.1648
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.69692
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.3594
MetaTest/__unnamed_task__/AverageReturn            -38.3594
MetaTest/__unnamed_task__/Iteration                 97
MetaTest/__unnamed_task__/MaxReturn                -13.2402
MetaTest/__unnamed_task__/MinReturn                -51.1648
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.69692
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.136e+06
__unnamed_task__/AverageDiscountedReturn           -17.6243
__unnamed_task__/AverageReturn                     -40.5101
__unnamed_task__/Iteration                          97
__unnamed_task__/MaxReturn                          16.5683
__unnamed_task__/MinReturn                         -78.6654
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.8464
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:49:16 | [maml_trainer] epoch #98 | Sampling for adapation and meta-testing...
2025-04-03 02:50:49 | [maml_trainer] epoch #98 | Finished meta-testing...
2025-04-03 02:50:49 | [maml_trainer] epoch #98 | Saving snapshot...
2025-04-03 02:51:14 | [maml_trainer] epoch #98 | Saved
2025-04-03 02:51:14 | [maml_trainer] epoch #98 | Time 46696.03 s
2025-04-03 02:51:14 | [maml_trainer] epoch #98 | EpochTime 485.75 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.464
Average/AverageReturn                              -40.9019
Average/Iteration                                   98
Average/MaxReturn                                  -22.3025
Average/MinReturn                                  -71.5507
Average/NumEpisodes                                 80
Average/StdReturn                                    9.70238
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95795
GaussianMLPPolicy/KLAfter                            0.00531835
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.09889e-05
GaussianMLPPolicy/LossBefore                         1.00732e-08
GaussianMLPPolicy/dLoss                              4.09989e-05
Iteration                                           98
MetaTest/Average/AverageDiscountedReturn           -35.746
MetaTest/Average/AverageReturn                     -35.746
MetaTest/Average/Iteration                          98
MetaTest/Average/MaxReturn                         -23.507
MetaTest/Average/MinReturn                         -52.6672
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.26188
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.746
MetaTest/__unnamed_task__/AverageReturn            -35.746
MetaTest/__unnamed_task__/Iteration                 98
MetaTest/__unnamed_task__/MaxReturn                -23.507
MetaTest/__unnamed_task__/MinReturn                -52.6672
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.26188
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.168e+06
__unnamed_task__/AverageDiscountedReturn           -17.464
__unnamed_task__/AverageReturn                     -40.9019
__unnamed_task__/Iteration                          98
__unnamed_task__/MaxReturn                         -22.3025
__unnamed_task__/MinReturn                         -71.5507
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.70238
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 02:57:30 | [maml_trainer] epoch #99 | Sampling for adapation and meta-testing...
2025-04-03 02:59:02 | [maml_trainer] epoch #99 | Finished meta-testing...
2025-04-03 02:59:02 | [maml_trainer] epoch #99 | Saving snapshot...
2025-04-03 02:59:26 | [maml_trainer] epoch #99 | Saved
2025-04-03 02:59:26 | [maml_trainer] epoch #99 | Time 47188.04 s
2025-04-03 02:59:26 | [maml_trainer] epoch #99 | EpochTime 492.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7718
Average/AverageReturn                              -37.5531
Average/Iteration                                   99
Average/MaxReturn                                   28.7495
Average/MinReturn                                  -73.2578
Average/NumEpisodes                                 80
Average/StdReturn                                   12.8464
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95782
GaussianMLPPolicy/KLAfter                            0.00541757
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.1316e-05
GaussianMLPPolicy/LossBefore                         1.25766e-08
GaussianMLPPolicy/dLoss                             -7.13034e-05
Iteration                                           99
MetaTest/Average/AverageDiscountedReturn           -43.3502
MetaTest/Average/AverageReturn                     -43.3502
MetaTest/Average/Iteration                          99
MetaTest/Average/MaxReturn                         -24.5432
MetaTest/Average/MinReturn                         -62.7711
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.4714
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.3502
MetaTest/__unnamed_task__/AverageReturn            -43.3502
MetaTest/__unnamed_task__/Iteration                 99
MetaTest/__unnamed_task__/MaxReturn                -24.5432
MetaTest/__unnamed_task__/MinReturn                -62.7711
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.4714
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.2e+06
__unnamed_task__/AverageDiscountedReturn           -16.7718
__unnamed_task__/AverageReturn                     -37.5531
__unnamed_task__/Iteration                          99
__unnamed_task__/MaxReturn                          28.7495
__unnamed_task__/MinReturn                         -73.2578
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.8464
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:05:37 | [maml_trainer] epoch #100 | Sampling for adapation and meta-testing...
2025-04-03 03:07:09 | [maml_trainer] epoch #100 | Finished meta-testing...
2025-04-03 03:07:09 | [maml_trainer] epoch #100 | Saving snapshot...
2025-04-03 03:07:31 | [maml_trainer] epoch #100 | Saved
2025-04-03 03:07:31 | [maml_trainer] epoch #100 | Time 47673.45 s
2025-04-03 03:07:31 | [maml_trainer] epoch #100 | EpochTime 485.41 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.7745
Average/AverageReturn                              -41.1732
Average/Iteration                                  100
Average/MaxReturn                                  -25.4925
Average/MinReturn                                  -62.241
Average/NumEpisodes                                 80
Average/StdReturn                                    8.55025
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95708
GaussianMLPPolicy/KLAfter                            0.00221227
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000115284
GaussianMLPPolicy/LossBefore                        -2.26498e-08
GaussianMLPPolicy/dLoss                             -0.000115307
Iteration                                          100
MetaTest/Average/AverageDiscountedReturn           -34.5186
MetaTest/Average/AverageReturn                     -34.5186
MetaTest/Average/Iteration                         100
MetaTest/Average/MaxReturn                         -15.3712
MetaTest/Average/MinReturn                         -46.8962
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.77272
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.5186
MetaTest/__unnamed_task__/AverageReturn            -34.5186
MetaTest/__unnamed_task__/Iteration                100
MetaTest/__unnamed_task__/MaxReturn                -15.3712
MetaTest/__unnamed_task__/MinReturn                -46.8962
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.77272
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.232e+06
__unnamed_task__/AverageDiscountedReturn           -17.7745
__unnamed_task__/AverageReturn                     -41.1732
__unnamed_task__/Iteration                         100
__unnamed_task__/MaxReturn                         -25.4925
__unnamed_task__/MinReturn                         -62.241
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.55025
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:13:36 | [maml_trainer] epoch #101 | Sampling for adapation and meta-testing...
2025-04-03 03:15:10 | [maml_trainer] epoch #101 | Finished meta-testing...
2025-04-03 03:15:10 | [maml_trainer] epoch #101 | Saving snapshot...
2025-04-03 03:15:33 | [maml_trainer] epoch #101 | Saved
2025-04-03 03:15:33 | [maml_trainer] epoch #101 | Time 48155.67 s
2025-04-03 03:15:33 | [maml_trainer] epoch #101 | EpochTime 482.22 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.6579
Average/AverageReturn                              -40.7877
Average/Iteration                                  101
Average/MaxReturn                                   -7.5641
Average/MinReturn                                  -77.8875
Average/NumEpisodes                                 80
Average/StdReturn                                   13.0655
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95488
GaussianMLPPolicy/KLAfter                            0.00330854
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000100518
GaussianMLPPolicy/LossBefore                         2.32458e-09
GaussianMLPPolicy/dLoss                             -0.000100516
Iteration                                          101
MetaTest/Average/AverageDiscountedReturn           -39.3629
MetaTest/Average/AverageReturn                     -39.3629
MetaTest/Average/Iteration                         101
MetaTest/Average/MaxReturn                         -21.336
MetaTest/Average/MinReturn                         -62.1134
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.2632
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.3629
MetaTest/__unnamed_task__/AverageReturn            -39.3629
MetaTest/__unnamed_task__/Iteration                101
MetaTest/__unnamed_task__/MaxReturn                -21.336
MetaTest/__unnamed_task__/MinReturn                -62.1134
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.2632
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.264e+06
__unnamed_task__/AverageDiscountedReturn           -17.6579
__unnamed_task__/AverageReturn                     -40.7877
__unnamed_task__/Iteration                         101
__unnamed_task__/MaxReturn                          -7.5641
__unnamed_task__/MinReturn                         -77.8875
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.0655
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:21:42 | [maml_trainer] epoch #102 | Sampling for adapation and meta-testing...
2025-04-03 03:23:15 | [maml_trainer] epoch #102 | Finished meta-testing...
2025-04-03 03:23:15 | [maml_trainer] epoch #102 | Saving snapshot...
2025-04-03 03:23:38 | [maml_trainer] epoch #102 | Saved
2025-04-03 03:23:38 | [maml_trainer] epoch #102 | Time 48640.46 s
2025-04-03 03:23:38 | [maml_trainer] epoch #102 | EpochTime 484.78 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.2264
Average/AverageReturn                              -41.9759
Average/Iteration                                  102
Average/MaxReturn                                   -1.61894
Average/MinReturn                                  -72.5258
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4979
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95198
GaussianMLPPolicy/KLAfter                            0.00412758
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.22371e-05
GaussianMLPPolicy/LossBefore                        -1.21891e-08
GaussianMLPPolicy/dLoss                             -5.22493e-05
Iteration                                          102
MetaTest/Average/AverageDiscountedReturn           -42.0439
MetaTest/Average/AverageReturn                     -42.0439
MetaTest/Average/Iteration                         102
MetaTest/Average/MaxReturn                         -23.7473
MetaTest/Average/MinReturn                         -73.4332
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.6146
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.0439
MetaTest/__unnamed_task__/AverageReturn            -42.0439
MetaTest/__unnamed_task__/Iteration                102
MetaTest/__unnamed_task__/MaxReturn                -23.7473
MetaTest/__unnamed_task__/MinReturn                -73.4332
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.6146
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.296e+06
__unnamed_task__/AverageDiscountedReturn           -18.2264
__unnamed_task__/AverageReturn                     -41.9759
__unnamed_task__/Iteration                         102
__unnamed_task__/MaxReturn                          -1.61894
__unnamed_task__/MinReturn                         -72.5258
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4979
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:29:50 | [maml_trainer] epoch #103 | Sampling for adapation and meta-testing...
2025-04-03 03:31:21 | [maml_trainer] epoch #103 | Finished meta-testing...
2025-04-03 03:31:21 | [maml_trainer] epoch #103 | Saving snapshot...
2025-04-03 03:31:43 | [maml_trainer] epoch #103 | Saved
2025-04-03 03:31:43 | [maml_trainer] epoch #103 | Time 49125.09 s
2025-04-03 03:31:43 | [maml_trainer] epoch #103 | EpochTime 484.63 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.3073
Average/AverageReturn                              -42.3363
Average/Iteration                                  103
Average/MaxReturn                                  -19.0742
Average/MinReturn                                  -74.7329
Average/NumEpisodes                                 80
Average/StdReturn                                   12.2155
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.951
GaussianMLPPolicy/KLAfter                            0.00322561
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000296563
GaussianMLPPolicy/LossBefore                        -1.07884e-08
GaussianMLPPolicy/dLoss                              0.000296552
Iteration                                          103
MetaTest/Average/AverageDiscountedReturn           -38.8653
MetaTest/Average/AverageReturn                     -38.8653
MetaTest/Average/Iteration                         103
MetaTest/Average/MaxReturn                          -7.34097
MetaTest/Average/MinReturn                         -62.6371
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.5137
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.8653
MetaTest/__unnamed_task__/AverageReturn            -38.8653
MetaTest/__unnamed_task__/Iteration                103
MetaTest/__unnamed_task__/MaxReturn                 -7.34097
MetaTest/__unnamed_task__/MinReturn                -62.6371
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.5137
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.328e+06
__unnamed_task__/AverageDiscountedReturn           -18.3073
__unnamed_task__/AverageReturn                     -42.3363
__unnamed_task__/Iteration                         103
__unnamed_task__/MaxReturn                         -19.0742
__unnamed_task__/MinReturn                         -74.7329
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.2155
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:37:54 | [maml_trainer] epoch #104 | Sampling for adapation and meta-testing...
2025-04-03 03:39:25 | [maml_trainer] epoch #104 | Finished meta-testing...
2025-04-03 03:39:25 | [maml_trainer] epoch #104 | Saving snapshot...
2025-04-03 03:39:49 | [maml_trainer] epoch #104 | Saved
2025-04-03 03:39:49 | [maml_trainer] epoch #104 | Time 49611.74 s
2025-04-03 03:39:49 | [maml_trainer] epoch #104 | EpochTime 486.65 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.0809
Average/AverageReturn                              -38.2423
Average/Iteration                                  104
Average/MaxReturn                                  -15.7197
Average/MinReturn                                  -61.9313
Average/NumEpisodes                                 80
Average/StdReturn                                    8.94706
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95071
GaussianMLPPolicy/KLAfter                            0.00389881
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.90841e-05
GaussianMLPPolicy/LossBefore                         1.13249e-09
GaussianMLPPolicy/dLoss                             -9.9083e-05
Iteration                                          104
MetaTest/Average/AverageDiscountedReturn           -33.2135
MetaTest/Average/AverageReturn                     -33.2135
MetaTest/Average/Iteration                         104
MetaTest/Average/MaxReturn                          -8.15125
MetaTest/Average/MinReturn                         -51.1345
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.06292
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.2135
MetaTest/__unnamed_task__/AverageReturn            -33.2135
MetaTest/__unnamed_task__/Iteration                104
MetaTest/__unnamed_task__/MaxReturn                 -8.15125
MetaTest/__unnamed_task__/MinReturn                -51.1345
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.06292
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.36e+06
__unnamed_task__/AverageDiscountedReturn           -17.0809
__unnamed_task__/AverageReturn                     -38.2423
__unnamed_task__/Iteration                         104
__unnamed_task__/MaxReturn                         -15.7197
__unnamed_task__/MinReturn                         -61.9313
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.94706
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:45:56 | [maml_trainer] epoch #105 | Sampling for adapation and meta-testing...
2025-04-03 03:47:28 | [maml_trainer] epoch #105 | Finished meta-testing...
2025-04-03 03:47:28 | [maml_trainer] epoch #105 | Saving snapshot...
2025-04-03 03:47:51 | [maml_trainer] epoch #105 | Saved
2025-04-03 03:47:51 | [maml_trainer] epoch #105 | Time 50093.54 s
2025-04-03 03:47:51 | [maml_trainer] epoch #105 | EpochTime 481.79 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.6572
Average/AverageReturn                              -36.4525
Average/Iteration                                  105
Average/MaxReturn                                   16.7605
Average/MinReturn                                  -62.6546
Average/NumEpisodes                                 80
Average/StdReturn                                   11.9457
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95114
GaussianMLPPolicy/KLAfter                            0.00483998
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000241933
GaussianMLPPolicy/LossBefore                         4.41074e-09
GaussianMLPPolicy/dLoss                             -0.000241928
Iteration                                          105
MetaTest/Average/AverageDiscountedReturn           -39.4823
MetaTest/Average/AverageReturn                     -39.4823
MetaTest/Average/Iteration                         105
MetaTest/Average/MaxReturn                          10.9591
MetaTest/Average/MinReturn                         -61.0834
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.1697
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.4823
MetaTest/__unnamed_task__/AverageReturn            -39.4823
MetaTest/__unnamed_task__/Iteration                105
MetaTest/__unnamed_task__/MaxReturn                 10.9591
MetaTest/__unnamed_task__/MinReturn                -61.0834
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.1697
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.392e+06
__unnamed_task__/AverageDiscountedReturn           -16.6572
__unnamed_task__/AverageReturn                     -36.4525
__unnamed_task__/Iteration                         105
__unnamed_task__/MaxReturn                          16.7605
__unnamed_task__/MinReturn                         -62.6546
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.9457
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 03:54:04 | [maml_trainer] epoch #106 | Sampling for adapation and meta-testing...
2025-04-03 03:55:36 | [maml_trainer] epoch #106 | Finished meta-testing...
2025-04-03 03:55:36 | [maml_trainer] epoch #106 | Saving snapshot...
2025-04-03 03:55:58 | [maml_trainer] epoch #106 | Saved
2025-04-03 03:55:58 | [maml_trainer] epoch #106 | Time 50580.71 s
2025-04-03 03:55:58 | [maml_trainer] epoch #106 | EpochTime 487.17 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2814
Average/AverageReturn                              -35.5491
Average/Iteration                                  106
Average/MaxReturn                                   -4.19546
Average/MinReturn                                  -69.94
Average/NumEpisodes                                 80
Average/StdReturn                                    9.82585
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95102
GaussianMLPPolicy/KLAfter                            0.00390006
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.22361e-06
GaussianMLPPolicy/LossBefore                         1.38879e-08
GaussianMLPPolicy/dLoss                              2.2375e-06
Iteration                                          106
MetaTest/Average/AverageDiscountedReturn           -32.4641
MetaTest/Average/AverageReturn                     -32.4641
MetaTest/Average/Iteration                         106
MetaTest/Average/MaxReturn                         -16.2252
MetaTest/Average/MinReturn                         -48.456
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.10761
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.4641
MetaTest/__unnamed_task__/AverageReturn            -32.4641
MetaTest/__unnamed_task__/Iteration                106
MetaTest/__unnamed_task__/MaxReturn                -16.2252
MetaTest/__unnamed_task__/MinReturn                -48.456
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.10761
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.424e+06
__unnamed_task__/AverageDiscountedReturn           -16.2814
__unnamed_task__/AverageReturn                     -35.5491
__unnamed_task__/Iteration                         106
__unnamed_task__/MaxReturn                          -4.19546
__unnamed_task__/MinReturn                         -69.94
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.82585
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:02:06 | [maml_trainer] epoch #107 | Sampling for adapation and meta-testing...
2025-04-03 04:03:40 | [maml_trainer] epoch #107 | Finished meta-testing...
2025-04-03 04:03:40 | [maml_trainer] epoch #107 | Saving snapshot...
2025-04-03 04:04:03 | [maml_trainer] epoch #107 | Saved
2025-04-03 04:04:03 | [maml_trainer] epoch #107 | Time 51065.55 s
2025-04-03 04:04:03 | [maml_trainer] epoch #107 | EpochTime 484.83 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8679
Average/AverageReturn                              -36.3928
Average/Iteration                                  107
Average/MaxReturn                                   40.2488
Average/MinReturn                                  -59.8314
Average/NumEpisodes                                 80
Average/StdReturn                                   12.348
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.95012
GaussianMLPPolicy/KLAfter                            0.00469732
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000105643
GaussianMLPPolicy/LossBefore                         1.83284e-08
GaussianMLPPolicy/dLoss                              0.000105661
Iteration                                          107
MetaTest/Average/AverageDiscountedReturn           -33.9245
MetaTest/Average/AverageReturn                     -33.9245
MetaTest/Average/Iteration                         107
MetaTest/Average/MaxReturn                           4.95173
MetaTest/Average/MinReturn                         -56.8449
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.2356
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.9245
MetaTest/__unnamed_task__/AverageReturn            -33.9245
MetaTest/__unnamed_task__/Iteration                107
MetaTest/__unnamed_task__/MaxReturn                  4.95173
MetaTest/__unnamed_task__/MinReturn                -56.8449
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.2356
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.456e+06
__unnamed_task__/AverageDiscountedReturn           -16.8679
__unnamed_task__/AverageReturn                     -36.3928
__unnamed_task__/Iteration                         107
__unnamed_task__/MaxReturn                          40.2488
__unnamed_task__/MinReturn                         -59.8314
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.348
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:10:13 | [maml_trainer] epoch #108 | Sampling for adapation and meta-testing...
2025-04-03 04:11:44 | [maml_trainer] epoch #108 | Finished meta-testing...
2025-04-03 04:11:44 | [maml_trainer] epoch #108 | Saving snapshot...
2025-04-03 04:12:08 | [maml_trainer] epoch #108 | Saved
2025-04-03 04:12:08 | [maml_trainer] epoch #108 | Time 51550.24 s
2025-04-03 04:12:08 | [maml_trainer] epoch #108 | EpochTime 484.69 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8777
Average/AverageReturn                              -36.2397
Average/Iteration                                  108
Average/MaxReturn                                   -5.93125
Average/MinReturn                                  -65.1065
Average/NumEpisodes                                 80
Average/StdReturn                                   11.5544
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94817
GaussianMLPPolicy/KLAfter                            0.00244155
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.89609e-05
GaussianMLPPolicy/LossBefore                        -7.15256e-10
GaussianMLPPolicy/dLoss                              7.89602e-05
Iteration                                          108
MetaTest/Average/AverageDiscountedReturn           -36.2153
MetaTest/Average/AverageReturn                     -36.2153
MetaTest/Average/Iteration                         108
MetaTest/Average/MaxReturn                          -2.16105
MetaTest/Average/MinReturn                         -77.5375
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.161
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.2153
MetaTest/__unnamed_task__/AverageReturn            -36.2153
MetaTest/__unnamed_task__/Iteration                108
MetaTest/__unnamed_task__/MaxReturn                 -2.16105
MetaTest/__unnamed_task__/MinReturn                -77.5375
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.161
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.488e+06
__unnamed_task__/AverageDiscountedReturn           -16.8777
__unnamed_task__/AverageReturn                     -36.2397
__unnamed_task__/Iteration                         108
__unnamed_task__/MaxReturn                          -5.93125
__unnamed_task__/MinReturn                         -65.1065
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.5544
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:18:21 | [maml_trainer] epoch #109 | Sampling for adapation and meta-testing...
2025-04-03 04:19:52 | [maml_trainer] epoch #109 | Finished meta-testing...
2025-04-03 04:19:52 | [maml_trainer] epoch #109 | Saving snapshot...
2025-04-03 04:20:16 | [maml_trainer] epoch #109 | Saved
2025-04-03 04:20:16 | [maml_trainer] epoch #109 | Time 52038.04 s
2025-04-03 04:20:16 | [maml_trainer] epoch #109 | EpochTime 487.80 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0746
Average/AverageReturn                              -33.4558
Average/Iteration                                  109
Average/MaxReturn                                   21.6366
Average/MinReturn                                  -63.2221
Average/NumEpisodes                                 80
Average/StdReturn                                   15.6505
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94589
GaussianMLPPolicy/KLAfter                            0.00216199
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.34377e-05
GaussianMLPPolicy/LossBefore                        -3.18885e-09
GaussianMLPPolicy/dLoss                              9.34345e-05
Iteration                                          109
MetaTest/Average/AverageDiscountedReturn           -30.1503
MetaTest/Average/AverageReturn                     -30.1503
MetaTest/Average/Iteration                         109
MetaTest/Average/MaxReturn                         -13.3589
MetaTest/Average/MinReturn                         -44.6463
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.24282
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.1503
MetaTest/__unnamed_task__/AverageReturn            -30.1503
MetaTest/__unnamed_task__/Iteration                109
MetaTest/__unnamed_task__/MaxReturn                -13.3589
MetaTest/__unnamed_task__/MinReturn                -44.6463
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.24282
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.52e+06
__unnamed_task__/AverageDiscountedReturn           -16.0746
__unnamed_task__/AverageReturn                     -33.4558
__unnamed_task__/Iteration                         109
__unnamed_task__/MaxReturn                          21.6366
__unnamed_task__/MinReturn                         -63.2221
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.6505
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:26:19 | [maml_trainer] epoch #110 | Sampling for adapation and meta-testing...
2025-04-03 04:27:52 | [maml_trainer] epoch #110 | Finished meta-testing...
2025-04-03 04:27:52 | [maml_trainer] epoch #110 | Saving snapshot...
2025-04-03 04:28:15 | [maml_trainer] epoch #110 | Saved
2025-04-03 04:28:15 | [maml_trainer] epoch #110 | Time 52517.77 s
2025-04-03 04:28:15 | [maml_trainer] epoch #110 | EpochTime 479.73 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0475
Average/AverageReturn                              -34.2287
Average/Iteration                                  110
Average/MaxReturn                                  -10.1957
Average/MinReturn                                  -69.0882
Average/NumEpisodes                                 80
Average/StdReturn                                   11.9169
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94455
GaussianMLPPolicy/KLAfter                            0.00175638
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.61312e-05
GaussianMLPPolicy/LossBefore                         9.65595e-09
GaussianMLPPolicy/dLoss                             -3.61215e-05
Iteration                                          110
MetaTest/Average/AverageDiscountedReturn           -33.4653
MetaTest/Average/AverageReturn                     -33.4653
MetaTest/Average/Iteration                         110
MetaTest/Average/MaxReturn                         -18.7472
MetaTest/Average/MinReturn                         -52.0774
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.0227
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.4653
MetaTest/__unnamed_task__/AverageReturn            -33.4653
MetaTest/__unnamed_task__/Iteration                110
MetaTest/__unnamed_task__/MaxReturn                -18.7472
MetaTest/__unnamed_task__/MinReturn                -52.0774
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.0227
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.552e+06
__unnamed_task__/AverageDiscountedReturn           -16.0475
__unnamed_task__/AverageReturn                     -34.2287
__unnamed_task__/Iteration                         110
__unnamed_task__/MaxReturn                         -10.1957
__unnamed_task__/MinReturn                         -69.0882
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.9169
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:34:22 | [maml_trainer] epoch #111 | Sampling for adapation and meta-testing...
2025-04-03 04:35:53 | [maml_trainer] epoch #111 | Finished meta-testing...
2025-04-03 04:35:53 | [maml_trainer] epoch #111 | Saving snapshot...
2025-04-03 04:36:15 | [maml_trainer] epoch #111 | Saved
2025-04-03 04:36:15 | [maml_trainer] epoch #111 | Time 52997.95 s
2025-04-03 04:36:15 | [maml_trainer] epoch #111 | EpochTime 480.17 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6452
Average/AverageReturn                              -32.9544
Average/Iteration                                  111
Average/MaxReturn                                    8.86432
Average/MinReturn                                  -71.8964
Average/NumEpisodes                                 80
Average/StdReturn                                   13.1403
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94299
GaussianMLPPolicy/KLAfter                            0.00161781
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.81875e-05
GaussianMLPPolicy/LossBefore                         3.18885e-09
GaussianMLPPolicy/dLoss                             -5.81843e-05
Iteration                                          111
MetaTest/Average/AverageDiscountedReturn           -33.5338
MetaTest/Average/AverageReturn                     -33.5338
MetaTest/Average/Iteration                         111
MetaTest/Average/MaxReturn                          -4.7911
MetaTest/Average/MinReturn                         -60.1726
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.4715
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.5338
MetaTest/__unnamed_task__/AverageReturn            -33.5338
MetaTest/__unnamed_task__/Iteration                111
MetaTest/__unnamed_task__/MaxReturn                 -4.7911
MetaTest/__unnamed_task__/MinReturn                -60.1726
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.4715
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.584e+06
__unnamed_task__/AverageDiscountedReturn           -15.6452
__unnamed_task__/AverageReturn                     -32.9544
__unnamed_task__/Iteration                         111
__unnamed_task__/MaxReturn                           8.86432
__unnamed_task__/MinReturn                         -71.8964
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.1403
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:42:25 | [maml_trainer] epoch #112 | Sampling for adapation and meta-testing...
2025-04-03 04:43:57 | [maml_trainer] epoch #112 | Finished meta-testing...
2025-04-03 04:43:57 | [maml_trainer] epoch #112 | Saving snapshot...
2025-04-03 04:44:22 | [maml_trainer] epoch #112 | Saved
2025-04-03 04:44:22 | [maml_trainer] epoch #112 | Time 53484.21 s
2025-04-03 04:44:22 | [maml_trainer] epoch #112 | EpochTime 486.26 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7218
Average/AverageReturn                              -35.4274
Average/Iteration                                  112
Average/MaxReturn                                   16.6019
Average/MinReturn                                  -62.584
Average/NumEpisodes                                 80
Average/StdReturn                                   13.8222
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.94104
GaussianMLPPolicy/KLAfter                            0.00225869
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000127381
GaussianMLPPolicy/LossBefore                         1.0848e-08
GaussianMLPPolicy/dLoss                             -0.00012737
Iteration                                          112
MetaTest/Average/AverageDiscountedReturn           -36.4849
MetaTest/Average/AverageReturn                     -36.4849
MetaTest/Average/Iteration                         112
MetaTest/Average/MaxReturn                         -13.9152
MetaTest/Average/MinReturn                         -63.5672
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.9924
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.4849
MetaTest/__unnamed_task__/AverageReturn            -36.4849
MetaTest/__unnamed_task__/Iteration                112
MetaTest/__unnamed_task__/MaxReturn                -13.9152
MetaTest/__unnamed_task__/MinReturn                -63.5672
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.9924
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.616e+06
__unnamed_task__/AverageDiscountedReturn           -16.7218
__unnamed_task__/AverageReturn                     -35.4274
__unnamed_task__/Iteration                         112
__unnamed_task__/MaxReturn                          16.6019
__unnamed_task__/MinReturn                         -62.584
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.8222
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:50:35 | [maml_trainer] epoch #113 | Sampling for adapation and meta-testing...
2025-04-03 04:52:07 | [maml_trainer] epoch #113 | Finished meta-testing...
2025-04-03 04:52:07 | [maml_trainer] epoch #113 | Saving snapshot...
2025-04-03 04:52:30 | [maml_trainer] epoch #113 | Saved
2025-04-03 04:52:30 | [maml_trainer] epoch #113 | Time 53972.94 s
2025-04-03 04:52:30 | [maml_trainer] epoch #113 | EpochTime 488.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4562
Average/AverageReturn                              -38.0378
Average/Iteration                                  113
Average/MaxReturn                                  -13.3221
Average/MinReturn                                  -68.1951
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6773
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93825
GaussianMLPPolicy/KLAfter                            0.00241692
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.17562e-05
GaussianMLPPolicy/LossBefore                         6.3777e-09
GaussianMLPPolicy/dLoss                             -1.17499e-05
Iteration                                          113
MetaTest/Average/AverageDiscountedReturn           -40.8645
MetaTest/Average/AverageReturn                     -40.8645
MetaTest/Average/Iteration                         113
MetaTest/Average/MaxReturn                         -21.2988
MetaTest/Average/MinReturn                         -59.3706
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.6652
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.8645
MetaTest/__unnamed_task__/AverageReturn            -40.8645
MetaTest/__unnamed_task__/Iteration                113
MetaTest/__unnamed_task__/MaxReturn                -21.2988
MetaTest/__unnamed_task__/MinReturn                -59.3706
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.6652
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.648e+06
__unnamed_task__/AverageDiscountedReturn           -17.4562
__unnamed_task__/AverageReturn                     -38.0378
__unnamed_task__/Iteration                         113
__unnamed_task__/MaxReturn                         -13.3221
__unnamed_task__/MinReturn                         -68.1951
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6773
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 04:58:38 | [maml_trainer] epoch #114 | Sampling for adapation and meta-testing...
2025-04-03 05:00:10 | [maml_trainer] epoch #114 | Finished meta-testing...
2025-04-03 05:00:10 | [maml_trainer] epoch #114 | Saving snapshot...
2025-04-03 05:00:32 | [maml_trainer] epoch #114 | Saved
2025-04-03 05:00:32 | [maml_trainer] epoch #114 | Time 54454.70 s
2025-04-03 05:00:32 | [maml_trainer] epoch #114 | EpochTime 481.76 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2584
Average/AverageReturn                              -34.4312
Average/Iteration                                  114
Average/MaxReturn                                   16.5494
Average/MinReturn                                  -62.9391
Average/NumEpisodes                                 80
Average/StdReturn                                   13.6154
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93609
GaussianMLPPolicy/KLAfter                            0.00543412
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000104532
GaussianMLPPolicy/LossBefore                        -1.71363e-08
GaussianMLPPolicy/dLoss                              0.000104515
Iteration                                          114
MetaTest/Average/AverageDiscountedReturn           -36.1241
MetaTest/Average/AverageReturn                     -36.1241
MetaTest/Average/Iteration                         114
MetaTest/Average/MaxReturn                          -3.27872
MetaTest/Average/MinReturn                         -55.6682
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.9475
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.1241
MetaTest/__unnamed_task__/AverageReturn            -36.1241
MetaTest/__unnamed_task__/Iteration                114
MetaTest/__unnamed_task__/MaxReturn                 -3.27872
MetaTest/__unnamed_task__/MinReturn                -55.6682
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.9475
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.68e+06
__unnamed_task__/AverageDiscountedReturn           -16.2584
__unnamed_task__/AverageReturn                     -34.4312
__unnamed_task__/Iteration                         114
__unnamed_task__/MaxReturn                          16.5494
__unnamed_task__/MinReturn                         -62.9391
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.6154
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:06:37 | [maml_trainer] epoch #115 | Sampling for adapation and meta-testing...
2025-04-03 05:08:10 | [maml_trainer] epoch #115 | Finished meta-testing...
2025-04-03 05:08:10 | [maml_trainer] epoch #115 | Saving snapshot...
2025-04-03 05:08:33 | [maml_trainer] epoch #115 | Saved
2025-04-03 05:08:33 | [maml_trainer] epoch #115 | Time 54935.45 s
2025-04-03 05:08:33 | [maml_trainer] epoch #115 | EpochTime 480.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.8462
Average/AverageReturn                              -34.496
Average/Iteration                                  115
Average/MaxReturn                                   -2.40317
Average/MinReturn                                  -62.3039
Average/NumEpisodes                                 80
Average/StdReturn                                   10.5717
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93413
GaussianMLPPolicy/KLAfter                            0.00360903
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000149982
GaussianMLPPolicy/LossBefore                         2.14577e-09
GaussianMLPPolicy/dLoss                              0.000149984
Iteration                                          115
MetaTest/Average/AverageDiscountedReturn           -30.45
MetaTest/Average/AverageReturn                     -30.45
MetaTest/Average/Iteration                         115
MetaTest/Average/MaxReturn                         -22.3604
MetaTest/Average/MinReturn                         -45.7292
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.66179
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.45
MetaTest/__unnamed_task__/AverageReturn            -30.45
MetaTest/__unnamed_task__/Iteration                115
MetaTest/__unnamed_task__/MaxReturn                -22.3604
MetaTest/__unnamed_task__/MinReturn                -45.7292
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.66179
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.712e+06
__unnamed_task__/AverageDiscountedReturn           -15.8462
__unnamed_task__/AverageReturn                     -34.496
__unnamed_task__/Iteration                         115
__unnamed_task__/MaxReturn                          -2.40317
__unnamed_task__/MinReturn                         -62.3039
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.5717
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:14:41 | [maml_trainer] epoch #116 | Sampling for adapation and meta-testing...
2025-04-03 05:16:13 | [maml_trainer] epoch #116 | Finished meta-testing...
2025-04-03 05:16:13 | [maml_trainer] epoch #116 | Saving snapshot...
2025-04-03 05:16:36 | [maml_trainer] epoch #116 | Saved
2025-04-03 05:16:36 | [maml_trainer] epoch #116 | Time 55418.49 s
2025-04-03 05:16:36 | [maml_trainer] epoch #116 | EpochTime 483.04 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.0831
Average/AverageReturn                              -37.2079
Average/Iteration                                  116
Average/MaxReturn                                   -1.07445
Average/MinReturn                                  -67.9573
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4039
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93105
GaussianMLPPolicy/KLAfter                            0.00303035
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.3573e-05
GaussianMLPPolicy/LossBefore                        -6.85453e-09
GaussianMLPPolicy/dLoss                              3.35662e-05
Iteration                                          116
MetaTest/Average/AverageDiscountedReturn           -29.8931
MetaTest/Average/AverageReturn                     -29.8931
MetaTest/Average/Iteration                         116
MetaTest/Average/MaxReturn                          -1.55061
MetaTest/Average/MinReturn                         -54.9734
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.0768
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.8931
MetaTest/__unnamed_task__/AverageReturn            -29.8931
MetaTest/__unnamed_task__/Iteration                116
MetaTest/__unnamed_task__/MaxReturn                 -1.55061
MetaTest/__unnamed_task__/MinReturn                -54.9734
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.0768
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.744e+06
__unnamed_task__/AverageDiscountedReturn           -17.0831
__unnamed_task__/AverageReturn                     -37.2079
__unnamed_task__/Iteration                         116
__unnamed_task__/MaxReturn                          -1.07445
__unnamed_task__/MinReturn                         -67.9573
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4039
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:22:43 | [maml_trainer] epoch #117 | Sampling for adapation and meta-testing...
2025-04-03 05:24:15 | [maml_trainer] epoch #117 | Finished meta-testing...
2025-04-03 05:24:15 | [maml_trainer] epoch #117 | Saving snapshot...
2025-04-03 05:24:38 | [maml_trainer] epoch #117 | Saved
2025-04-03 05:24:38 | [maml_trainer] epoch #117 | Time 55900.97 s
2025-04-03 05:24:38 | [maml_trainer] epoch #117 | EpochTime 482.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.1392
Average/AverageReturn                              -37.3282
Average/Iteration                                  117
Average/MaxReturn                                   -4.25129
Average/MinReturn                                  -62.1453
Average/NumEpisodes                                 80
Average/StdReturn                                   11.3516
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92779
GaussianMLPPolicy/KLAfter                            0.00294106
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000184538
GaussianMLPPolicy/LossBefore                        -5.96046e-10
GaussianMLPPolicy/dLoss                              0.000184538
Iteration                                          117
MetaTest/Average/AverageDiscountedReturn           -36.482
MetaTest/Average/AverageReturn                     -36.482
MetaTest/Average/Iteration                         117
MetaTest/Average/MaxReturn                         -18.4848
MetaTest/Average/MinReturn                         -57.1253
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.74635
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.482
MetaTest/__unnamed_task__/AverageReturn            -36.482
MetaTest/__unnamed_task__/Iteration                117
MetaTest/__unnamed_task__/MaxReturn                -18.4848
MetaTest/__unnamed_task__/MinReturn                -57.1253
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.74635
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.776e+06
__unnamed_task__/AverageDiscountedReturn           -17.1392
__unnamed_task__/AverageReturn                     -37.3282
__unnamed_task__/Iteration                         117
__unnamed_task__/MaxReturn                          -4.25129
__unnamed_task__/MinReturn                         -62.1453
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.3516
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:30:47 | [maml_trainer] epoch #118 | Sampling for adapation and meta-testing...
2025-04-03 05:32:19 | [maml_trainer] epoch #118 | Finished meta-testing...
2025-04-03 05:32:19 | [maml_trainer] epoch #118 | Saving snapshot...
2025-04-03 05:32:42 | [maml_trainer] epoch #118 | Saved
2025-04-03 05:32:42 | [maml_trainer] epoch #118 | Time 56384.50 s
2025-04-03 05:32:42 | [maml_trainer] epoch #118 | EpochTime 483.52 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6694
Average/AverageReturn                              -33.9758
Average/Iteration                                  118
Average/MaxReturn                                   18.1689
Average/MinReturn                                  -57.505
Average/NumEpisodes                                 80
Average/StdReturn                                   13.1042
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9247
GaussianMLPPolicy/KLAfter                            0.00177
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000160755
GaussianMLPPolicy/LossBefore                         1.2517e-09
GaussianMLPPolicy/dLoss                             -0.000160754
Iteration                                          118
MetaTest/Average/AverageDiscountedReturn           -41.5438
MetaTest/Average/AverageReturn                     -41.5438
MetaTest/Average/Iteration                         118
MetaTest/Average/MaxReturn                         -22.1755
MetaTest/Average/MinReturn                         -60.23
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.21929
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.5438
MetaTest/__unnamed_task__/AverageReturn            -41.5438
MetaTest/__unnamed_task__/Iteration                118
MetaTest/__unnamed_task__/MaxReturn                -22.1755
MetaTest/__unnamed_task__/MinReturn                -60.23
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.21929
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.808e+06
__unnamed_task__/AverageDiscountedReturn           -15.6694
__unnamed_task__/AverageReturn                     -33.9758
__unnamed_task__/Iteration                         118
__unnamed_task__/MaxReturn                          18.1689
__unnamed_task__/MinReturn                         -57.505
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.1042
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:38:52 | [maml_trainer] epoch #119 | Sampling for adapation and meta-testing...
2025-04-03 05:40:24 | [maml_trainer] epoch #119 | Finished meta-testing...
2025-04-03 05:40:24 | [maml_trainer] epoch #119 | Saving snapshot...
2025-04-03 05:40:47 | [maml_trainer] epoch #119 | Saved
2025-04-03 05:40:47 | [maml_trainer] epoch #119 | Time 56869.39 s
2025-04-03 05:40:47 | [maml_trainer] epoch #119 | EpochTime 484.89 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.648
Average/AverageReturn                              -36.8016
Average/Iteration                                  119
Average/MaxReturn                                   -9.39231
Average/MinReturn                                  -68.6982
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4507
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92072
GaussianMLPPolicy/KLAfter                            0.00143721
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000197311
GaussianMLPPolicy/LossBefore                        -8.22544e-09
GaussianMLPPolicy/dLoss                              0.000197303
Iteration                                          119
MetaTest/Average/AverageDiscountedReturn           -32.823
MetaTest/Average/AverageReturn                     -32.823
MetaTest/Average/Iteration                         119
MetaTest/Average/MaxReturn                           1.73831
MetaTest/Average/MinReturn                         -49.0187
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.102
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.823
MetaTest/__unnamed_task__/AverageReturn            -32.823
MetaTest/__unnamed_task__/Iteration                119
MetaTest/__unnamed_task__/MaxReturn                  1.73831
MetaTest/__unnamed_task__/MinReturn                -49.0187
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.102
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.84e+06
__unnamed_task__/AverageDiscountedReturn           -16.648
__unnamed_task__/AverageReturn                     -36.8016
__unnamed_task__/Iteration                         119
__unnamed_task__/MaxReturn                          -9.39231
__unnamed_task__/MinReturn                         -68.6982
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4507
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:46:58 | [maml_trainer] epoch #120 | Sampling for adapation and meta-testing...
2025-04-03 05:48:30 | [maml_trainer] epoch #120 | Finished meta-testing...
2025-04-03 05:48:30 | [maml_trainer] epoch #120 | Saving snapshot...
2025-04-03 05:48:54 | [maml_trainer] epoch #120 | Saved
2025-04-03 05:48:54 | [maml_trainer] epoch #120 | Time 57356.87 s
2025-04-03 05:48:54 | [maml_trainer] epoch #120 | EpochTime 487.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4939
Average/AverageReturn                              -36.2104
Average/Iteration                                  120
Average/MaxReturn                                   -0.464909
Average/MinReturn                                  -72.1639
Average/NumEpisodes                                 80
Average/StdReturn                                   10.5211
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91785
GaussianMLPPolicy/KLAfter                            0.00137747
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000101188
GaussianMLPPolicy/LossBefore                         2.33054e-08
GaussianMLPPolicy/dLoss                              0.000101211
Iteration                                          120
MetaTest/Average/AverageDiscountedReturn           -34.2434
MetaTest/Average/AverageReturn                     -34.2434
MetaTest/Average/Iteration                         120
MetaTest/Average/MaxReturn                         -19.5476
MetaTest/Average/MinReturn                         -46.8693
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.5006
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.2434
MetaTest/__unnamed_task__/AverageReturn            -34.2434
MetaTest/__unnamed_task__/Iteration                120
MetaTest/__unnamed_task__/MaxReturn                -19.5476
MetaTest/__unnamed_task__/MinReturn                -46.8693
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.5006
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.872e+06
__unnamed_task__/AverageDiscountedReturn           -16.4939
__unnamed_task__/AverageReturn                     -36.2104
__unnamed_task__/Iteration                         120
__unnamed_task__/MaxReturn                          -0.464909
__unnamed_task__/MinReturn                         -72.1639
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.5211
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 05:55:07 | [maml_trainer] epoch #121 | Sampling for adapation and meta-testing...
2025-04-03 05:56:39 | [maml_trainer] epoch #121 | Finished meta-testing...
2025-04-03 05:56:39 | [maml_trainer] epoch #121 | Saving snapshot...
2025-04-03 05:57:03 | [maml_trainer] epoch #121 | Saved
2025-04-03 05:57:03 | [maml_trainer] epoch #121 | Time 57845.23 s
2025-04-03 05:57:03 | [maml_trainer] epoch #121 | EpochTime 488.36 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.8691
Average/AverageReturn                              -33.4633
Average/Iteration                                  121
Average/MaxReturn                                    5.98832
Average/MinReturn                                  -63.5717
Average/NumEpisodes                                 80
Average/StdReturn                                   10.9744
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91526
GaussianMLPPolicy/KLAfter                            0.00105264
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.4622e-05
GaussianMLPPolicy/LossBefore                         2.03848e-08
GaussianMLPPolicy/dLoss                              4.46424e-05
Iteration                                          121
MetaTest/Average/AverageDiscountedReturn           -37.9498
MetaTest/Average/AverageReturn                     -37.9498
MetaTest/Average/Iteration                         121
MetaTest/Average/MaxReturn                         -22.3717
MetaTest/Average/MinReturn                         -55.2297
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.0578
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.9498
MetaTest/__unnamed_task__/AverageReturn            -37.9498
MetaTest/__unnamed_task__/Iteration                121
MetaTest/__unnamed_task__/MaxReturn                -22.3717
MetaTest/__unnamed_task__/MinReturn                -55.2297
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.0578
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.904e+06
__unnamed_task__/AverageDiscountedReturn           -15.8691
__unnamed_task__/AverageReturn                     -33.4633
__unnamed_task__/Iteration                         121
__unnamed_task__/MaxReturn                           5.98832
__unnamed_task__/MinReturn                         -63.5717
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.9744
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:03:15 | [maml_trainer] epoch #122 | Sampling for adapation and meta-testing...
2025-04-03 06:04:48 | [maml_trainer] epoch #122 | Finished meta-testing...
2025-04-03 06:04:48 | [maml_trainer] epoch #122 | Saving snapshot...
2025-04-03 06:05:10 | [maml_trainer] epoch #122 | Saved
2025-04-03 06:05:10 | [maml_trainer] epoch #122 | Time 58332.64 s
2025-04-03 06:05:10 | [maml_trainer] epoch #122 | EpochTime 487.40 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4154
Average/AverageReturn                              -33.7599
Average/Iteration                                  122
Average/MaxReturn                                   10.6009
Average/MinReturn                                  -63.1432
Average/NumEpisodes                                 80
Average/StdReturn                                   13.7645
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91357
GaussianMLPPolicy/KLAfter                            0.00109991
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000114931
GaussianMLPPolicy/LossBefore                        -1.72854e-09
GaussianMLPPolicy/dLoss                             -0.000114933
Iteration                                          122
MetaTest/Average/AverageDiscountedReturn           -38.1669
MetaTest/Average/AverageReturn                     -38.1669
MetaTest/Average/Iteration                         122
MetaTest/Average/MaxReturn                         -20.3024
MetaTest/Average/MinReturn                         -58.5327
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.28891
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.1669
MetaTest/__unnamed_task__/AverageReturn            -38.1669
MetaTest/__unnamed_task__/Iteration                122
MetaTest/__unnamed_task__/MaxReturn                -20.3024
MetaTest/__unnamed_task__/MinReturn                -58.5327
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.28891
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.936e+06
__unnamed_task__/AverageDiscountedReturn           -15.4154
__unnamed_task__/AverageReturn                     -33.7599
__unnamed_task__/Iteration                         122
__unnamed_task__/MaxReturn                          10.6009
__unnamed_task__/MinReturn                         -63.1432
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.7645
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:11:20 | [maml_trainer] epoch #123 | Sampling for adapation and meta-testing...
2025-04-03 06:12:52 | [maml_trainer] epoch #123 | Finished meta-testing...
2025-04-03 06:12:52 | [maml_trainer] epoch #123 | Saving snapshot...
2025-04-03 06:13:16 | [maml_trainer] epoch #123 | Saved
2025-04-03 06:13:16 | [maml_trainer] epoch #123 | Time 58818.12 s
2025-04-03 06:13:16 | [maml_trainer] epoch #123 | EpochTime 485.49 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3981
Average/AverageReturn                              -33.2281
Average/Iteration                                  123
Average/MaxReturn                                   36.6514
Average/MinReturn                                  -67.9365
Average/NumEpisodes                                 80
Average/StdReturn                                   15.8412
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91265
GaussianMLPPolicy/KLAfter                            0.00149946
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.13877e-05
GaussianMLPPolicy/LossBefore                         2.17557e-09
GaussianMLPPolicy/dLoss                              7.13898e-05
Iteration                                          123
MetaTest/Average/AverageDiscountedReturn           -39.7769
MetaTest/Average/AverageReturn                     -39.7769
MetaTest/Average/Iteration                         123
MetaTest/Average/MaxReturn                         -13.338
MetaTest/Average/MinReturn                         -65.5742
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.4439
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.7769
MetaTest/__unnamed_task__/AverageReturn            -39.7769
MetaTest/__unnamed_task__/Iteration                123
MetaTest/__unnamed_task__/MaxReturn                -13.338
MetaTest/__unnamed_task__/MinReturn                -65.5742
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.4439
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        3.968e+06
__unnamed_task__/AverageDiscountedReturn           -15.3981
__unnamed_task__/AverageReturn                     -33.2281
__unnamed_task__/Iteration                         123
__unnamed_task__/MaxReturn                          36.6514
__unnamed_task__/MinReturn                         -67.9365
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.8412
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:19:30 | [maml_trainer] epoch #124 | Sampling for adapation and meta-testing...
2025-04-03 06:21:02 | [maml_trainer] epoch #124 | Finished meta-testing...
2025-04-03 06:21:02 | [maml_trainer] epoch #124 | Saving snapshot...
2025-04-03 06:21:25 | [maml_trainer] epoch #124 | Saved
2025-04-03 06:21:25 | [maml_trainer] epoch #124 | Time 59307.78 s
2025-04-03 06:21:25 | [maml_trainer] epoch #124 | EpochTime 489.65 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0293
Average/AverageReturn                              -35.3133
Average/Iteration                                  124
Average/MaxReturn                                   -0.313197
Average/MinReturn                                  -62.0066
Average/NumEpisodes                                 80
Average/StdReturn                                   11.3281
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91109
GaussianMLPPolicy/KLAfter                            0.000735985
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.56566e-06
GaussianMLPPolicy/LossBefore                         9.95398e-09
GaussianMLPPolicy/dLoss                             -4.5557e-06
Iteration                                          124
MetaTest/Average/AverageDiscountedReturn           -36.7851
MetaTest/Average/AverageReturn                     -36.7851
MetaTest/Average/Iteration                         124
MetaTest/Average/MaxReturn                         -21.7261
MetaTest/Average/MinReturn                         -61.0948
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.79097
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.7851
MetaTest/__unnamed_task__/AverageReturn            -36.7851
MetaTest/__unnamed_task__/Iteration                124
MetaTest/__unnamed_task__/MaxReturn                -21.7261
MetaTest/__unnamed_task__/MinReturn                -61.0948
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.79097
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4e+06
__unnamed_task__/AverageDiscountedReturn           -16.0293
__unnamed_task__/AverageReturn                     -35.3133
__unnamed_task__/Iteration                         124
__unnamed_task__/MaxReturn                          -0.313197
__unnamed_task__/MinReturn                         -62.0066
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.3281
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:27:38 | [maml_trainer] epoch #125 | Sampling for adapation and meta-testing...
2025-04-03 06:29:09 | [maml_trainer] epoch #125 | Finished meta-testing...
2025-04-03 06:29:09 | [maml_trainer] epoch #125 | Saving snapshot...
2025-04-03 06:29:33 | [maml_trainer] epoch #125 | Saved
2025-04-03 06:29:33 | [maml_trainer] epoch #125 | Time 59795.51 s
2025-04-03 06:29:33 | [maml_trainer] epoch #125 | EpochTime 487.73 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5951
Average/AverageReturn                              -36.4849
Average/Iteration                                  125
Average/MaxReturn                                    8.87142
Average/MinReturn                                  -80.0333
Average/NumEpisodes                                 80
Average/StdReturn                                   13.1911
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9098
GaussianMLPPolicy/KLAfter                            0.0012257
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.96246e-05
GaussianMLPPolicy/LossBefore                         4.52995e-09
GaussianMLPPolicy/dLoss                              3.96291e-05
Iteration                                          125
MetaTest/Average/AverageDiscountedReturn           -31.4462
MetaTest/Average/AverageReturn                     -31.4462
MetaTest/Average/Iteration                         125
MetaTest/Average/MaxReturn                          -7.50671
MetaTest/Average/MinReturn                         -43.7383
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.56849
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.4462
MetaTest/__unnamed_task__/AverageReturn            -31.4462
MetaTest/__unnamed_task__/Iteration                125
MetaTest/__unnamed_task__/MaxReturn                 -7.50671
MetaTest/__unnamed_task__/MinReturn                -43.7383
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.56849
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.032e+06
__unnamed_task__/AverageDiscountedReturn           -16.5951
__unnamed_task__/AverageReturn                     -36.4849
__unnamed_task__/Iteration                         125
__unnamed_task__/MaxReturn                           8.87142
__unnamed_task__/MinReturn                         -80.0333
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.1911
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:35:45 | [maml_trainer] epoch #126 | Sampling for adapation and meta-testing...
2025-04-03 06:37:18 | [maml_trainer] epoch #126 | Finished meta-testing...
2025-04-03 06:37:18 | [maml_trainer] epoch #126 | Saving snapshot...
2025-04-03 06:37:41 | [maml_trainer] epoch #126 | Saved
2025-04-03 06:37:41 | [maml_trainer] epoch #126 | Time 60283.68 s
2025-04-03 06:37:41 | [maml_trainer] epoch #126 | EpochTime 488.17 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9606
Average/AverageReturn                              -36.8399
Average/Iteration                                  126
Average/MaxReturn                                    7.52529
Average/MinReturn                                  -74.0934
Average/NumEpisodes                                 80
Average/StdReturn                                   13.9731
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90993
GaussianMLPPolicy/KLAfter                            0.00116813
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000190467
GaussianMLPPolicy/LossBefore                        -2.98023e-10
GaussianMLPPolicy/dLoss                              0.000190466
Iteration                                          126
MetaTest/Average/AverageDiscountedReturn           -35.7553
MetaTest/Average/AverageReturn                     -35.7553
MetaTest/Average/Iteration                         126
MetaTest/Average/MaxReturn                          27.9093
MetaTest/Average/MinReturn                         -66.9114
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          18.5285
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.7553
MetaTest/__unnamed_task__/AverageReturn            -35.7553
MetaTest/__unnamed_task__/Iteration                126
MetaTest/__unnamed_task__/MaxReturn                 27.9093
MetaTest/__unnamed_task__/MinReturn                -66.9114
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 18.5285
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.064e+06
__unnamed_task__/AverageDiscountedReturn           -16.9606
__unnamed_task__/AverageReturn                     -36.8399
__unnamed_task__/Iteration                         126
__unnamed_task__/MaxReturn                           7.52529
__unnamed_task__/MinReturn                         -74.0934
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.9731
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:43:52 | [maml_trainer] epoch #127 | Sampling for adapation and meta-testing...
2025-04-03 06:45:23 | [maml_trainer] epoch #127 | Finished meta-testing...
2025-04-03 06:45:23 | [maml_trainer] epoch #127 | Saving snapshot...
2025-04-03 06:45:45 | [maml_trainer] epoch #127 | Saved
2025-04-03 06:45:45 | [maml_trainer] epoch #127 | Time 60767.88 s
2025-04-03 06:45:45 | [maml_trainer] epoch #127 | EpochTime 484.19 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9374
Average/AverageReturn                              -37.2839
Average/Iteration                                  127
Average/MaxReturn                                   -7.03658
Average/MinReturn                                  -62.4076
Average/NumEpisodes                                 80
Average/StdReturn                                   10.3053
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90889
GaussianMLPPolicy/KLAfter                            0.00122745
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.59665e-05
GaussianMLPPolicy/LossBefore                         1.69873e-08
GaussianMLPPolicy/dLoss                             -4.59495e-05
Iteration                                          127
MetaTest/Average/AverageDiscountedReturn           -33.2727
MetaTest/Average/AverageReturn                     -33.2727
MetaTest/Average/Iteration                         127
MetaTest/Average/MaxReturn                           3.7412
MetaTest/Average/MinReturn                         -77.9756
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          17.472
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.2727
MetaTest/__unnamed_task__/AverageReturn            -33.2727
MetaTest/__unnamed_task__/Iteration                127
MetaTest/__unnamed_task__/MaxReturn                  3.7412
MetaTest/__unnamed_task__/MinReturn                -77.9756
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 17.472
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.096e+06
__unnamed_task__/AverageDiscountedReturn           -16.9374
__unnamed_task__/AverageReturn                     -37.2839
__unnamed_task__/Iteration                         127
__unnamed_task__/MaxReturn                          -7.03658
__unnamed_task__/MinReturn                         -62.4076
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.3053
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 06:51:54 | [maml_trainer] epoch #128 | Sampling for adapation and meta-testing...
2025-04-03 06:53:26 | [maml_trainer] epoch #128 | Finished meta-testing...
2025-04-03 06:53:26 | [maml_trainer] epoch #128 | Saving snapshot...
2025-04-03 06:53:51 | [maml_trainer] epoch #128 | Saved
2025-04-03 06:53:51 | [maml_trainer] epoch #128 | Time 61253.26 s
2025-04-03 06:53:51 | [maml_trainer] epoch #128 | EpochTime 485.38 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.1964
Average/AverageReturn                              -37.4086
Average/Iteration                                  128
Average/MaxReturn                                    5.96965
Average/MinReturn                                  -73.0183
Average/NumEpisodes                                 80
Average/StdReturn                                   11.8973
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90874
GaussianMLPPolicy/KLAfter                            0.000847002
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.74837e-05
GaussianMLPPolicy/LossBefore                         5.69224e-09
GaussianMLPPolicy/dLoss                              7.74893e-05
Iteration                                          128
MetaTest/Average/AverageDiscountedReturn           -33.9622
MetaTest/Average/AverageReturn                     -33.9622
MetaTest/Average/Iteration                         128
MetaTest/Average/MaxReturn                           4.37219
MetaTest/Average/MinReturn                         -51.711
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.6315
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.9622
MetaTest/__unnamed_task__/AverageReturn            -33.9622
MetaTest/__unnamed_task__/Iteration                128
MetaTest/__unnamed_task__/MaxReturn                  4.37219
MetaTest/__unnamed_task__/MinReturn                -51.711
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.6315
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.128e+06
__unnamed_task__/AverageDiscountedReturn           -17.1964
__unnamed_task__/AverageReturn                     -37.4086
__unnamed_task__/Iteration                         128
__unnamed_task__/MaxReturn                           5.96965
__unnamed_task__/MinReturn                         -73.0183
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.8973
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:00:03 | [maml_trainer] epoch #129 | Sampling for adapation and meta-testing...
2025-04-03 07:01:36 | [maml_trainer] epoch #129 | Finished meta-testing...
2025-04-03 07:01:36 | [maml_trainer] epoch #129 | Saving snapshot...
2025-04-03 07:01:59 | [maml_trainer] epoch #129 | Saved
2025-04-03 07:01:59 | [maml_trainer] epoch #129 | Time 61741.40 s
2025-04-03 07:01:59 | [maml_trainer] epoch #129 | EpochTime 488.14 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8072
Average/AverageReturn                              -37.312
Average/Iteration                                  129
Average/MaxReturn                                   -5.17311
Average/MinReturn                                  -68.5167
Average/NumEpisodes                                 80
Average/StdReturn                                   11.741
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90763
GaussianMLPPolicy/KLAfter                            0.00146666
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.67123e-05
GaussianMLPPolicy/LossBefore                         1.32918e-08
GaussianMLPPolicy/dLoss                             -7.6699e-05
Iteration                                          129
MetaTest/Average/AverageDiscountedReturn           -37.7226
MetaTest/Average/AverageReturn                     -37.7226
MetaTest/Average/Iteration                         129
MetaTest/Average/MaxReturn                         -19.1292
MetaTest/Average/MinReturn                         -63.0127
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.4073
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.7226
MetaTest/__unnamed_task__/AverageReturn            -37.7226
MetaTest/__unnamed_task__/Iteration                129
MetaTest/__unnamed_task__/MaxReturn                -19.1292
MetaTest/__unnamed_task__/MinReturn                -63.0127
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.4073
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.16e+06
__unnamed_task__/AverageDiscountedReturn           -16.8072
__unnamed_task__/AverageReturn                     -37.312
__unnamed_task__/Iteration                         129
__unnamed_task__/MaxReturn                          -5.17311
__unnamed_task__/MinReturn                         -68.5167
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.741
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:08:11 | [maml_trainer] epoch #130 | Sampling for adapation and meta-testing...
2025-04-03 07:09:43 | [maml_trainer] epoch #130 | Finished meta-testing...
2025-04-03 07:09:43 | [maml_trainer] epoch #130 | Saving snapshot...
2025-04-03 07:10:06 | [maml_trainer] epoch #130 | Saved
2025-04-03 07:10:06 | [maml_trainer] epoch #130 | Time 62228.48 s
2025-04-03 07:10:06 | [maml_trainer] epoch #130 | EpochTime 487.07 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0859
Average/AverageReturn                              -35.3087
Average/Iteration                                  130
Average/MaxReturn                                    2.86177
Average/MinReturn                                  -66.2422
Average/NumEpisodes                                 80
Average/StdReturn                                   13.4242
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90617
GaussianMLPPolicy/KLAfter                            0.00101635
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.65823e-05
GaussianMLPPolicy/LossBefore                        -1.30534e-08
GaussianMLPPolicy/dLoss                             -8.65954e-05
Iteration                                          130
MetaTest/Average/AverageDiscountedReturn           -35.8493
MetaTest/Average/AverageReturn                     -35.8493
MetaTest/Average/Iteration                         130
MetaTest/Average/MaxReturn                          -3.07099
MetaTest/Average/MinReturn                         -58.4799
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.0854
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.8493
MetaTest/__unnamed_task__/AverageReturn            -35.8493
MetaTest/__unnamed_task__/Iteration                130
MetaTest/__unnamed_task__/MaxReturn                 -3.07099
MetaTest/__unnamed_task__/MinReturn                -58.4799
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.0854
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.192e+06
__unnamed_task__/AverageDiscountedReturn           -16.0859
__unnamed_task__/AverageReturn                     -35.3087
__unnamed_task__/Iteration                         130
__unnamed_task__/MaxReturn                           2.86177
__unnamed_task__/MinReturn                         -66.2422
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.4242
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:16:17 | [maml_trainer] epoch #131 | Sampling for adapation and meta-testing...
2025-04-03 07:17:52 | [maml_trainer] epoch #131 | Finished meta-testing...
2025-04-03 07:17:52 | [maml_trainer] epoch #131 | Saving snapshot...
2025-04-03 07:18:15 | [maml_trainer] epoch #131 | Saved
2025-04-03 07:18:15 | [maml_trainer] epoch #131 | Time 62717.91 s
2025-04-03 07:18:15 | [maml_trainer] epoch #131 | EpochTime 489.43 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0858
Average/AverageReturn                              -35.2475
Average/Iteration                                  131
Average/MaxReturn                                   21.385
Average/MinReturn                                  -66.7704
Average/NumEpisodes                                 80
Average/StdReturn                                   13.7614
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.904
GaussianMLPPolicy/KLAfter                            0.00105701
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.15312e-05
GaussianMLPPolicy/LossBefore                         3.45707e-09
GaussianMLPPolicy/dLoss                              3.15346e-05
Iteration                                          131
MetaTest/Average/AverageDiscountedReturn           -34.9455
MetaTest/Average/AverageReturn                     -34.9455
MetaTest/Average/Iteration                         131
MetaTest/Average/MaxReturn                         -23.4221
MetaTest/Average/MinReturn                         -58.1522
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.6889
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.9455
MetaTest/__unnamed_task__/AverageReturn            -34.9455
MetaTest/__unnamed_task__/Iteration                131
MetaTest/__unnamed_task__/MaxReturn                -23.4221
MetaTest/__unnamed_task__/MinReturn                -58.1522
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.6889
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.224e+06
__unnamed_task__/AverageDiscountedReturn           -16.0858
__unnamed_task__/AverageReturn                     -35.2475
__unnamed_task__/Iteration                         131
__unnamed_task__/MaxReturn                          21.385
__unnamed_task__/MinReturn                         -66.7704
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.7614
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:24:25 | [maml_trainer] epoch #132 | Sampling for adapation and meta-testing...
2025-04-03 07:25:58 | [maml_trainer] epoch #132 | Finished meta-testing...
2025-04-03 07:25:58 | [maml_trainer] epoch #132 | Saving snapshot...
2025-04-03 07:26:21 | [maml_trainer] epoch #132 | Saved
2025-04-03 07:26:21 | [maml_trainer] epoch #132 | Time 63203.95 s
2025-04-03 07:26:21 | [maml_trainer] epoch #132 | EpochTime 486.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4015
Average/AverageReturn                              -35.7721
Average/Iteration                                  132
Average/MaxReturn                                   15.5134
Average/MinReturn                                  -71.682
Average/NumEpisodes                                 80
Average/StdReturn                                   15.4204
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90281
GaussianMLPPolicy/KLAfter                            0.00174642
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.31946e-05
GaussianMLPPolicy/LossBefore                        -9.86457e-09
GaussianMLPPolicy/dLoss                              3.31847e-05
Iteration                                          132
MetaTest/Average/AverageDiscountedReturn           -26.3321
MetaTest/Average/AverageReturn                     -26.3321
MetaTest/Average/Iteration                         132
MetaTest/Average/MaxReturn                          17.3688
MetaTest/Average/MinReturn                         -52.4324
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          19.5295
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -26.3321
MetaTest/__unnamed_task__/AverageReturn            -26.3321
MetaTest/__unnamed_task__/Iteration                132
MetaTest/__unnamed_task__/MaxReturn                 17.3688
MetaTest/__unnamed_task__/MinReturn                -52.4324
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 19.5295
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.256e+06
__unnamed_task__/AverageDiscountedReturn           -16.4015
__unnamed_task__/AverageReturn                     -35.7721
__unnamed_task__/Iteration                         132
__unnamed_task__/MaxReturn                          15.5134
__unnamed_task__/MinReturn                         -71.682
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.4204
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:32:34 | [maml_trainer] epoch #133 | Sampling for adapation and meta-testing...
2025-04-03 07:34:05 | [maml_trainer] epoch #133 | Finished meta-testing...
2025-04-03 07:34:05 | [maml_trainer] epoch #133 | Saving snapshot...
2025-04-03 07:34:29 | [maml_trainer] epoch #133 | Saved
2025-04-03 07:34:29 | [maml_trainer] epoch #133 | Time 63691.31 s
2025-04-03 07:34:29 | [maml_trainer] epoch #133 | EpochTime 487.36 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8179
Average/AverageReturn                              -37.4878
Average/Iteration                                  133
Average/MaxReturn                                   34.296
Average/MinReturn                                  -71.5979
Average/NumEpisodes                                 80
Average/StdReturn                                   15.3883
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90294
GaussianMLPPolicy/KLAfter                            0.00173514
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.79914e-05
GaussianMLPPolicy/LossBefore                         1.29938e-08
GaussianMLPPolicy/dLoss                              5.80043e-05
Iteration                                          133
MetaTest/Average/AverageDiscountedReturn           -36.89
MetaTest/Average/AverageReturn                     -36.89
MetaTest/Average/Iteration                         133
MetaTest/Average/MaxReturn                          18.2039
MetaTest/Average/MinReturn                         -58.5721
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.3969
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.89
MetaTest/__unnamed_task__/AverageReturn            -36.89
MetaTest/__unnamed_task__/Iteration                133
MetaTest/__unnamed_task__/MaxReturn                 18.2039
MetaTest/__unnamed_task__/MinReturn                -58.5721
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.3969
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.288e+06
__unnamed_task__/AverageDiscountedReturn           -16.8179
__unnamed_task__/AverageReturn                     -37.4878
__unnamed_task__/Iteration                         133
__unnamed_task__/MaxReturn                          34.296
__unnamed_task__/MinReturn                         -71.5979
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.3883
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:40:42 | [maml_trainer] epoch #134 | Sampling for adapation and meta-testing...
2025-04-03 07:42:15 | [maml_trainer] epoch #134 | Finished meta-testing...
2025-04-03 07:42:15 | [maml_trainer] epoch #134 | Saving snapshot...
2025-04-03 07:42:39 | [maml_trainer] epoch #134 | Saved
2025-04-03 07:42:39 | [maml_trainer] epoch #134 | Time 64181.01 s
2025-04-03 07:42:39 | [maml_trainer] epoch #134 | EpochTime 489.69 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9001
Average/AverageReturn                              -37.4898
Average/Iteration                                  134
Average/MaxReturn                                    1.31955
Average/MinReturn                                  -63.9469
Average/NumEpisodes                                 80
Average/StdReturn                                   12.1654
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90152
GaussianMLPPolicy/KLAfter                            0.00208581
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.63129e-05
GaussianMLPPolicy/LossBefore                         5.96043e-11
GaussianMLPPolicy/dLoss                              1.6313e-05
Iteration                                          134
MetaTest/Average/AverageDiscountedReturn           -33.1047
MetaTest/Average/AverageReturn                     -33.1047
MetaTest/Average/Iteration                         134
MetaTest/Average/MaxReturn                         -20.5089
MetaTest/Average/MinReturn                         -48.1884
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.72612
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.1047
MetaTest/__unnamed_task__/AverageReturn            -33.1047
MetaTest/__unnamed_task__/Iteration                134
MetaTest/__unnamed_task__/MaxReturn                -20.5089
MetaTest/__unnamed_task__/MinReturn                -48.1884
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.72612
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.32e+06
__unnamed_task__/AverageDiscountedReturn           -16.9001
__unnamed_task__/AverageReturn                     -37.4898
__unnamed_task__/Iteration                         134
__unnamed_task__/MaxReturn                           1.31955
__unnamed_task__/MinReturn                         -63.9469
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.1654
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:48:56 | [maml_trainer] epoch #135 | Sampling for adapation and meta-testing...
2025-04-03 07:50:28 | [maml_trainer] epoch #135 | Finished meta-testing...
2025-04-03 07:50:28 | [maml_trainer] epoch #135 | Saving snapshot...
2025-04-03 07:50:50 | [maml_trainer] epoch #135 | Saved
2025-04-03 07:50:50 | [maml_trainer] epoch #135 | Time 64672.97 s
2025-04-03 07:50:50 | [maml_trainer] epoch #135 | EpochTime 491.96 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3612
Average/AverageReturn                              -35.8622
Average/Iteration                                  135
Average/MaxReturn                                    1.34972
Average/MinReturn                                  -66.4477
Average/NumEpisodes                                 80
Average/StdReturn                                   10.938
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90127
GaussianMLPPolicy/KLAfter                            0.00155027
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.80986e-05
GaussianMLPPolicy/LossBefore                        -2.69413e-08
GaussianMLPPolicy/dLoss                              4.80716e-05
Iteration                                          135
MetaTest/Average/AverageDiscountedReturn           -37.2891
MetaTest/Average/AverageReturn                     -37.2891
MetaTest/Average/Iteration                         135
MetaTest/Average/MaxReturn                         -25.0052
MetaTest/Average/MinReturn                         -54.031
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.98879
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.2891
MetaTest/__unnamed_task__/AverageReturn            -37.2891
MetaTest/__unnamed_task__/Iteration                135
MetaTest/__unnamed_task__/MaxReturn                -25.0052
MetaTest/__unnamed_task__/MinReturn                -54.031
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.98879
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.352e+06
__unnamed_task__/AverageDiscountedReturn           -16.3612
__unnamed_task__/AverageReturn                     -35.8622
__unnamed_task__/Iteration                         135
__unnamed_task__/MaxReturn                           1.34972
__unnamed_task__/MinReturn                         -66.4477
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.938
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 07:56:59 | [maml_trainer] epoch #136 | Sampling for adapation and meta-testing...
2025-04-03 07:58:32 | [maml_trainer] epoch #136 | Finished meta-testing...
2025-04-03 07:58:32 | [maml_trainer] epoch #136 | Saving snapshot...
2025-04-03 07:58:56 | [maml_trainer] epoch #136 | Saved
2025-04-03 07:58:56 | [maml_trainer] epoch #136 | Time 65158.74 s
2025-04-03 07:58:56 | [maml_trainer] epoch #136 | EpochTime 485.76 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2486
Average/AverageReturn                              -36.1445
Average/Iteration                                  136
Average/MaxReturn                                    1.82041
Average/MinReturn                                  -70.5955
Average/NumEpisodes                                 80
Average/StdReturn                                   12.5788
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90199
GaussianMLPPolicy/KLAfter                            0.00170643
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.50785e-05
GaussianMLPPolicy/LossBefore                         2.31862e-08
GaussianMLPPolicy/dLoss                              2.51017e-05
Iteration                                          136
MetaTest/Average/AverageDiscountedReturn           -40.4091
MetaTest/Average/AverageReturn                     -40.4091
MetaTest/Average/Iteration                         136
MetaTest/Average/MaxReturn                         -11.1832
MetaTest/Average/MinReturn                         -54.7969
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.2837
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.4091
MetaTest/__unnamed_task__/AverageReturn            -40.4091
MetaTest/__unnamed_task__/Iteration                136
MetaTest/__unnamed_task__/MaxReturn                -11.1832
MetaTest/__unnamed_task__/MinReturn                -54.7969
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.2837
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.384e+06
__unnamed_task__/AverageDiscountedReturn           -16.2486
__unnamed_task__/AverageReturn                     -36.1445
__unnamed_task__/Iteration                         136
__unnamed_task__/MaxReturn                           1.82041
__unnamed_task__/MinReturn                         -70.5955
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.5788
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:05:12 | [maml_trainer] epoch #137 | Sampling for adapation and meta-testing...
2025-04-03 08:06:45 | [maml_trainer] epoch #137 | Finished meta-testing...
2025-04-03 08:06:45 | [maml_trainer] epoch #137 | Saving snapshot...
2025-04-03 08:07:09 | [maml_trainer] epoch #137 | Saved
2025-04-03 08:07:09 | [maml_trainer] epoch #137 | Time 65650.99 s
2025-04-03 08:07:09 | [maml_trainer] epoch #137 | EpochTime 492.25 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.1746
Average/AverageReturn                              -33.5914
Average/Iteration                                  137
Average/MaxReturn                                   12.2446
Average/MinReturn                                  -65.817
Average/NumEpisodes                                 80
Average/StdReturn                                   12.1376
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90218
GaussianMLPPolicy/KLAfter                            0.00177263
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.27038e-05
GaussianMLPPolicy/LossBefore                        -9.14931e-09
GaussianMLPPolicy/dLoss                             -3.2713e-05
Iteration                                          137
MetaTest/Average/AverageDiscountedReturn           -34.6892
MetaTest/Average/AverageReturn                     -34.6892
MetaTest/Average/Iteration                         137
MetaTest/Average/MaxReturn                         -25.0834
MetaTest/Average/MinReturn                         -52.9399
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.28888
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.6892
MetaTest/__unnamed_task__/AverageReturn            -34.6892
MetaTest/__unnamed_task__/Iteration                137
MetaTest/__unnamed_task__/MaxReturn                -25.0834
MetaTest/__unnamed_task__/MinReturn                -52.9399
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.28888
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.416e+06
__unnamed_task__/AverageDiscountedReturn           -15.1746
__unnamed_task__/AverageReturn                     -33.5914
__unnamed_task__/Iteration                         137
__unnamed_task__/MaxReturn                          12.2446
__unnamed_task__/MinReturn                         -65.817
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.1376
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:13:19 | [maml_trainer] epoch #138 | Sampling for adapation and meta-testing...
2025-04-03 08:14:53 | [maml_trainer] epoch #138 | Finished meta-testing...
2025-04-03 08:14:53 | [maml_trainer] epoch #138 | Saving snapshot...
2025-04-03 08:15:15 | [maml_trainer] epoch #138 | Saved
2025-04-03 08:15:15 | [maml_trainer] epoch #138 | Time 66137.50 s
2025-04-03 08:15:15 | [maml_trainer] epoch #138 | EpochTime 486.51 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.9418
Average/AverageReturn                              -32.3662
Average/Iteration                                  138
Average/MaxReturn                                   31.2366
Average/MinReturn                                  -55.9038
Average/NumEpisodes                                 80
Average/StdReturn                                   14.5429
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90183
GaussianMLPPolicy/KLAfter                            0.00266482
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.80042e-05
GaussianMLPPolicy/LossBefore                        -2.47359e-09
GaussianMLPPolicy/dLoss                             -6.80067e-05
Iteration                                          138
MetaTest/Average/AverageDiscountedReturn           -37.0631
MetaTest/Average/AverageReturn                     -37.0631
MetaTest/Average/Iteration                         138
MetaTest/Average/MaxReturn                          20.8451
MetaTest/Average/MinReturn                         -64.7256
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          16.6176
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.0631
MetaTest/__unnamed_task__/AverageReturn            -37.0631
MetaTest/__unnamed_task__/Iteration                138
MetaTest/__unnamed_task__/MaxReturn                 20.8451
MetaTest/__unnamed_task__/MinReturn                -64.7256
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 16.6176
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.448e+06
__unnamed_task__/AverageDiscountedReturn           -14.9418
__unnamed_task__/AverageReturn                     -32.3662
__unnamed_task__/Iteration                         138
__unnamed_task__/MaxReturn                          31.2366
__unnamed_task__/MinReturn                         -55.9038
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.5429
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:21:26 | [maml_trainer] epoch #139 | Sampling for adapation and meta-testing...
2025-04-03 08:23:00 | [maml_trainer] epoch #139 | Finished meta-testing...
2025-04-03 08:23:00 | [maml_trainer] epoch #139 | Saving snapshot...
2025-04-03 08:23:24 | [maml_trainer] epoch #139 | Saved
2025-04-03 08:23:24 | [maml_trainer] epoch #139 | Time 66626.79 s
2025-04-03 08:23:24 | [maml_trainer] epoch #139 | EpochTime 489.28 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4837
Average/AverageReturn                              -36.2485
Average/Iteration                                  139
Average/MaxReturn                                  -11.0833
Average/MinReturn                                  -62.4118
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2019
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9017
GaussianMLPPolicy/KLAfter                            0.00320958
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.19926e-05
GaussianMLPPolicy/LossBefore                        -6.55652e-10
GaussianMLPPolicy/dLoss                              5.19919e-05
Iteration                                          139
MetaTest/Average/AverageDiscountedReturn           -33.0823
MetaTest/Average/AverageReturn                     -33.0823
MetaTest/Average/Iteration                         139
MetaTest/Average/MaxReturn                         -21.8188
MetaTest/Average/MinReturn                         -50.3178
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.9862
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.0823
MetaTest/__unnamed_task__/AverageReturn            -33.0823
MetaTest/__unnamed_task__/Iteration                139
MetaTest/__unnamed_task__/MaxReturn                -21.8188
MetaTest/__unnamed_task__/MinReturn                -50.3178
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.9862
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.48e+06
__unnamed_task__/AverageDiscountedReturn           -16.4837
__unnamed_task__/AverageReturn                     -36.2485
__unnamed_task__/Iteration                         139
__unnamed_task__/MaxReturn                         -11.0833
__unnamed_task__/MinReturn                         -62.4118
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2019
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:29:36 | [maml_trainer] epoch #140 | Sampling for adapation and meta-testing...
2025-04-03 08:31:08 | [maml_trainer] epoch #140 | Finished meta-testing...
2025-04-03 08:31:08 | [maml_trainer] epoch #140 | Saving snapshot...
2025-04-03 08:31:32 | [maml_trainer] epoch #140 | Saved
2025-04-03 08:31:32 | [maml_trainer] epoch #140 | Time 67114.17 s
2025-04-03 08:31:32 | [maml_trainer] epoch #140 | EpochTime 487.38 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0132
Average/AverageReturn                              -35.8379
Average/Iteration                                  140
Average/MaxReturn                                    4.46141
Average/MinReturn                                  -57.6464
Average/NumEpisodes                                 80
Average/StdReturn                                   10.6307
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90161
GaussianMLPPolicy/KLAfter                            0.00548679
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000135347
GaussianMLPPolicy/LossBefore                         1.10865e-08
GaussianMLPPolicy/dLoss                             -0.000135336
Iteration                                          140
MetaTest/Average/AverageDiscountedReturn           -38.4381
MetaTest/Average/AverageReturn                     -38.4381
MetaTest/Average/Iteration                         140
MetaTest/Average/MaxReturn                          -6.60352
MetaTest/Average/MinReturn                         -63.37
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.6252
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.4381
MetaTest/__unnamed_task__/AverageReturn            -38.4381
MetaTest/__unnamed_task__/Iteration                140
MetaTest/__unnamed_task__/MaxReturn                 -6.60352
MetaTest/__unnamed_task__/MinReturn                -63.37
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.6252
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.512e+06
__unnamed_task__/AverageDiscountedReturn           -16.0132
__unnamed_task__/AverageReturn                     -35.8379
__unnamed_task__/Iteration                         140
__unnamed_task__/MaxReturn                           4.46141
__unnamed_task__/MinReturn                         -57.6464
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.6307
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:37:43 | [maml_trainer] epoch #141 | Sampling for adapation and meta-testing...
2025-04-03 08:39:16 | [maml_trainer] epoch #141 | Finished meta-testing...
2025-04-03 08:39:16 | [maml_trainer] epoch #141 | Saving snapshot...
2025-04-03 08:39:39 | [maml_trainer] epoch #141 | Saved
2025-04-03 08:39:39 | [maml_trainer] epoch #141 | Time 67601.25 s
2025-04-03 08:39:39 | [maml_trainer] epoch #141 | EpochTime 487.08 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3169
Average/AverageReturn                              -35.3602
Average/Iteration                                  141
Average/MaxReturn                                   10.5572
Average/MinReturn                                  -62.3291
Average/NumEpisodes                                 80
Average/StdReturn                                   12.3903
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90038
GaussianMLPPolicy/KLAfter                            0.0044484
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.3991e-05
GaussianMLPPolicy/LossBefore                         1.10269e-09
GaussianMLPPolicy/dLoss                              6.39921e-05
Iteration                                          141
MetaTest/Average/AverageDiscountedReturn           -36.52
MetaTest/Average/AverageReturn                     -36.52
MetaTest/Average/Iteration                         141
MetaTest/Average/MaxReturn                          -8.68231
MetaTest/Average/MinReturn                         -56.0601
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.0774
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.52
MetaTest/__unnamed_task__/AverageReturn            -36.52
MetaTest/__unnamed_task__/Iteration                141
MetaTest/__unnamed_task__/MaxReturn                 -8.68231
MetaTest/__unnamed_task__/MinReturn                -56.0601
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.0774
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.544e+06
__unnamed_task__/AverageDiscountedReturn           -16.3169
__unnamed_task__/AverageReturn                     -35.3602
__unnamed_task__/Iteration                         141
__unnamed_task__/MaxReturn                          10.5572
__unnamed_task__/MinReturn                         -62.3291
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.3903
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:45:50 | [maml_trainer] epoch #142 | Sampling for adapation and meta-testing...
2025-04-03 08:47:22 | [maml_trainer] epoch #142 | Finished meta-testing...
2025-04-03 08:47:22 | [maml_trainer] epoch #142 | Saving snapshot...
2025-04-03 08:47:47 | [maml_trainer] epoch #142 | Saved
2025-04-03 08:47:47 | [maml_trainer] epoch #142 | Time 68089.27 s
2025-04-03 08:47:47 | [maml_trainer] epoch #142 | EpochTime 488.01 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5495
Average/AverageReturn                              -36.1179
Average/Iteration                                  142
Average/MaxReturn                                   10.7995
Average/MinReturn                                  -67.9176
Average/NumEpisodes                                 80
Average/StdReturn                                   13.7419
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89977
GaussianMLPPolicy/KLAfter                            0.00439689
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000154303
GaussianMLPPolicy/LossBefore                        -2.5332e-09
GaussianMLPPolicy/dLoss                              0.0001543
Iteration                                          142
MetaTest/Average/AverageDiscountedReturn           -35.4908
MetaTest/Average/AverageReturn                     -35.4908
MetaTest/Average/Iteration                         142
MetaTest/Average/MaxReturn                          -3.1522
MetaTest/Average/MinReturn                         -57.8064
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.4518
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.4908
MetaTest/__unnamed_task__/AverageReturn            -35.4908
MetaTest/__unnamed_task__/Iteration                142
MetaTest/__unnamed_task__/MaxReturn                 -3.1522
MetaTest/__unnamed_task__/MinReturn                -57.8064
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.4518
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.576e+06
__unnamed_task__/AverageDiscountedReturn           -16.5495
__unnamed_task__/AverageReturn                     -36.1179
__unnamed_task__/Iteration                         142
__unnamed_task__/MaxReturn                          10.7995
__unnamed_task__/MinReturn                         -67.9176
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.7419
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 08:54:00 | [maml_trainer] epoch #143 | Sampling for adapation and meta-testing...
2025-04-03 08:55:32 | [maml_trainer] epoch #143 | Finished meta-testing...
2025-04-03 08:55:32 | [maml_trainer] epoch #143 | Saving snapshot...
2025-04-03 08:55:55 | [maml_trainer] epoch #143 | Saved
2025-04-03 08:55:55 | [maml_trainer] epoch #143 | Time 68577.18 s
2025-04-03 08:55:55 | [maml_trainer] epoch #143 | EpochTime 487.91 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.3314
Average/AverageReturn                              -37.8039
Average/Iteration                                  143
Average/MaxReturn                                  -11.4913
Average/MinReturn                                  -61.0823
Average/NumEpisodes                                 80
Average/StdReturn                                    8.79003
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89944
GaussianMLPPolicy/KLAfter                            0.00232859
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.64541e-05
GaussianMLPPolicy/LossBefore                        -1.72853e-09
GaussianMLPPolicy/dLoss                              3.64524e-05
Iteration                                          143
MetaTest/Average/AverageDiscountedReturn           -35.9802
MetaTest/Average/AverageReturn                     -35.9802
MetaTest/Average/Iteration                         143
MetaTest/Average/MaxReturn                         -25.4686
MetaTest/Average/MinReturn                         -47.579
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.00391
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.9802
MetaTest/__unnamed_task__/AverageReturn            -35.9802
MetaTest/__unnamed_task__/Iteration                143
MetaTest/__unnamed_task__/MaxReturn                -25.4686
MetaTest/__unnamed_task__/MinReturn                -47.579
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.00391
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.608e+06
__unnamed_task__/AverageDiscountedReturn           -17.3314
__unnamed_task__/AverageReturn                     -37.8039
__unnamed_task__/Iteration                         143
__unnamed_task__/MaxReturn                         -11.4913
__unnamed_task__/MinReturn                         -61.0823
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.79003
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:01:55 | [maml_trainer] epoch #144 | Sampling for adapation and meta-testing...
2025-04-03 09:03:23 | [maml_trainer] epoch #144 | Finished meta-testing...
2025-04-03 09:03:23 | [maml_trainer] epoch #144 | Saving snapshot...
2025-04-03 09:03:45 | [maml_trainer] epoch #144 | Saved
2025-04-03 09:03:45 | [maml_trainer] epoch #144 | Time 69047.66 s
2025-04-03 09:03:45 | [maml_trainer] epoch #144 | EpochTime 470.48 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6427
Average/AverageReturn                              -34.682
Average/Iteration                                  144
Average/MaxReturn                                   -1.51511
Average/MinReturn                                  -63.1737
Average/NumEpisodes                                 80
Average/StdReturn                                   12.3497
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9001
GaussianMLPPolicy/KLAfter                            0.00179559
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.03099e-05
GaussianMLPPolicy/LossBefore                         5.126e-09
GaussianMLPPolicy/dLoss                             -3.03047e-05
Iteration                                          144
MetaTest/Average/AverageDiscountedReturn           -35.3643
MetaTest/Average/AverageReturn                     -35.3643
MetaTest/Average/Iteration                         144
MetaTest/Average/MaxReturn                          -2.33499
MetaTest/Average/MinReturn                         -56.148
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.0143
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.3643
MetaTest/__unnamed_task__/AverageReturn            -35.3643
MetaTest/__unnamed_task__/Iteration                144
MetaTest/__unnamed_task__/MaxReturn                 -2.33499
MetaTest/__unnamed_task__/MinReturn                -56.148
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.0143
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.64e+06
__unnamed_task__/AverageDiscountedReturn           -15.6427
__unnamed_task__/AverageReturn                     -34.682
__unnamed_task__/Iteration                         144
__unnamed_task__/MaxReturn                          -1.51511
__unnamed_task__/MinReturn                         -63.1737
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.3497
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:09:33 | [maml_trainer] epoch #145 | Sampling for adapation and meta-testing...
2025-04-03 09:11:02 | [maml_trainer] epoch #145 | Finished meta-testing...
2025-04-03 09:11:02 | [maml_trainer] epoch #145 | Saving snapshot...
2025-04-03 09:11:26 | [maml_trainer] epoch #145 | Saved
2025-04-03 09:11:26 | [maml_trainer] epoch #145 | Time 69508.04 s
2025-04-03 09:11:26 | [maml_trainer] epoch #145 | EpochTime 460.38 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.0824
Average/AverageReturn                              -40.3634
Average/Iteration                                  145
Average/MaxReturn                                   -1.13605
Average/MinReturn                                  -64.1173
Average/NumEpisodes                                 80
Average/StdReturn                                   11.7278
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89991
GaussianMLPPolicy/KLAfter                            0.002573
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.76094e-05
GaussianMLPPolicy/LossBefore                         4.58956e-09
GaussianMLPPolicy/dLoss                             -9.76048e-05
Iteration                                          145
MetaTest/Average/AverageDiscountedReturn           -40.3031
MetaTest/Average/AverageReturn                     -40.3031
MetaTest/Average/Iteration                         145
MetaTest/Average/MaxReturn                         -21.8439
MetaTest/Average/MinReturn                         -64.3193
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.2911
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.3031
MetaTest/__unnamed_task__/AverageReturn            -40.3031
MetaTest/__unnamed_task__/Iteration                145
MetaTest/__unnamed_task__/MaxReturn                -21.8439
MetaTest/__unnamed_task__/MinReturn                -64.3193
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.2911
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.672e+06
__unnamed_task__/AverageDiscountedReturn           -18.0824
__unnamed_task__/AverageReturn                     -40.3634
__unnamed_task__/Iteration                         145
__unnamed_task__/MaxReturn                          -1.13605
__unnamed_task__/MinReturn                         -64.1173
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.7278
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:17:17 | [maml_trainer] epoch #146 | Sampling for adapation and meta-testing...
2025-04-03 09:18:46 | [maml_trainer] epoch #146 | Finished meta-testing...
2025-04-03 09:18:46 | [maml_trainer] epoch #146 | Saving snapshot...
2025-04-03 09:19:08 | [maml_trainer] epoch #146 | Saved
2025-04-03 09:19:08 | [maml_trainer] epoch #146 | Time 69970.60 s
2025-04-03 09:19:08 | [maml_trainer] epoch #146 | EpochTime 462.55 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.0166
Average/AverageReturn                              -39.7833
Average/Iteration                                  146
Average/MaxReturn                                  -17.462
Average/MinReturn                                  -63.0808
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1547
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89936
GaussianMLPPolicy/KLAfter                            0.00206088
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.58101e-05
GaussianMLPPolicy/LossBefore                        -9.77516e-09
GaussianMLPPolicy/dLoss                             -3.58199e-05
Iteration                                          146
MetaTest/Average/AverageDiscountedReturn           -41.1556
MetaTest/Average/AverageReturn                     -41.1556
MetaTest/Average/Iteration                         146
MetaTest/Average/MaxReturn                         -15.583
MetaTest/Average/MinReturn                         -60.1431
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.379
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.1556
MetaTest/__unnamed_task__/AverageReturn            -41.1556
MetaTest/__unnamed_task__/Iteration                146
MetaTest/__unnamed_task__/MaxReturn                -15.583
MetaTest/__unnamed_task__/MinReturn                -60.1431
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.379
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.704e+06
__unnamed_task__/AverageDiscountedReturn           -18.0166
__unnamed_task__/AverageReturn                     -39.7833
__unnamed_task__/Iteration                         146
__unnamed_task__/MaxReturn                         -17.462
__unnamed_task__/MinReturn                         -63.0808
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1547
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:25:06 | [maml_trainer] epoch #147 | Sampling for adapation and meta-testing...
2025-04-03 09:26:35 | [maml_trainer] epoch #147 | Finished meta-testing...
2025-04-03 09:26:35 | [maml_trainer] epoch #147 | Saving snapshot...
2025-04-03 09:26:56 | [maml_trainer] epoch #147 | Saved
2025-04-03 09:26:56 | [maml_trainer] epoch #147 | Time 70438.89 s
2025-04-03 09:26:56 | [maml_trainer] epoch #147 | EpochTime 468.29 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.3884
Average/AverageReturn                              -38.0938
Average/Iteration                                  147
Average/MaxReturn                                    1.0344
Average/MinReturn                                  -71.9844
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6206
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89934
GaussianMLPPolicy/KLAfter                            0.0025538
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.00012324
GaussianMLPPolicy/LossBefore                         1.05202e-08
GaussianMLPPolicy/dLoss                              0.00012325
Iteration                                          147
MetaTest/Average/AverageDiscountedReturn           -38.7483
MetaTest/Average/AverageReturn                     -38.7483
MetaTest/Average/Iteration                         147
MetaTest/Average/MaxReturn                         -22.0747
MetaTest/Average/MinReturn                         -55.1071
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.14639
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.7483
MetaTest/__unnamed_task__/AverageReturn            -38.7483
MetaTest/__unnamed_task__/Iteration                147
MetaTest/__unnamed_task__/MaxReturn                -22.0747
MetaTest/__unnamed_task__/MinReturn                -55.1071
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.14639
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.736e+06
__unnamed_task__/AverageDiscountedReturn           -17.3884
__unnamed_task__/AverageReturn                     -38.0938
__unnamed_task__/Iteration                         147
__unnamed_task__/MaxReturn                           1.0344
__unnamed_task__/MinReturn                         -71.9844
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6206
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:32:48 | [maml_trainer] epoch #148 | Sampling for adapation and meta-testing...
2025-04-03 09:34:16 | [maml_trainer] epoch #148 | Finished meta-testing...
2025-04-03 09:34:16 | [maml_trainer] epoch #148 | Saving snapshot...
2025-04-03 09:34:40 | [maml_trainer] epoch #148 | Saved
2025-04-03 09:34:40 | [maml_trainer] epoch #148 | Time 70902.01 s
2025-04-03 09:34:40 | [maml_trainer] epoch #148 | EpochTime 463.12 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.3259
Average/AverageReturn                              -41.42
Average/Iteration                                  148
Average/MaxReturn                                  -21.5413
Average/MinReturn                                  -67.007
Average/NumEpisodes                                 80
Average/StdReturn                                   10.8273
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90004
GaussianMLPPolicy/KLAfter                            0.00257483
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.68828e-05
GaussianMLPPolicy/LossBefore                        -2.26498e-09
GaussianMLPPolicy/dLoss                              8.68805e-05
Iteration                                          148
MetaTest/Average/AverageDiscountedReturn           -39.9252
MetaTest/Average/AverageReturn                     -39.9252
MetaTest/Average/Iteration                         148
MetaTest/Average/MaxReturn                          33.4344
MetaTest/Average/MinReturn                         -63.4607
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          19.5669
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.9252
MetaTest/__unnamed_task__/AverageReturn            -39.9252
MetaTest/__unnamed_task__/Iteration                148
MetaTest/__unnamed_task__/MaxReturn                 33.4344
MetaTest/__unnamed_task__/MinReturn                -63.4607
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 19.5669
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.768e+06
__unnamed_task__/AverageDiscountedReturn           -18.3259
__unnamed_task__/AverageReturn                     -41.42
__unnamed_task__/Iteration                         148
__unnamed_task__/MaxReturn                         -21.5413
__unnamed_task__/MinReturn                         -67.007
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.8273
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:40:34 | [maml_trainer] epoch #149 | Sampling for adapation and meta-testing...
2025-04-03 09:42:02 | [maml_trainer] epoch #149 | Finished meta-testing...
2025-04-03 09:42:02 | [maml_trainer] epoch #149 | Saving snapshot...
2025-04-03 09:42:25 | [maml_trainer] epoch #149 | Saved
2025-04-03 09:42:25 | [maml_trainer] epoch #149 | Time 71367.09 s
2025-04-03 09:42:25 | [maml_trainer] epoch #149 | EpochTime 465.07 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8766
Average/AverageReturn                              -38.1326
Average/Iteration                                  149
Average/MaxReturn                                   20.0403
Average/MinReturn                                  -75.9014
Average/NumEpisodes                                 80
Average/StdReturn                                   13.9556
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90061
GaussianMLPPolicy/KLAfter                            0.00301012
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.3587e-05
GaussianMLPPolicy/LossBefore                        -1.78814e-08
GaussianMLPPolicy/dLoss                              2.35692e-05
Iteration                                          149
MetaTest/Average/AverageDiscountedReturn           -38.7868
MetaTest/Average/AverageReturn                     -38.7868
MetaTest/Average/Iteration                         149
MetaTest/Average/MaxReturn                         -10.0285
MetaTest/Average/MinReturn                         -67.8111
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.2
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.7868
MetaTest/__unnamed_task__/AverageReturn            -38.7868
MetaTest/__unnamed_task__/Iteration                149
MetaTest/__unnamed_task__/MaxReturn                -10.0285
MetaTest/__unnamed_task__/MinReturn                -67.8111
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.2
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.8e+06
__unnamed_task__/AverageDiscountedReturn           -16.8766
__unnamed_task__/AverageReturn                     -38.1326
__unnamed_task__/Iteration                         149
__unnamed_task__/MaxReturn                          20.0403
__unnamed_task__/MinReturn                         -75.9014
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.9556
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:48:18 | [maml_trainer] epoch #150 | Sampling for adapation and meta-testing...
2025-04-03 09:49:47 | [maml_trainer] epoch #150 | Finished meta-testing...
2025-04-03 09:49:47 | [maml_trainer] epoch #150 | Saving snapshot...
2025-04-03 09:50:09 | [maml_trainer] epoch #150 | Saved
2025-04-03 09:50:09 | [maml_trainer] epoch #150 | Time 71831.81 s
2025-04-03 09:50:09 | [maml_trainer] epoch #150 | EpochTime 464.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9344
Average/AverageReturn                              -36.6461
Average/Iteration                                  150
Average/MaxReturn                                   21.7414
Average/MinReturn                                  -65.8758
Average/NumEpisodes                                 80
Average/StdReturn                                   10.7575
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90144
GaussianMLPPolicy/KLAfter                            0.00367293
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000167696
GaussianMLPPolicy/LossBefore                        -5.87106e-09
GaussianMLPPolicy/dLoss                              0.00016769
Iteration                                          150
MetaTest/Average/AverageDiscountedReturn           -35.4433
MetaTest/Average/AverageReturn                     -35.4433
MetaTest/Average/Iteration                         150
MetaTest/Average/MaxReturn                         -21.3892
MetaTest/Average/MinReturn                         -52.1148
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.4926
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.4433
MetaTest/__unnamed_task__/AverageReturn            -35.4433
MetaTest/__unnamed_task__/Iteration                150
MetaTest/__unnamed_task__/MaxReturn                -21.3892
MetaTest/__unnamed_task__/MinReturn                -52.1148
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.4926
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.832e+06
__unnamed_task__/AverageDiscountedReturn           -16.9344
__unnamed_task__/AverageReturn                     -36.6461
__unnamed_task__/Iteration                         150
__unnamed_task__/MaxReturn                          21.7414
__unnamed_task__/MinReturn                         -65.8758
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.7575
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 09:56:21 | [maml_trainer] epoch #151 | Sampling for adapation and meta-testing...
2025-04-03 09:57:54 | [maml_trainer] epoch #151 | Finished meta-testing...
2025-04-03 09:57:54 | [maml_trainer] epoch #151 | Saving snapshot...
2025-04-03 09:58:18 | [maml_trainer] epoch #151 | Saved
2025-04-03 09:58:18 | [maml_trainer] epoch #151 | Time 72320.15 s
2025-04-03 09:58:18 | [maml_trainer] epoch #151 | EpochTime 488.33 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4997
Average/AverageReturn                              -35.8601
Average/Iteration                                  151
Average/MaxReturn                                   11.542
Average/MinReturn                                  -66.6681
Average/NumEpisodes                                 80
Average/StdReturn                                   11.9502
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90188
GaussianMLPPolicy/KLAfter                            0.00521105
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000194951
GaussianMLPPolicy/LossBefore                         7.7188e-09
GaussianMLPPolicy/dLoss                              0.000194958
Iteration                                          151
MetaTest/Average/AverageDiscountedReturn           -37.938
MetaTest/Average/AverageReturn                     -37.938
MetaTest/Average/Iteration                         151
MetaTest/Average/MaxReturn                         -22.3087
MetaTest/Average/MinReturn                         -52.4583
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.0219
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.938
MetaTest/__unnamed_task__/AverageReturn            -37.938
MetaTest/__unnamed_task__/Iteration                151
MetaTest/__unnamed_task__/MaxReturn                -22.3087
MetaTest/__unnamed_task__/MinReturn                -52.4583
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.0219
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.864e+06
__unnamed_task__/AverageDiscountedReturn           -16.4997
__unnamed_task__/AverageReturn                     -35.8601
__unnamed_task__/Iteration                         151
__unnamed_task__/MaxReturn                          11.542
__unnamed_task__/MinReturn                         -66.6681
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.9502
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:04:27 | [maml_trainer] epoch #152 | Sampling for adapation and meta-testing...
2025-04-03 10:05:59 | [maml_trainer] epoch #152 | Finished meta-testing...
2025-04-03 10:05:59 | [maml_trainer] epoch #152 | Saving snapshot...
2025-04-03 10:06:23 | [maml_trainer] epoch #152 | Saved
2025-04-03 10:06:23 | [maml_trainer] epoch #152 | Time 72805.52 s
2025-04-03 10:06:23 | [maml_trainer] epoch #152 | EpochTime 485.37 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4763
Average/AverageReturn                              -36.1078
Average/Iteration                                  152
Average/MaxReturn                                   10.6879
Average/MinReturn                                  -71.2778
Average/NumEpisodes                                 80
Average/StdReturn                                   12.9743
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90213
GaussianMLPPolicy/KLAfter                            0.00439413
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.37371e-05
GaussianMLPPolicy/LossBefore                         2.563e-09
GaussianMLPPolicy/dLoss                              7.37397e-05
Iteration                                          152
MetaTest/Average/AverageDiscountedReturn           -34.7759
MetaTest/Average/AverageReturn                     -34.7759
MetaTest/Average/Iteration                         152
MetaTest/Average/MaxReturn                          -4.52053
MetaTest/Average/MinReturn                         -53.8905
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.6128
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.7759
MetaTest/__unnamed_task__/AverageReturn            -34.7759
MetaTest/__unnamed_task__/Iteration                152
MetaTest/__unnamed_task__/MaxReturn                 -4.52053
MetaTest/__unnamed_task__/MinReturn                -53.8905
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.6128
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.896e+06
__unnamed_task__/AverageDiscountedReturn           -16.4763
__unnamed_task__/AverageReturn                     -36.1078
__unnamed_task__/Iteration                         152
__unnamed_task__/MaxReturn                          10.6879
__unnamed_task__/MinReturn                         -71.2778
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.9743
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:12:36 | [maml_trainer] epoch #153 | Sampling for adapation and meta-testing...
2025-04-03 10:14:10 | [maml_trainer] epoch #153 | Finished meta-testing...
2025-04-03 10:14:10 | [maml_trainer] epoch #153 | Saving snapshot...
2025-04-03 10:14:32 | [maml_trainer] epoch #153 | Saved
2025-04-03 10:14:32 | [maml_trainer] epoch #153 | Time 73294.54 s
2025-04-03 10:14:32 | [maml_trainer] epoch #153 | EpochTime 489.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3986
Average/AverageReturn                              -35.8217
Average/Iteration                                  153
Average/MaxReturn                                  -14.6199
Average/MinReturn                                  -54.6383
Average/NumEpisodes                                 80
Average/StdReturn                                    9.0894
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90332
GaussianMLPPolicy/KLAfter                            0.00502378
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000191094
GaussianMLPPolicy/LossBefore                         6.79493e-09
GaussianMLPPolicy/dLoss                             -0.000191087
Iteration                                          153
MetaTest/Average/AverageDiscountedReturn           -34.5437
MetaTest/Average/AverageReturn                     -34.5437
MetaTest/Average/Iteration                         153
MetaTest/Average/MaxReturn                         -13.2537
MetaTest/Average/MinReturn                         -70.9012
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.4941
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.5437
MetaTest/__unnamed_task__/AverageReturn            -34.5437
MetaTest/__unnamed_task__/Iteration                153
MetaTest/__unnamed_task__/MaxReturn                -13.2537
MetaTest/__unnamed_task__/MinReturn                -70.9012
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.4941
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.928e+06
__unnamed_task__/AverageDiscountedReturn           -16.3986
__unnamed_task__/AverageReturn                     -35.8217
__unnamed_task__/Iteration                         153
__unnamed_task__/MaxReturn                         -14.6199
__unnamed_task__/MinReturn                         -54.6383
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.0894
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:20:40 | [maml_trainer] epoch #154 | Sampling for adapation and meta-testing...
2025-04-03 10:22:12 | [maml_trainer] epoch #154 | Finished meta-testing...
2025-04-03 10:22:12 | [maml_trainer] epoch #154 | Saving snapshot...
2025-04-03 10:22:37 | [maml_trainer] epoch #154 | Saved
2025-04-03 10:22:37 | [maml_trainer] epoch #154 | Time 73779.23 s
2025-04-03 10:22:37 | [maml_trainer] epoch #154 | EpochTime 484.68 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.031
Average/AverageReturn                              -37.8579
Average/Iteration                                  154
Average/MaxReturn                                  -12.3388
Average/MinReturn                                  -71.7846
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1393
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90574
GaussianMLPPolicy/KLAfter                            0.00486539
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00022507
GaussianMLPPolicy/LossBefore                         1.96695e-09
GaussianMLPPolicy/dLoss                             -0.000225068
Iteration                                          154
MetaTest/Average/AverageDiscountedReturn           -36.0344
MetaTest/Average/AverageReturn                     -36.0344
MetaTest/Average/Iteration                         154
MetaTest/Average/MaxReturn                         -23.4687
MetaTest/Average/MinReturn                         -52.2
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.2918
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.0344
MetaTest/__unnamed_task__/AverageReturn            -36.0344
MetaTest/__unnamed_task__/Iteration                154
MetaTest/__unnamed_task__/MaxReturn                -23.4687
MetaTest/__unnamed_task__/MinReturn                -52.2
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.2918
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.96e+06
__unnamed_task__/AverageDiscountedReturn           -17.031
__unnamed_task__/AverageReturn                     -37.8579
__unnamed_task__/Iteration                         154
__unnamed_task__/MaxReturn                         -12.3388
__unnamed_task__/MinReturn                         -71.7846
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1393
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:28:48 | [maml_trainer] epoch #155 | Sampling for adapation and meta-testing...
2025-04-03 10:30:21 | [maml_trainer] epoch #155 | Finished meta-testing...
2025-04-03 10:30:21 | [maml_trainer] epoch #155 | Saving snapshot...
2025-04-03 10:30:45 | [maml_trainer] epoch #155 | Saved
2025-04-03 10:30:45 | [maml_trainer] epoch #155 | Time 74267.25 s
2025-04-03 10:30:45 | [maml_trainer] epoch #155 | EpochTime 488.01 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.0264
Average/AverageReturn                              -38.4375
Average/Iteration                                  155
Average/MaxReturn                                   -0.770585
Average/MinReturn                                  -74.8192
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6392
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90858
GaussianMLPPolicy/KLAfter                            0.00423401
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000186862
GaussianMLPPolicy/LossBefore                        -6.61612e-09
GaussianMLPPolicy/dLoss                             -0.000186868
Iteration                                          155
MetaTest/Average/AverageDiscountedReturn           -41.0456
MetaTest/Average/AverageReturn                     -41.0456
MetaTest/Average/Iteration                         155
MetaTest/Average/MaxReturn                         -25.5137
MetaTest/Average/MinReturn                         -63.7262
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.1715
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.0456
MetaTest/__unnamed_task__/AverageReturn            -41.0456
MetaTest/__unnamed_task__/Iteration                155
MetaTest/__unnamed_task__/MaxReturn                -25.5137
MetaTest/__unnamed_task__/MinReturn                -63.7262
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.1715
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        4.992e+06
__unnamed_task__/AverageDiscountedReturn           -17.0264
__unnamed_task__/AverageReturn                     -38.4375
__unnamed_task__/Iteration                         155
__unnamed_task__/MaxReturn                          -0.770585
__unnamed_task__/MinReturn                         -74.8192
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6392
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:36:56 | [maml_trainer] epoch #156 | Sampling for adapation and meta-testing...
2025-04-03 10:38:28 | [maml_trainer] epoch #156 | Finished meta-testing...
2025-04-03 10:38:28 | [maml_trainer] epoch #156 | Saving snapshot...
2025-04-03 10:38:51 | [maml_trainer] epoch #156 | Saved
2025-04-03 10:38:51 | [maml_trainer] epoch #156 | Time 74753.32 s
2025-04-03 10:38:51 | [maml_trainer] epoch #156 | EpochTime 486.06 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.8308
Average/AverageReturn                              -36.8811
Average/Iteration                                  156
Average/MaxReturn                                   26.0513
Average/MinReturn                                  -67.5703
Average/NumEpisodes                                 80
Average/StdReturn                                   14.1322
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91021
GaussianMLPPolicy/KLAfter                            0.00288956
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.92154e-05
GaussianMLPPolicy/LossBefore                        -5.66244e-10
GaussianMLPPolicy/dLoss                             -7.9216e-05
Iteration                                          156
MetaTest/Average/AverageDiscountedReturn           -41.0948
MetaTest/Average/AverageReturn                     -41.0948
MetaTest/Average/Iteration                         156
MetaTest/Average/MaxReturn                         -19.8492
MetaTest/Average/MinReturn                         -64.2535
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.333
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.0948
MetaTest/__unnamed_task__/AverageReturn            -41.0948
MetaTest/__unnamed_task__/Iteration                156
MetaTest/__unnamed_task__/MaxReturn                -19.8492
MetaTest/__unnamed_task__/MinReturn                -64.2535
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.333
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.024e+06
__unnamed_task__/AverageDiscountedReturn           -15.8308
__unnamed_task__/AverageReturn                     -36.8811
__unnamed_task__/Iteration                         156
__unnamed_task__/MaxReturn                          26.0513
__unnamed_task__/MinReturn                         -67.5703
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.1322
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:45:00 | [maml_trainer] epoch #157 | Sampling for adapation and meta-testing...
2025-04-03 10:46:34 | [maml_trainer] epoch #157 | Finished meta-testing...
2025-04-03 10:46:34 | [maml_trainer] epoch #157 | Saving snapshot...
2025-04-03 10:46:58 | [maml_trainer] epoch #157 | Saved
2025-04-03 10:46:58 | [maml_trainer] epoch #157 | Time 75240.04 s
2025-04-03 10:46:58 | [maml_trainer] epoch #157 | EpochTime 486.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.7353
Average/AverageReturn                              -41.5705
Average/Iteration                                  157
Average/MaxReturn                                   20.1461
Average/MinReturn                                  -78.3593
Average/NumEpisodes                                 80
Average/StdReturn                                   16.1781
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9115
GaussianMLPPolicy/KLAfter                            0.000923282
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.29448e-06
GaussianMLPPolicy/LossBefore                        -2.95043e-09
GaussianMLPPolicy/dLoss                              9.29153e-06
Iteration                                          157
MetaTest/Average/AverageDiscountedReturn           -47.1381
MetaTest/Average/AverageReturn                     -47.1381
MetaTest/Average/Iteration                         157
MetaTest/Average/MaxReturn                         -23.5102
MetaTest/Average/MinReturn                         -68.0615
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.0638
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -47.1381
MetaTest/__unnamed_task__/AverageReturn            -47.1381
MetaTest/__unnamed_task__/Iteration                157
MetaTest/__unnamed_task__/MaxReturn                -23.5102
MetaTest/__unnamed_task__/MinReturn                -68.0615
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.0638
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.056e+06
__unnamed_task__/AverageDiscountedReturn           -17.7353
__unnamed_task__/AverageReturn                     -41.5705
__unnamed_task__/Iteration                         157
__unnamed_task__/MaxReturn                          20.1461
__unnamed_task__/MinReturn                         -78.3593
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          16.1781
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 10:53:05 | [maml_trainer] epoch #158 | Sampling for adapation and meta-testing...
2025-04-03 10:54:38 | [maml_trainer] epoch #158 | Finished meta-testing...
2025-04-03 10:54:38 | [maml_trainer] epoch #158 | Saving snapshot...
2025-04-03 10:55:02 | [maml_trainer] epoch #158 | Saved
2025-04-03 10:55:02 | [maml_trainer] epoch #158 | Time 75724.45 s
2025-04-03 10:55:02 | [maml_trainer] epoch #158 | EpochTime 484.41 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.5372
Average/AverageReturn                              -44.5114
Average/Iteration                                  158
Average/MaxReturn                                  -11.9803
Average/MinReturn                                  -93.2434
Average/NumEpisodes                                 80
Average/StdReturn                                   14.206
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91294
GaussianMLPPolicy/KLAfter                            0.00143092
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.05872e-05
GaussianMLPPolicy/LossBefore                         1.02818e-08
GaussianMLPPolicy/dLoss                              5.05975e-05
Iteration                                          158
MetaTest/Average/AverageDiscountedReturn           -40.9302
MetaTest/Average/AverageReturn                     -40.9302
MetaTest/Average/Iteration                         158
MetaTest/Average/MaxReturn                         -19.3336
MetaTest/Average/MinReturn                         -63.1761
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.3966
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.9302
MetaTest/__unnamed_task__/AverageReturn            -40.9302
MetaTest/__unnamed_task__/Iteration                158
MetaTest/__unnamed_task__/MaxReturn                -19.3336
MetaTest/__unnamed_task__/MinReturn                -63.1761
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.3966
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.088e+06
__unnamed_task__/AverageDiscountedReturn           -18.5372
__unnamed_task__/AverageReturn                     -44.5114
__unnamed_task__/Iteration                         158
__unnamed_task__/MaxReturn                         -11.9803
__unnamed_task__/MinReturn                         -93.2434
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.206
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:01:14 | [maml_trainer] epoch #159 | Sampling for adapation and meta-testing...
2025-04-03 11:02:45 | [maml_trainer] epoch #159 | Finished meta-testing...
2025-04-03 11:02:45 | [maml_trainer] epoch #159 | Saving snapshot...
2025-04-03 11:03:08 | [maml_trainer] epoch #159 | Saved
2025-04-03 11:03:08 | [maml_trainer] epoch #159 | Time 76210.28 s
2025-04-03 11:03:08 | [maml_trainer] epoch #159 | EpochTime 485.82 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.9547
Average/AverageReturn                              -41.3284
Average/Iteration                                  159
Average/MaxReturn                                    9.7705
Average/MinReturn                                  -79.9277
Average/NumEpisodes                                 80
Average/StdReturn                                   15.839
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91414
GaussianMLPPolicy/KLAfter                            0.00175995
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.65166e-05
GaussianMLPPolicy/LossBefore                         3.42727e-09
GaussianMLPPolicy/dLoss                              8.652e-05
Iteration                                          159
MetaTest/Average/AverageDiscountedReturn           -43.4811
MetaTest/Average/AverageReturn                     -43.4811
MetaTest/Average/Iteration                         159
MetaTest/Average/MaxReturn                         -22.4935
MetaTest/Average/MinReturn                         -69.4047
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.0282
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -43.4811
MetaTest/__unnamed_task__/AverageReturn            -43.4811
MetaTest/__unnamed_task__/Iteration                159
MetaTest/__unnamed_task__/MaxReturn                -22.4935
MetaTest/__unnamed_task__/MinReturn                -69.4047
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.0282
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.12e+06
__unnamed_task__/AverageDiscountedReturn           -17.9547
__unnamed_task__/AverageReturn                     -41.3284
__unnamed_task__/Iteration                         159
__unnamed_task__/MaxReturn                           9.7705
__unnamed_task__/MinReturn                         -79.9277
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          15.839
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:09:22 | [maml_trainer] epoch #160 | Sampling for adapation and meta-testing...
2025-04-03 11:10:53 | [maml_trainer] epoch #160 | Finished meta-testing...
2025-04-03 11:10:53 | [maml_trainer] epoch #160 | Saving snapshot...
2025-04-03 11:11:18 | [maml_trainer] epoch #160 | Saved
2025-04-03 11:11:18 | [maml_trainer] epoch #160 | Time 76700.15 s
2025-04-03 11:11:18 | [maml_trainer] epoch #160 | EpochTime 489.87 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.2088
Average/AverageReturn                              -38.9559
Average/Iteration                                  160
Average/MaxReturn                                    2.22139
Average/MinReturn                                  -67.7909
Average/NumEpisodes                                 80
Average/StdReturn                                   14.4896
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91662
GaussianMLPPolicy/KLAfter                            0.00329621
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000188303
GaussianMLPPolicy/LossBefore                        -4.35114e-09
GaussianMLPPolicy/dLoss                              0.000188299
Iteration                                          160
MetaTest/Average/AverageDiscountedReturn           -40.8347
MetaTest/Average/AverageReturn                     -40.8347
MetaTest/Average/Iteration                         160
MetaTest/Average/MaxReturn                         -20.0823
MetaTest/Average/MinReturn                         -54.287
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.74396
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.8347
MetaTest/__unnamed_task__/AverageReturn            -40.8347
MetaTest/__unnamed_task__/Iteration                160
MetaTest/__unnamed_task__/MaxReturn                -20.0823
MetaTest/__unnamed_task__/MinReturn                -54.287
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.74396
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.152e+06
__unnamed_task__/AverageDiscountedReturn           -17.2088
__unnamed_task__/AverageReturn                     -38.9559
__unnamed_task__/Iteration                         160
__unnamed_task__/MaxReturn                           2.22139
__unnamed_task__/MinReturn                         -67.7909
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          14.4896
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:17:28 | [maml_trainer] epoch #161 | Sampling for adapation and meta-testing...
2025-04-03 11:19:01 | [maml_trainer] epoch #161 | Finished meta-testing...
2025-04-03 11:19:01 | [maml_trainer] epoch #161 | Saving snapshot...
2025-04-03 11:19:24 | [maml_trainer] epoch #161 | Saved
2025-04-03 11:19:24 | [maml_trainer] epoch #161 | Time 77186.96 s
2025-04-03 11:19:24 | [maml_trainer] epoch #161 | EpochTime 486.81 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4051
Average/AverageReturn                              -39.1382
Average/Iteration                                  161
Average/MaxReturn                                   -2.47376
Average/MinReturn                                  -76.753
Average/NumEpisodes                                 80
Average/StdReturn                                   13.7184
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9196
GaussianMLPPolicy/KLAfter                            0.00582592
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.26951e-05
GaussianMLPPolicy/LossBefore                         2.77162e-09
GaussianMLPPolicy/dLoss                              1.26979e-05
Iteration                                          161
MetaTest/Average/AverageDiscountedReturn           -35.2247
MetaTest/Average/AverageReturn                     -35.2247
MetaTest/Average/Iteration                         161
MetaTest/Average/MaxReturn                          -8.31652
MetaTest/Average/MinReturn                         -53.4364
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.0387
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.2247
MetaTest/__unnamed_task__/AverageReturn            -35.2247
MetaTest/__unnamed_task__/Iteration                161
MetaTest/__unnamed_task__/MaxReturn                 -8.31652
MetaTest/__unnamed_task__/MinReturn                -53.4364
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.0387
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.184e+06
__unnamed_task__/AverageDiscountedReturn           -17.4051
__unnamed_task__/AverageReturn                     -39.1382
__unnamed_task__/Iteration                         161
__unnamed_task__/MaxReturn                          -2.47376
__unnamed_task__/MinReturn                         -76.753
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.7184
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:25:35 | [maml_trainer] epoch #162 | Sampling for adapation and meta-testing...
2025-04-03 11:27:07 | [maml_trainer] epoch #162 | Finished meta-testing...
2025-04-03 11:27:07 | [maml_trainer] epoch #162 | Saving snapshot...
2025-04-03 11:27:30 | [maml_trainer] epoch #162 | Saved
2025-04-03 11:27:30 | [maml_trainer] epoch #162 | Time 77672.08 s
2025-04-03 11:27:30 | [maml_trainer] epoch #162 | EpochTime 485.11 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.2382
Average/AverageReturn                              -37.9348
Average/Iteration                                  162
Average/MaxReturn                                   -6.36313
Average/MinReturn                                  -69.1663
Average/NumEpisodes                                 80
Average/StdReturn                                   10.9819
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92182
GaussianMLPPolicy/KLAfter                            0.00809483
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000334566
GaussianMLPPolicy/LossBefore                         7.15255e-10
GaussianMLPPolicy/dLoss                             -0.000334566
Iteration                                          162
MetaTest/Average/AverageDiscountedReturn           -38.1668
MetaTest/Average/AverageReturn                     -38.1668
MetaTest/Average/Iteration                         162
MetaTest/Average/MaxReturn                         -19.1512
MetaTest/Average/MinReturn                         -62.6432
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.0537
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.1668
MetaTest/__unnamed_task__/AverageReturn            -38.1668
MetaTest/__unnamed_task__/Iteration                162
MetaTest/__unnamed_task__/MaxReturn                -19.1512
MetaTest/__unnamed_task__/MinReturn                -62.6432
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.0537
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.216e+06
__unnamed_task__/AverageDiscountedReturn           -17.2382
__unnamed_task__/AverageReturn                     -37.9348
__unnamed_task__/Iteration                         162
__unnamed_task__/MaxReturn                          -6.36313
__unnamed_task__/MinReturn                         -69.1663
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.9819
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:33:39 | [maml_trainer] epoch #163 | Sampling for adapation and meta-testing...
2025-04-03 11:35:13 | [maml_trainer] epoch #163 | Finished meta-testing...
2025-04-03 11:35:13 | [maml_trainer] epoch #163 | Saving snapshot...
2025-04-03 11:35:35 | [maml_trainer] epoch #163 | Saved
2025-04-03 11:35:35 | [maml_trainer] epoch #163 | Time 78157.86 s
2025-04-03 11:35:35 | [maml_trainer] epoch #163 | EpochTime 485.78 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5026
Average/AverageReturn                              -37.8803
Average/Iteration                                  163
Average/MaxReturn                                   -0.49756
Average/MinReturn                                  -70.2524
Average/NumEpisodes                                 80
Average/StdReturn                                   11.9979
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92372
GaussianMLPPolicy/KLAfter                            0.0074678
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000217917
GaussianMLPPolicy/LossBefore                         1.0252e-08
GaussianMLPPolicy/dLoss                             -0.000217906
Iteration                                          163
MetaTest/Average/AverageDiscountedReturn           -38.6711
MetaTest/Average/AverageReturn                     -38.6711
MetaTest/Average/Iteration                         163
MetaTest/Average/MaxReturn                         -27.6689
MetaTest/Average/MinReturn                         -53.0731
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.20436
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.6711
MetaTest/__unnamed_task__/AverageReturn            -38.6711
MetaTest/__unnamed_task__/Iteration                163
MetaTest/__unnamed_task__/MaxReturn                -27.6689
MetaTest/__unnamed_task__/MinReturn                -53.0731
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.20436
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.248e+06
__unnamed_task__/AverageDiscountedReturn           -17.5026
__unnamed_task__/AverageReturn                     -37.8803
__unnamed_task__/Iteration                         163
__unnamed_task__/MaxReturn                          -0.49756
__unnamed_task__/MinReturn                         -70.2524
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.9979
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:41:42 | [maml_trainer] epoch #164 | Sampling for adapation and meta-testing...
2025-04-03 11:43:13 | [maml_trainer] epoch #164 | Finished meta-testing...
2025-04-03 11:43:13 | [maml_trainer] epoch #164 | Saving snapshot...
2025-04-03 11:43:37 | [maml_trainer] epoch #164 | Saved
2025-04-03 11:43:37 | [maml_trainer] epoch #164 | Time 78639.79 s
2025-04-03 11:43:37 | [maml_trainer] epoch #164 | EpochTime 481.92 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4508
Average/AverageReturn                              -38.0253
Average/Iteration                                  164
Average/MaxReturn                                   -1.41725
Average/MinReturn                                  -63.4065
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2358
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9252
GaussianMLPPolicy/KLAfter                            0.00434748
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000101546
GaussianMLPPolicy/LossBefore                        -1.54972e-09
GaussianMLPPolicy/dLoss                             -0.000101547
Iteration                                          164
MetaTest/Average/AverageDiscountedReturn           -39.5852
MetaTest/Average/AverageReturn                     -39.5852
MetaTest/Average/Iteration                         164
MetaTest/Average/MaxReturn                         -19.8316
MetaTest/Average/MinReturn                         -64.2703
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.2958
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.5852
MetaTest/__unnamed_task__/AverageReturn            -39.5852
MetaTest/__unnamed_task__/Iteration                164
MetaTest/__unnamed_task__/MaxReturn                -19.8316
MetaTest/__unnamed_task__/MinReturn                -64.2703
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.2958
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.28e+06
__unnamed_task__/AverageDiscountedReturn           -17.4508
__unnamed_task__/AverageReturn                     -38.0253
__unnamed_task__/Iteration                         164
__unnamed_task__/MaxReturn                          -1.41725
__unnamed_task__/MinReturn                         -63.4065
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2358
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:49:44 | [maml_trainer] epoch #165 | Sampling for adapation and meta-testing...
2025-04-03 11:51:18 | [maml_trainer] epoch #165 | Finished meta-testing...
2025-04-03 11:51:18 | [maml_trainer] epoch #165 | Saving snapshot...
2025-04-03 11:51:42 | [maml_trainer] epoch #165 | Saved
2025-04-03 11:51:42 | [maml_trainer] epoch #165 | Time 79124.36 s
2025-04-03 11:51:42 | [maml_trainer] epoch #165 | EpochTime 484.58 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.9274
Average/AverageReturn                              -41.4508
Average/Iteration                                  165
Average/MaxReturn                                  -18.1973
Average/MinReturn                                  -63.3739
Average/NumEpisodes                                 80
Average/StdReturn                                   11.0073
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92644
GaussianMLPPolicy/KLAfter                            0.00398362
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000165316
GaussianMLPPolicy/LossBefore                        -1.53184e-08
GaussianMLPPolicy/dLoss                              0.000165301
Iteration                                          165
MetaTest/Average/AverageDiscountedReturn           -37.6151
MetaTest/Average/AverageReturn                     -37.6151
MetaTest/Average/Iteration                         165
MetaTest/Average/MaxReturn                         -19.5734
MetaTest/Average/MinReturn                         -56.0731
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.11992
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.6151
MetaTest/__unnamed_task__/AverageReturn            -37.6151
MetaTest/__unnamed_task__/Iteration                165
MetaTest/__unnamed_task__/MaxReturn                -19.5734
MetaTest/__unnamed_task__/MinReturn                -56.0731
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.11992
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.312e+06
__unnamed_task__/AverageDiscountedReturn           -18.9274
__unnamed_task__/AverageReturn                     -41.4508
__unnamed_task__/Iteration                         165
__unnamed_task__/MaxReturn                         -18.1973
__unnamed_task__/MinReturn                         -63.3739
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.0073
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 11:57:56 | [maml_trainer] epoch #166 | Sampling for adapation and meta-testing...
2025-04-03 11:59:27 | [maml_trainer] epoch #166 | Finished meta-testing...
2025-04-03 11:59:27 | [maml_trainer] epoch #166 | Saving snapshot...
2025-04-03 11:59:50 | [maml_trainer] epoch #166 | Saved
2025-04-03 11:59:50 | [maml_trainer] epoch #166 | Time 79612.60 s
2025-04-03 11:59:50 | [maml_trainer] epoch #166 | EpochTime 488.24 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.3766
Average/AverageReturn                              -40.2817
Average/Iteration                                  166
Average/MaxReturn                                  -22.2832
Average/MinReturn                                  -69.1998
Average/NumEpisodes                                 80
Average/StdReturn                                   11.0683
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92881
GaussianMLPPolicy/KLAfter                            0.00498944
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.03549e-05
GaussianMLPPolicy/LossBefore                         1.40667e-08
GaussianMLPPolicy/dLoss                             -1.03408e-05
Iteration                                          166
MetaTest/Average/AverageDiscountedReturn           -36.7504
MetaTest/Average/AverageReturn                     -36.7504
MetaTest/Average/Iteration                         166
MetaTest/Average/MaxReturn                         -15.5731
MetaTest/Average/MinReturn                         -62.9034
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.7647
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.7504
MetaTest/__unnamed_task__/AverageReturn            -36.7504
MetaTest/__unnamed_task__/Iteration                166
MetaTest/__unnamed_task__/MaxReturn                -15.5731
MetaTest/__unnamed_task__/MinReturn                -62.9034
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.7647
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.344e+06
__unnamed_task__/AverageDiscountedReturn           -18.3766
__unnamed_task__/AverageReturn                     -40.2817
__unnamed_task__/Iteration                         166
__unnamed_task__/MaxReturn                         -22.2832
__unnamed_task__/MinReturn                         -69.1998
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.0683
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:05:57 | [maml_trainer] epoch #167 | Sampling for adapation and meta-testing...
2025-04-03 12:07:28 | [maml_trainer] epoch #167 | Finished meta-testing...
2025-04-03 12:07:28 | [maml_trainer] epoch #167 | Saving snapshot...
2025-04-03 12:07:53 | [maml_trainer] epoch #167 | Saved
2025-04-03 12:07:53 | [maml_trainer] epoch #167 | Time 80095.27 s
2025-04-03 12:07:53 | [maml_trainer] epoch #167 | EpochTime 482.66 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.7825
Average/AverageReturn                              -37.7212
Average/Iteration                                  167
Average/MaxReturn                                  -13.5621
Average/MinReturn                                  -67.3516
Average/NumEpisodes                                 80
Average/StdReturn                                   11.2073
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93182
GaussianMLPPolicy/KLAfter                            0.00720842
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.86845e-05
GaussianMLPPolicy/LossBefore                        -6.55651e-10
GaussianMLPPolicy/dLoss                              9.86839e-05
Iteration                                          167
MetaTest/Average/AverageDiscountedReturn           -32.9755
MetaTest/Average/AverageReturn                     -32.9755
MetaTest/Average/Iteration                         167
MetaTest/Average/MaxReturn                          -3.35965
MetaTest/Average/MinReturn                         -47.9338
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.88932
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.9755
MetaTest/__unnamed_task__/AverageReturn            -32.9755
MetaTest/__unnamed_task__/Iteration                167
MetaTest/__unnamed_task__/MaxReturn                 -3.35965
MetaTest/__unnamed_task__/MinReturn                -47.9338
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.88932
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.376e+06
__unnamed_task__/AverageDiscountedReturn           -17.7825
__unnamed_task__/AverageReturn                     -37.7212
__unnamed_task__/Iteration                         167
__unnamed_task__/MaxReturn                         -13.5621
__unnamed_task__/MinReturn                         -67.3516
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.2073
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:14:05 | [maml_trainer] epoch #168 | Sampling for adapation and meta-testing...
2025-04-03 12:15:37 | [maml_trainer] epoch #168 | Finished meta-testing...
2025-04-03 12:15:37 | [maml_trainer] epoch #168 | Saving snapshot...
2025-04-03 12:16:00 | [maml_trainer] epoch #168 | Saved
2025-04-03 12:16:00 | [maml_trainer] epoch #168 | Time 80582.74 s
2025-04-03 12:16:00 | [maml_trainer] epoch #168 | EpochTime 487.46 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7216
Average/AverageReturn                              -35.8118
Average/Iteration                                  168
Average/MaxReturn                                    4.20373
Average/MinReturn                                  -55.5999
Average/NumEpisodes                                 80
Average/StdReturn                                   11.0962
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93377
GaussianMLPPolicy/KLAfter                            0.00950155
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000235806
GaussianMLPPolicy/LossBefore                         1.43051e-09
GaussianMLPPolicy/dLoss                              0.000235807
Iteration                                          168
MetaTest/Average/AverageDiscountedReturn           -38.9756
MetaTest/Average/AverageReturn                     -38.9756
MetaTest/Average/Iteration                         168
MetaTest/Average/MaxReturn                         -26.0064
MetaTest/Average/MinReturn                         -56.9663
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.82099
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.9756
MetaTest/__unnamed_task__/AverageReturn            -38.9756
MetaTest/__unnamed_task__/Iteration                168
MetaTest/__unnamed_task__/MaxReturn                -26.0064
MetaTest/__unnamed_task__/MinReturn                -56.9663
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.82099
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.408e+06
__unnamed_task__/AverageDiscountedReturn           -16.7216
__unnamed_task__/AverageReturn                     -35.8118
__unnamed_task__/Iteration                         168
__unnamed_task__/MaxReturn                           4.20373
__unnamed_task__/MinReturn                         -55.5999
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.0962
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:22:09 | [maml_trainer] epoch #169 | Sampling for adapation and meta-testing...
2025-04-03 12:23:42 | [maml_trainer] epoch #169 | Finished meta-testing...
2025-04-03 12:23:42 | [maml_trainer] epoch #169 | Saving snapshot...
2025-04-03 12:24:05 | [maml_trainer] epoch #169 | Saved
2025-04-03 12:24:05 | [maml_trainer] epoch #169 | Time 81067.55 s
2025-04-03 12:24:05 | [maml_trainer] epoch #169 | EpochTime 484.81 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8135
Average/AverageReturn                              -34.864
Average/Iteration                                  169
Average/MaxReturn                                    3.96113
Average/MinReturn                                  -56.588
Average/NumEpisodes                                 80
Average/StdReturn                                   10.9303
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93647
GaussianMLPPolicy/KLAfter                            0.0127655
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.64948e-05
GaussianMLPPolicy/LossBefore                         3.75509e-09
GaussianMLPPolicy/dLoss                              5.64986e-05
Iteration                                          169
MetaTest/Average/AverageDiscountedReturn           -35.6844
MetaTest/Average/AverageReturn                     -35.6844
MetaTest/Average/Iteration                         169
MetaTest/Average/MaxReturn                         -23.6645
MetaTest/Average/MinReturn                         -54.3199
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.49165
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.6844
MetaTest/__unnamed_task__/AverageReturn            -35.6844
MetaTest/__unnamed_task__/Iteration                169
MetaTest/__unnamed_task__/MaxReturn                -23.6645
MetaTest/__unnamed_task__/MinReturn                -54.3199
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.49165
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.44e+06
__unnamed_task__/AverageDiscountedReturn           -16.8135
__unnamed_task__/AverageReturn                     -34.864
__unnamed_task__/Iteration                         169
__unnamed_task__/MaxReturn                           3.96113
__unnamed_task__/MinReturn                         -56.588
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.9303
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:30:18 | [maml_trainer] epoch #170 | Sampling for adapation and meta-testing...
2025-04-03 12:31:50 | [maml_trainer] epoch #170 | Finished meta-testing...
2025-04-03 12:31:50 | [maml_trainer] epoch #170 | Saving snapshot...
2025-04-03 12:32:14 | [maml_trainer] epoch #170 | Saved
2025-04-03 12:32:14 | [maml_trainer] epoch #170 | Time 81556.27 s
2025-04-03 12:32:14 | [maml_trainer] epoch #170 | EpochTime 488.72 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2696
Average/AverageReturn                              -33.725
Average/Iteration                                  170
Average/MaxReturn                                    8.78846
Average/MinReturn                                  -60.6232
Average/NumEpisodes                                 80
Average/StdReturn                                   13.2126
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93923
GaussianMLPPolicy/KLAfter                            0.0134388
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000239196
GaussianMLPPolicy/LossBefore                         2.67327e-08
GaussianMLPPolicy/dLoss                             -0.000239169
Iteration                                          170
MetaTest/Average/AverageDiscountedReturn           -36.4234
MetaTest/Average/AverageReturn                     -36.4234
MetaTest/Average/Iteration                         170
MetaTest/Average/MaxReturn                         -18.7264
MetaTest/Average/MinReturn                         -67.2359
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.231
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.4234
MetaTest/__unnamed_task__/AverageReturn            -36.4234
MetaTest/__unnamed_task__/Iteration                170
MetaTest/__unnamed_task__/MaxReturn                -18.7264
MetaTest/__unnamed_task__/MinReturn                -67.2359
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.231
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.472e+06
__unnamed_task__/AverageDiscountedReturn           -16.2696
__unnamed_task__/AverageReturn                     -33.725
__unnamed_task__/Iteration                         170
__unnamed_task__/MaxReturn                           8.78846
__unnamed_task__/MinReturn                         -60.6232
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.2126
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:38:23 | [maml_trainer] epoch #171 | Sampling for adapation and meta-testing...
2025-04-03 12:39:54 | [maml_trainer] epoch #171 | Finished meta-testing...
2025-04-03 12:39:54 | [maml_trainer] epoch #171 | Saving snapshot...
2025-04-03 12:40:18 | [maml_trainer] epoch #171 | Saved
2025-04-03 12:40:18 | [maml_trainer] epoch #171 | Time 82040.05 s
2025-04-03 12:40:18 | [maml_trainer] epoch #171 | EpochTime 483.78 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7615
Average/AverageReturn                              -33.3894
Average/Iteration                                  171
Average/MaxReturn                                   29.0443
Average/MinReturn                                  -67.675
Average/NumEpisodes                                 80
Average/StdReturn                                   12.2029
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93922
GaussianMLPPolicy/KLAfter                            0.0137917
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.00127e-05
GaussianMLPPolicy/LossBefore                        -2.68221e-09
GaussianMLPPolicy/dLoss                             -4.00154e-05
Iteration                                          171
MetaTest/Average/AverageDiscountedReturn           -42.6443
MetaTest/Average/AverageReturn                     -42.6443
MetaTest/Average/Iteration                         171
MetaTest/Average/MaxReturn                         -16.7762
MetaTest/Average/MinReturn                         -67.4644
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.7904
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.6443
MetaTest/__unnamed_task__/AverageReturn            -42.6443
MetaTest/__unnamed_task__/Iteration                171
MetaTest/__unnamed_task__/MaxReturn                -16.7762
MetaTest/__unnamed_task__/MinReturn                -67.4644
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.7904
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.504e+06
__unnamed_task__/AverageDiscountedReturn           -15.7615
__unnamed_task__/AverageReturn                     -33.3894
__unnamed_task__/Iteration                         171
__unnamed_task__/MaxReturn                          29.0443
__unnamed_task__/MinReturn                         -67.675
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.2029
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:46:25 | [maml_trainer] epoch #172 | Sampling for adapation and meta-testing...
2025-04-03 12:47:57 | [maml_trainer] epoch #172 | Finished meta-testing...
2025-04-03 12:47:57 | [maml_trainer] epoch #172 | Saving snapshot...
2025-04-03 12:48:20 | [maml_trainer] epoch #172 | Saved
2025-04-03 12:48:20 | [maml_trainer] epoch #172 | Time 82522.09 s
2025-04-03 12:48:20 | [maml_trainer] epoch #172 | EpochTime 482.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4595
Average/AverageReturn                              -38.1847
Average/Iteration                                  172
Average/MaxReturn                                   -4.66261
Average/MinReturn                                  -80.6419
Average/NumEpisodes                                 80
Average/StdReturn                                   13.2492
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93781
GaussianMLPPolicy/KLAfter                            0.00927553
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000111091
GaussianMLPPolicy/LossBefore                         6.19888e-09
GaussianMLPPolicy/dLoss                              0.000111097
Iteration                                          172
MetaTest/Average/AverageDiscountedReturn           -40.2493
MetaTest/Average/AverageReturn                     -40.2493
MetaTest/Average/Iteration                         172
MetaTest/Average/MaxReturn                          -8.26547
MetaTest/Average/MinReturn                         -69.5887
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.5033
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.2493
MetaTest/__unnamed_task__/AverageReturn            -40.2493
MetaTest/__unnamed_task__/Iteration                172
MetaTest/__unnamed_task__/MaxReturn                 -8.26547
MetaTest/__unnamed_task__/MinReturn                -69.5887
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.5033
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.536e+06
__unnamed_task__/AverageDiscountedReturn           -17.4595
__unnamed_task__/AverageReturn                     -38.1847
__unnamed_task__/Iteration                         172
__unnamed_task__/MaxReturn                          -4.66261
__unnamed_task__/MinReturn                         -80.6419
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.2492
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 12:54:28 | [maml_trainer] epoch #173 | Sampling for adapation and meta-testing...
2025-04-03 12:56:01 | [maml_trainer] epoch #173 | Finished meta-testing...
2025-04-03 12:56:01 | [maml_trainer] epoch #173 | Saving snapshot...
2025-04-03 12:56:26 | [maml_trainer] epoch #173 | Saved
2025-04-03 12:56:26 | [maml_trainer] epoch #173 | Time 83008.41 s
2025-04-03 12:56:26 | [maml_trainer] epoch #173 | EpochTime 486.32 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.2216
Average/AverageReturn                              -43.8303
Average/Iteration                                  173
Average/MaxReturn                                  -21.9266
Average/MinReturn                                  -72.7534
Average/NumEpisodes                                 80
Average/StdReturn                                   13.7316
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93558
GaussianMLPPolicy/KLAfter                            0.010392
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000150405
GaussianMLPPolicy/LossBefore                        -2.68221e-09
GaussianMLPPolicy/dLoss                             -0.000150408
Iteration                                          173
MetaTest/Average/AverageDiscountedReturn           -42.0648
MetaTest/Average/AverageReturn                     -42.0648
MetaTest/Average/Iteration                         173
MetaTest/Average/MaxReturn                         -21.3742
MetaTest/Average/MinReturn                         -72.6816
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.016
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -42.0648
MetaTest/__unnamed_task__/AverageReturn            -42.0648
MetaTest/__unnamed_task__/Iteration                173
MetaTest/__unnamed_task__/MaxReturn                -21.3742
MetaTest/__unnamed_task__/MinReturn                -72.6816
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.016
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.568e+06
__unnamed_task__/AverageDiscountedReturn           -19.2216
__unnamed_task__/AverageReturn                     -43.8303
__unnamed_task__/Iteration                         173
__unnamed_task__/MaxReturn                         -21.9266
__unnamed_task__/MinReturn                         -72.7534
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.7316
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:02:38 | [maml_trainer] epoch #174 | Sampling for adapation and meta-testing...
2025-04-03 13:04:08 | [maml_trainer] epoch #174 | Finished meta-testing...
2025-04-03 13:04:08 | [maml_trainer] epoch #174 | Saving snapshot...
2025-04-03 13:04:32 | [maml_trainer] epoch #174 | Saved
2025-04-03 13:04:32 | [maml_trainer] epoch #174 | Time 83494.74 s
2025-04-03 13:04:32 | [maml_trainer] epoch #174 | EpochTime 486.32 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.9168
Average/AverageReturn                              -43.5529
Average/Iteration                                  174
Average/MaxReturn                                  -18.4189
Average/MinReturn                                  -71.5763
Average/NumEpisodes                                 80
Average/StdReturn                                   13.0359
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9334
GaussianMLPPolicy/KLAfter                            0.00686139
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.81222e-05
GaussianMLPPolicy/LossBefore                        -6.22869e-09
GaussianMLPPolicy/dLoss                             -7.81284e-05
Iteration                                          174
MetaTest/Average/AverageDiscountedReturn           -44.5722
MetaTest/Average/AverageReturn                     -44.5722
MetaTest/Average/Iteration                         174
MetaTest/Average/MaxReturn                         -24.6291
MetaTest/Average/MinReturn                         -75.5275
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.6373
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -44.5722
MetaTest/__unnamed_task__/AverageReturn            -44.5722
MetaTest/__unnamed_task__/Iteration                174
MetaTest/__unnamed_task__/MaxReturn                -24.6291
MetaTest/__unnamed_task__/MinReturn                -75.5275
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.6373
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.6e+06
__unnamed_task__/AverageDiscountedReturn           -18.9168
__unnamed_task__/AverageReturn                     -43.5529
__unnamed_task__/Iteration                         174
__unnamed_task__/MaxReturn                         -18.4189
__unnamed_task__/MinReturn                         -71.5763
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.0359
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:10:41 | [maml_trainer] epoch #175 | Sampling for adapation and meta-testing...
2025-04-03 13:12:12 | [maml_trainer] epoch #175 | Finished meta-testing...
2025-04-03 13:12:12 | [maml_trainer] epoch #175 | Saving snapshot...
2025-04-03 13:12:34 | [maml_trainer] epoch #175 | Saved
2025-04-03 13:12:34 | [maml_trainer] epoch #175 | Time 83976.81 s
2025-04-03 13:12:34 | [maml_trainer] epoch #175 | EpochTime 482.07 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.8875
Average/AverageReturn                              -43.4891
Average/Iteration                                  175
Average/MaxReturn                                  -20.2668
Average/MinReturn                                  -79.5002
Average/NumEpisodes                                 80
Average/StdReturn                                   12.1537
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.93169
GaussianMLPPolicy/KLAfter                            0.00523219
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.45678e-05
GaussianMLPPolicy/LossBefore                         7.36117e-09
GaussianMLPPolicy/dLoss                              7.45752e-05
Iteration                                          175
MetaTest/Average/AverageDiscountedReturn           -45.061
MetaTest/Average/AverageReturn                     -45.061
MetaTest/Average/Iteration                         175
MetaTest/Average/MaxReturn                         -24.8088
MetaTest/Average/MinReturn                         -66.0434
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.7787
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -45.061
MetaTest/__unnamed_task__/AverageReturn            -45.061
MetaTest/__unnamed_task__/Iteration                175
MetaTest/__unnamed_task__/MaxReturn                -24.8088
MetaTest/__unnamed_task__/MinReturn                -66.0434
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.7787
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.632e+06
__unnamed_task__/AverageDiscountedReturn           -18.8875
__unnamed_task__/AverageReturn                     -43.4891
__unnamed_task__/Iteration                         175
__unnamed_task__/MaxReturn                         -20.2668
__unnamed_task__/MinReturn                         -79.5002
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.1537
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:18:43 | [maml_trainer] epoch #176 | Sampling for adapation and meta-testing...
2025-04-03 13:20:14 | [maml_trainer] epoch #176 | Finished meta-testing...
2025-04-03 13:20:14 | [maml_trainer] epoch #176 | Saving snapshot...
2025-04-03 13:20:38 | [maml_trainer] epoch #176 | Saved
2025-04-03 13:20:38 | [maml_trainer] epoch #176 | Time 84460.39 s
2025-04-03 13:20:38 | [maml_trainer] epoch #176 | EpochTime 483.58 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.5795
Average/AverageReturn                              -42.6323
Average/Iteration                                  176
Average/MaxReturn                                  -14.1417
Average/MinReturn                                  -72.5405
Average/NumEpisodes                                 80
Average/StdReturn                                   12.8949
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92993
GaussianMLPPolicy/KLAfter                            0.00449011
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000183198
GaussianMLPPolicy/LossBefore                         1.77622e-08
GaussianMLPPolicy/dLoss                              0.000183215
Iteration                                          176
MetaTest/Average/AverageDiscountedReturn           -41.3317
MetaTest/Average/AverageReturn                     -41.3317
MetaTest/Average/Iteration                         176
MetaTest/Average/MaxReturn                         -22.0629
MetaTest/Average/MinReturn                         -68.9359
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.2873
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -41.3317
MetaTest/__unnamed_task__/AverageReturn            -41.3317
MetaTest/__unnamed_task__/Iteration                176
MetaTest/__unnamed_task__/MaxReturn                -22.0629
MetaTest/__unnamed_task__/MinReturn                -68.9359
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.2873
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.664e+06
__unnamed_task__/AverageDiscountedReturn           -18.5795
__unnamed_task__/AverageReturn                     -42.6323
__unnamed_task__/Iteration                         176
__unnamed_task__/MaxReturn                         -14.1417
__unnamed_task__/MinReturn                         -72.5405
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.8949
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:26:42 | [maml_trainer] epoch #177 | Sampling for adapation and meta-testing...
2025-04-03 13:28:13 | [maml_trainer] epoch #177 | Finished meta-testing...
2025-04-03 13:28:13 | [maml_trainer] epoch #177 | Saving snapshot...
2025-04-03 13:28:37 | [maml_trainer] epoch #177 | Saved
2025-04-03 13:28:37 | [maml_trainer] epoch #177 | Time 84939.63 s
2025-04-03 13:28:37 | [maml_trainer] epoch #177 | EpochTime 479.24 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -19.1962
Average/AverageReturn                              -42.3527
Average/Iteration                                  177
Average/MaxReturn                                  -15.3382
Average/MinReturn                                  -71.8713
Average/NumEpisodes                                 80
Average/StdReturn                                   12.4845
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92852
GaussianMLPPolicy/KLAfter                            0.0036776
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000111772
GaussianMLPPolicy/LossBefore                         1.71065e-08
GaussianMLPPolicy/dLoss                              0.000111789
Iteration                                          177
MetaTest/Average/AverageDiscountedReturn           -44.1123
MetaTest/Average/AverageReturn                     -44.1123
MetaTest/Average/Iteration                         177
MetaTest/Average/MaxReturn                         -23.344
MetaTest/Average/MinReturn                         -74.8514
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.8667
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -44.1123
MetaTest/__unnamed_task__/AverageReturn            -44.1123
MetaTest/__unnamed_task__/Iteration                177
MetaTest/__unnamed_task__/MaxReturn                -23.344
MetaTest/__unnamed_task__/MinReturn                -74.8514
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.8667
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.696e+06
__unnamed_task__/AverageDiscountedReturn           -19.1962
__unnamed_task__/AverageReturn                     -42.3527
__unnamed_task__/Iteration                         177
__unnamed_task__/MaxReturn                         -15.3382
__unnamed_task__/MinReturn                         -71.8713
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.4845
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:34:47 | [maml_trainer] epoch #178 | Sampling for adapation and meta-testing...
2025-04-03 13:36:18 | [maml_trainer] epoch #178 | Finished meta-testing...
2025-04-03 13:36:18 | [maml_trainer] epoch #178 | Saving snapshot...
2025-04-03 13:36:41 | [maml_trainer] epoch #178 | Saved
2025-04-03 13:36:41 | [maml_trainer] epoch #178 | Time 85423.57 s
2025-04-03 13:36:41 | [maml_trainer] epoch #178 | EpochTime 483.93 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.7559
Average/AverageReturn                              -38.5987
Average/Iteration                                  178
Average/MaxReturn                                    0.75531
Average/MinReturn                                  -72.6703
Average/NumEpisodes                                 80
Average/StdReturn                                   13.3796
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92651
GaussianMLPPolicy/KLAfter                            0.00410242
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000157476
GaussianMLPPolicy/LossBefore                         7.83801e-09
GaussianMLPPolicy/dLoss                              0.000157484
Iteration                                          178
MetaTest/Average/AverageDiscountedReturn           -35.9784
MetaTest/Average/AverageReturn                     -35.9784
MetaTest/Average/Iteration                         178
MetaTest/Average/MaxReturn                         -13.7658
MetaTest/Average/MinReturn                         -62.6854
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.5551
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.9784
MetaTest/__unnamed_task__/AverageReturn            -35.9784
MetaTest/__unnamed_task__/Iteration                178
MetaTest/__unnamed_task__/MaxReturn                -13.7658
MetaTest/__unnamed_task__/MinReturn                -62.6854
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.5551
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.728e+06
__unnamed_task__/AverageDiscountedReturn           -17.7559
__unnamed_task__/AverageReturn                     -38.5987
__unnamed_task__/Iteration                         178
__unnamed_task__/MaxReturn                           0.75531
__unnamed_task__/MinReturn                         -72.6703
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.3796
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:42:50 | [maml_trainer] epoch #179 | Sampling for adapation and meta-testing...
2025-04-03 13:44:21 | [maml_trainer] epoch #179 | Finished meta-testing...
2025-04-03 13:44:21 | [maml_trainer] epoch #179 | Saving snapshot...
2025-04-03 13:44:45 | [maml_trainer] epoch #179 | Saved
2025-04-03 13:44:45 | [maml_trainer] epoch #179 | Time 85907.14 s
2025-04-03 13:44:45 | [maml_trainer] epoch #179 | EpochTime 483.56 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8648
Average/AverageReturn                              -35.0683
Average/Iteration                                  179
Average/MaxReturn                                  -10.4077
Average/MinReturn                                  -67.7046
Average/NumEpisodes                                 80
Average/StdReturn                                   11.9093
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.92447
GaussianMLPPolicy/KLAfter                            0.00597345
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000310171
GaussianMLPPolicy/LossBefore                        -6.02007e-09
GaussianMLPPolicy/dLoss                              0.000310165
Iteration                                          179
MetaTest/Average/AverageDiscountedReturn           -36.6653
MetaTest/Average/AverageReturn                     -36.6653
MetaTest/Average/Iteration                         179
MetaTest/Average/MaxReturn                          -1.22485
MetaTest/Average/MinReturn                         -64.927
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.5154
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.6653
MetaTest/__unnamed_task__/AverageReturn            -36.6653
MetaTest/__unnamed_task__/Iteration                179
MetaTest/__unnamed_task__/MaxReturn                 -1.22485
MetaTest/__unnamed_task__/MinReturn                -64.927
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.5154
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.76e+06
__unnamed_task__/AverageDiscountedReturn           -16.8648
__unnamed_task__/AverageReturn                     -35.0683
__unnamed_task__/Iteration                         179
__unnamed_task__/MaxReturn                         -10.4077
__unnamed_task__/MinReturn                         -67.7046
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.9093
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:50:51 | [maml_trainer] epoch #180 | Sampling for adapation and meta-testing...
2025-04-03 13:52:23 | [maml_trainer] epoch #180 | Finished meta-testing...
2025-04-03 13:52:23 | [maml_trainer] epoch #180 | Saving snapshot...
2025-04-03 13:52:45 | [maml_trainer] epoch #180 | Saved
2025-04-03 13:52:45 | [maml_trainer] epoch #180 | Time 86387.66 s
2025-04-03 13:52:45 | [maml_trainer] epoch #180 | EpochTime 480.52 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.3611
Average/AverageReturn                              -35.9193
Average/Iteration                                  180
Average/MaxReturn                                  -16.6309
Average/MinReturn                                  -66.529
Average/NumEpisodes                                 80
Average/StdReturn                                   12.1033
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9214
GaussianMLPPolicy/KLAfter                            0.00413176
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000159483
GaussianMLPPolicy/LossBefore                        -2.09212e-08
GaussianMLPPolicy/dLoss                             -0.000159504
Iteration                                          180
MetaTest/Average/AverageDiscountedReturn           -34.9075
MetaTest/Average/AverageReturn                     -34.9075
MetaTest/Average/Iteration                         180
MetaTest/Average/MaxReturn                           5.48008
MetaTest/Average/MinReturn                         -55.2213
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          15.3854
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.9075
MetaTest/__unnamed_task__/AverageReturn            -34.9075
MetaTest/__unnamed_task__/Iteration                180
MetaTest/__unnamed_task__/MaxReturn                  5.48008
MetaTest/__unnamed_task__/MinReturn                -55.2213
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 15.3854
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.792e+06
__unnamed_task__/AverageDiscountedReturn           -17.3611
__unnamed_task__/AverageReturn                     -35.9193
__unnamed_task__/Iteration                         180
__unnamed_task__/MaxReturn                         -16.6309
__unnamed_task__/MinReturn                         -66.529
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.1033
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 13:58:50 | [maml_trainer] epoch #181 | Sampling for adapation and meta-testing...
2025-04-03 14:00:20 | [maml_trainer] epoch #181 | Finished meta-testing...
2025-04-03 14:00:20 | [maml_trainer] epoch #181 | Saving snapshot...
2025-04-03 14:00:45 | [maml_trainer] epoch #181 | Saved
2025-04-03 14:00:45 | [maml_trainer] epoch #181 | Time 86867.41 s
2025-04-03 14:00:45 | [maml_trainer] epoch #181 | EpochTime 479.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2648
Average/AverageReturn                              -33.5734
Average/Iteration                                  181
Average/MaxReturn                                    5.18389
Average/MinReturn                                  -65.9218
Average/NumEpisodes                                 80
Average/StdReturn                                   10.9182
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91978
GaussianMLPPolicy/KLAfter                            0.00764583
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000236951
GaussianMLPPolicy/LossBefore                        -1.14441e-08
GaussianMLPPolicy/dLoss                              0.00023694
Iteration                                          181
MetaTest/Average/AverageDiscountedReturn           -35.3499
MetaTest/Average/AverageReturn                     -35.3499
MetaTest/Average/Iteration                         181
MetaTest/Average/MaxReturn                          -1.85999
MetaTest/Average/MinReturn                         -67.5439
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.6811
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.3499
MetaTest/__unnamed_task__/AverageReturn            -35.3499
MetaTest/__unnamed_task__/Iteration                181
MetaTest/__unnamed_task__/MaxReturn                 -1.85999
MetaTest/__unnamed_task__/MinReturn                -67.5439
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.6811
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.824e+06
__unnamed_task__/AverageDiscountedReturn           -16.2648
__unnamed_task__/AverageReturn                     -33.5734
__unnamed_task__/Iteration                         181
__unnamed_task__/MaxReturn                           5.18389
__unnamed_task__/MinReturn                         -65.9218
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.9182
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:06:49 | [maml_trainer] epoch #182 | Sampling for adapation and meta-testing...
2025-04-03 14:08:22 | [maml_trainer] epoch #182 | Finished meta-testing...
2025-04-03 14:08:22 | [maml_trainer] epoch #182 | Saving snapshot...
2025-04-03 14:08:46 | [maml_trainer] epoch #182 | Saved
2025-04-03 14:08:46 | [maml_trainer] epoch #182 | Time 87348.25 s
2025-04-03 14:08:46 | [maml_trainer] epoch #182 | EpochTime 480.84 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.6921
Average/AverageReturn                              -35.0974
Average/Iteration                                  182
Average/MaxReturn                                   -8.62579
Average/MinReturn                                  -58.9227
Average/NumEpisodes                                 80
Average/StdReturn                                    9.15752
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91939
GaussianMLPPolicy/KLAfter                            0.00448337
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.5956e-05
GaussianMLPPolicy/LossBefore                        -1.28746e-08
GaussianMLPPolicy/dLoss                              7.59432e-05
Iteration                                          182
MetaTest/Average/AverageDiscountedReturn           -38.6345
MetaTest/Average/AverageReturn                     -38.6345
MetaTest/Average/Iteration                         182
MetaTest/Average/MaxReturn                         -27.5427
MetaTest/Average/MinReturn                         -57.9949
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.04562
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.6345
MetaTest/__unnamed_task__/AverageReturn            -38.6345
MetaTest/__unnamed_task__/Iteration                182
MetaTest/__unnamed_task__/MaxReturn                -27.5427
MetaTest/__unnamed_task__/MinReturn                -57.9949
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.04562
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.856e+06
__unnamed_task__/AverageDiscountedReturn           -16.6921
__unnamed_task__/AverageReturn                     -35.0974
__unnamed_task__/Iteration                         182
__unnamed_task__/MaxReturn                          -8.62579
__unnamed_task__/MinReturn                         -58.9227
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.15752
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:14:56 | [maml_trainer] epoch #183 | Sampling for adapation and meta-testing...
2025-04-03 14:16:28 | [maml_trainer] epoch #183 | Finished meta-testing...
2025-04-03 14:16:28 | [maml_trainer] epoch #183 | Saving snapshot...
2025-04-03 14:16:50 | [maml_trainer] epoch #183 | Saved
2025-04-03 14:16:50 | [maml_trainer] epoch #183 | Time 87832.59 s
2025-04-03 14:16:50 | [maml_trainer] epoch #183 | EpochTime 484.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.525
Average/AverageReturn                              -32.6226
Average/Iteration                                  183
Average/MaxReturn                                   -3.50168
Average/MinReturn                                  -59.8035
Average/NumEpisodes                                 80
Average/StdReturn                                   11.0025
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9199
GaussianMLPPolicy/KLAfter                            0.00356724
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000121935
GaussianMLPPolicy/LossBefore                        -5.00679e-09
GaussianMLPPolicy/dLoss                             -0.00012194
Iteration                                          183
MetaTest/Average/AverageDiscountedReturn           -35.2413
MetaTest/Average/AverageReturn                     -35.2413
MetaTest/Average/Iteration                         183
MetaTest/Average/MaxReturn                         -20.6906
MetaTest/Average/MinReturn                         -49.9661
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.0296
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.2413
MetaTest/__unnamed_task__/AverageReturn            -35.2413
MetaTest/__unnamed_task__/Iteration                183
MetaTest/__unnamed_task__/MaxReturn                -20.6906
MetaTest/__unnamed_task__/MinReturn                -49.9661
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.0296
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.888e+06
__unnamed_task__/AverageDiscountedReturn           -15.525
__unnamed_task__/AverageReturn                     -32.6226
__unnamed_task__/Iteration                         183
__unnamed_task__/MaxReturn                          -3.50168
__unnamed_task__/MinReturn                         -59.8035
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.0025
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:22:55 | [maml_trainer] epoch #184 | Sampling for adapation and meta-testing...
2025-04-03 14:24:26 | [maml_trainer] epoch #184 | Finished meta-testing...
2025-04-03 14:24:26 | [maml_trainer] epoch #184 | Saving snapshot...
2025-04-03 14:24:49 | [maml_trainer] epoch #184 | Saved
2025-04-03 14:24:49 | [maml_trainer] epoch #184 | Time 88311.69 s
2025-04-03 14:24:49 | [maml_trainer] epoch #184 | EpochTime 479.09 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2285
Average/AverageReturn                              -33.9458
Average/Iteration                                  184
Average/MaxReturn                                   11.82
Average/MinReturn                                  -52.7553
Average/NumEpisodes                                 80
Average/StdReturn                                   10.9905
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91959
GaussianMLPPolicy/KLAfter                            0.00171216
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.55854e-05
GaussianMLPPolicy/LossBefore                         9.05991e-09
GaussianMLPPolicy/dLoss                              2.55945e-05
Iteration                                          184
MetaTest/Average/AverageDiscountedReturn           -38.3054
MetaTest/Average/AverageReturn                     -38.3054
MetaTest/Average/Iteration                         184
MetaTest/Average/MaxReturn                         -23.2586
MetaTest/Average/MinReturn                         -58.2121
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.92245
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.3054
MetaTest/__unnamed_task__/AverageReturn            -38.3054
MetaTest/__unnamed_task__/Iteration                184
MetaTest/__unnamed_task__/MaxReturn                -23.2586
MetaTest/__unnamed_task__/MinReturn                -58.2121
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.92245
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.92e+06
__unnamed_task__/AverageDiscountedReturn           -16.2285
__unnamed_task__/AverageReturn                     -33.9458
__unnamed_task__/Iteration                         184
__unnamed_task__/MaxReturn                          11.82
__unnamed_task__/MinReturn                         -52.7553
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.9905
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:31:01 | [maml_trainer] epoch #185 | Sampling for adapation and meta-testing...
2025-04-03 14:32:33 | [maml_trainer] epoch #185 | Finished meta-testing...
2025-04-03 14:32:33 | [maml_trainer] epoch #185 | Saving snapshot...
2025-04-03 14:32:57 | [maml_trainer] epoch #185 | Saved
2025-04-03 14:32:57 | [maml_trainer] epoch #185 | Time 88799.72 s
2025-04-03 14:32:57 | [maml_trainer] epoch #185 | EpochTime 488.03 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4322
Average/AverageReturn                              -34.7129
Average/Iteration                                  185
Average/MaxReturn                                   -4.96978
Average/MinReturn                                  -64.0285
Average/NumEpisodes                                 80
Average/StdReturn                                   10.7791
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91756
GaussianMLPPolicy/KLAfter                            0.00125667
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.51397e-06
GaussianMLPPolicy/LossBefore                         1.0252e-08
GaussianMLPPolicy/dLoss                             -5.50371e-06
Iteration                                          185
MetaTest/Average/AverageDiscountedReturn           -33.714
MetaTest/Average/AverageReturn                     -33.714
MetaTest/Average/Iteration                         185
MetaTest/Average/MaxReturn                         -20.854
MetaTest/Average/MinReturn                         -54.6127
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.2649
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.714
MetaTest/__unnamed_task__/AverageReturn            -33.714
MetaTest/__unnamed_task__/Iteration                185
MetaTest/__unnamed_task__/MaxReturn                -20.854
MetaTest/__unnamed_task__/MinReturn                -54.6127
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.2649
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.952e+06
__unnamed_task__/AverageDiscountedReturn           -16.4322
__unnamed_task__/AverageReturn                     -34.7129
__unnamed_task__/Iteration                         185
__unnamed_task__/MaxReturn                          -4.96978
__unnamed_task__/MinReturn                         -64.0285
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.7791
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:39:03 | [maml_trainer] epoch #186 | Sampling for adapation and meta-testing...
2025-04-03 14:40:35 | [maml_trainer] epoch #186 | Finished meta-testing...
2025-04-03 14:40:35 | [maml_trainer] epoch #186 | Saving snapshot...
2025-04-03 14:40:58 | [maml_trainer] epoch #186 | Saved
2025-04-03 14:40:58 | [maml_trainer] epoch #186 | Time 89280.35 s
2025-04-03 14:40:58 | [maml_trainer] epoch #186 | EpochTime 480.62 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7318
Average/AverageReturn                              -31.6875
Average/Iteration                                  186
Average/MaxReturn                                  144.406
Average/MinReturn                                  -60.0546
Average/NumEpisodes                                 80
Average/StdReturn                                   26.2468
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91519
GaussianMLPPolicy/KLAfter                            0.000400772
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.0068e-05
GaussianMLPPolicy/LossBefore                        -8.9705e-09
GaussianMLPPolicy/dLoss                              3.00591e-05
Iteration                                          186
MetaTest/Average/AverageDiscountedReturn           -32.9866
MetaTest/Average/AverageReturn                     -32.9866
MetaTest/Average/Iteration                         186
MetaTest/Average/MaxReturn                          -4.49864
MetaTest/Average/MinReturn                         -51.9469
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.7499
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.9866
MetaTest/__unnamed_task__/AverageReturn            -32.9866
MetaTest/__unnamed_task__/Iteration                186
MetaTest/__unnamed_task__/MaxReturn                 -4.49864
MetaTest/__unnamed_task__/MinReturn                -51.9469
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.7499
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        5.984e+06
__unnamed_task__/AverageDiscountedReturn           -15.7318
__unnamed_task__/AverageReturn                     -31.6875
__unnamed_task__/Iteration                         186
__unnamed_task__/MaxReturn                         144.406
__unnamed_task__/MinReturn                         -60.0546
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          26.2468
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:47:04 | [maml_trainer] epoch #187 | Sampling for adapation and meta-testing...
2025-04-03 14:48:36 | [maml_trainer] epoch #187 | Finished meta-testing...
2025-04-03 14:48:36 | [maml_trainer] epoch #187 | Saving snapshot...
2025-04-03 14:49:00 | [maml_trainer] epoch #187 | Saved
2025-04-03 14:49:00 | [maml_trainer] epoch #187 | Time 89762.66 s
2025-04-03 14:49:00 | [maml_trainer] epoch #187 | EpochTime 482.31 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5048
Average/AverageReturn                              -34.7029
Average/Iteration                                  187
Average/MaxReturn                                   12.6601
Average/MinReturn                                  -68.4937
Average/NumEpisodes                                 80
Average/StdReturn                                   10.0412
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91488
GaussianMLPPolicy/KLAfter                            0.001594
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000225681
GaussianMLPPolicy/LossBefore                        -1.64509e-08
GaussianMLPPolicy/dLoss                              0.000225665
Iteration                                          187
MetaTest/Average/AverageDiscountedReturn           -37.4347
MetaTest/Average/AverageReturn                     -37.4347
MetaTest/Average/Iteration                         187
MetaTest/Average/MaxReturn                         -24.5925
MetaTest/Average/MinReturn                         -58.5368
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.1092
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.4347
MetaTest/__unnamed_task__/AverageReturn            -37.4347
MetaTest/__unnamed_task__/Iteration                187
MetaTest/__unnamed_task__/MaxReturn                -24.5925
MetaTest/__unnamed_task__/MinReturn                -58.5368
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.1092
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.016e+06
__unnamed_task__/AverageDiscountedReturn           -16.5048
__unnamed_task__/AverageReturn                     -34.7029
__unnamed_task__/Iteration                         187
__unnamed_task__/MaxReturn                          12.6601
__unnamed_task__/MinReturn                         -68.4937
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.0412
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 14:55:09 | [maml_trainer] epoch #188 | Sampling for adapation and meta-testing...
2025-04-03 14:56:41 | [maml_trainer] epoch #188 | Finished meta-testing...
2025-04-03 14:56:41 | [maml_trainer] epoch #188 | Saving snapshot...
2025-04-03 14:57:05 | [maml_trainer] epoch #188 | Saved
2025-04-03 14:57:05 | [maml_trainer] epoch #188 | Time 90247.61 s
2025-04-03 14:57:05 | [maml_trainer] epoch #188 | EpochTime 484.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6171
Average/AverageReturn                              -32.4346
Average/Iteration                                  188
Average/MaxReturn                                   14.7812
Average/MinReturn                                  -54.0135
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1836
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91382
GaussianMLPPolicy/KLAfter                            0.00420924
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000312834
GaussianMLPPolicy/LossBefore                         3.2872e-08
GaussianMLPPolicy/dLoss                              0.000312867
Iteration                                          188
MetaTest/Average/AverageDiscountedReturn           -33.3288
MetaTest/Average/AverageReturn                     -33.3288
MetaTest/Average/Iteration                         188
MetaTest/Average/MaxReturn                          -9.27994
MetaTest/Average/MinReturn                         -56.0384
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.90192
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.3288
MetaTest/__unnamed_task__/AverageReturn            -33.3288
MetaTest/__unnamed_task__/Iteration                188
MetaTest/__unnamed_task__/MaxReturn                 -9.27994
MetaTest/__unnamed_task__/MinReturn                -56.0384
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.90192
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.048e+06
__unnamed_task__/AverageDiscountedReturn           -15.6171
__unnamed_task__/AverageReturn                     -32.4346
__unnamed_task__/Iteration                         188
__unnamed_task__/MaxReturn                          14.7812
__unnamed_task__/MinReturn                         -54.0135
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1836
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:03:15 | [maml_trainer] epoch #189 | Sampling for adapation and meta-testing...
2025-04-03 15:04:47 | [maml_trainer] epoch #189 | Finished meta-testing...
2025-04-03 15:04:47 | [maml_trainer] epoch #189 | Saving snapshot...
2025-04-03 15:05:09 | [maml_trainer] epoch #189 | Saved
2025-04-03 15:05:09 | [maml_trainer] epoch #189 | Time 90731.94 s
2025-04-03 15:05:09 | [maml_trainer] epoch #189 | EpochTime 484.32 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.8901
Average/AverageReturn                              -33.1221
Average/Iteration                                  189
Average/MaxReturn                                  -14.2023
Average/MinReturn                                  -60.3378
Average/NumEpisodes                                 80
Average/StdReturn                                    7.88524
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.91282
GaussianMLPPolicy/KLAfter                            0.00534996
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.87441e-05
GaussianMLPPolicy/LossBefore                         9.59635e-09
GaussianMLPPolicy/dLoss                              7.87536e-05
Iteration                                          189
MetaTest/Average/AverageDiscountedReturn           -27.378
MetaTest/Average/AverageReturn                     -27.378
MetaTest/Average/Iteration                         189
MetaTest/Average/MaxReturn                          20.4373
MetaTest/Average/MinReturn                         -47.2282
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.1321
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -27.378
MetaTest/__unnamed_task__/AverageReturn            -27.378
MetaTest/__unnamed_task__/Iteration                189
MetaTest/__unnamed_task__/MaxReturn                 20.4373
MetaTest/__unnamed_task__/MinReturn                -47.2282
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.1321
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.08e+06
__unnamed_task__/AverageDiscountedReturn           -15.8901
__unnamed_task__/AverageReturn                     -33.1221
__unnamed_task__/Iteration                         189
__unnamed_task__/MaxReturn                         -14.2023
__unnamed_task__/MinReturn                         -60.3378
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.88524
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:11:15 | [maml_trainer] epoch #190 | Sampling for adapation and meta-testing...
2025-04-03 15:12:47 | [maml_trainer] epoch #190 | Finished meta-testing...
2025-04-03 15:12:47 | [maml_trainer] epoch #190 | Saving snapshot...
2025-04-03 15:13:11 | [maml_trainer] epoch #190 | Saved
2025-04-03 15:13:11 | [maml_trainer] epoch #190 | Time 91213.39 s
2025-04-03 15:13:11 | [maml_trainer] epoch #190 | EpochTime 481.45 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.2951
Average/AverageReturn                              -31.6477
Average/Iteration                                  190
Average/MaxReturn                                    8.89111
Average/MinReturn                                  -61.7089
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2914
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90968
GaussianMLPPolicy/KLAfter                            0.00647318
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.22117e-05
GaussianMLPPolicy/LossBefore                         1.10865e-08
GaussianMLPPolicy/dLoss                             -6.22006e-05
Iteration                                          190
MetaTest/Average/AverageDiscountedReturn           -33.7303
MetaTest/Average/AverageReturn                     -33.7303
MetaTest/Average/Iteration                         190
MetaTest/Average/MaxReturn                         -18.4448
MetaTest/Average/MinReturn                         -43.8851
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.22163
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.7303
MetaTest/__unnamed_task__/AverageReturn            -33.7303
MetaTest/__unnamed_task__/Iteration                190
MetaTest/__unnamed_task__/MaxReturn                -18.4448
MetaTest/__unnamed_task__/MinReturn                -43.8851
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.22163
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.112e+06
__unnamed_task__/AverageDiscountedReturn           -15.2951
__unnamed_task__/AverageReturn                     -31.6477
__unnamed_task__/Iteration                         190
__unnamed_task__/MaxReturn                           8.89111
__unnamed_task__/MinReturn                         -61.7089
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2914
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:19:21 | [maml_trainer] epoch #191 | Sampling for adapation and meta-testing...
2025-04-03 15:20:54 | [maml_trainer] epoch #191 | Finished meta-testing...
2025-04-03 15:20:54 | [maml_trainer] epoch #191 | Saving snapshot...
2025-04-03 15:21:18 | [maml_trainer] epoch #191 | Saved
2025-04-03 15:21:18 | [maml_trainer] epoch #191 | Time 91700.50 s
2025-04-03 15:21:18 | [maml_trainer] epoch #191 | EpochTime 487.11 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4831
Average/AverageReturn                              -32.5666
Average/Iteration                                  191
Average/MaxReturn                                   20.5439
Average/MinReturn                                  -51.4177
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6536
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90699
GaussianMLPPolicy/KLAfter                            0.00504903
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000191621
GaussianMLPPolicy/LossBefore                         4.73857e-09
GaussianMLPPolicy/dLoss                              0.000191626
Iteration                                          191
MetaTest/Average/AverageDiscountedReturn           -33.3029
MetaTest/Average/AverageReturn                     -33.3029
MetaTest/Average/Iteration                         191
MetaTest/Average/MaxReturn                         -20.9485
MetaTest/Average/MinReturn                         -57.2473
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.25004
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.3029
MetaTest/__unnamed_task__/AverageReturn            -33.3029
MetaTest/__unnamed_task__/Iteration                191
MetaTest/__unnamed_task__/MaxReturn                -20.9485
MetaTest/__unnamed_task__/MinReturn                -57.2473
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.25004
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.144e+06
__unnamed_task__/AverageDiscountedReturn           -15.4831
__unnamed_task__/AverageReturn                     -32.5666
__unnamed_task__/Iteration                         191
__unnamed_task__/MaxReturn                          20.5439
__unnamed_task__/MinReturn                         -51.4177
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6536
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:27:29 | [maml_trainer] epoch #192 | Sampling for adapation and meta-testing...
2025-04-03 15:29:01 | [maml_trainer] epoch #192 | Finished meta-testing...
2025-04-03 15:29:01 | [maml_trainer] epoch #192 | Saving snapshot...
2025-04-03 15:29:25 | [maml_trainer] epoch #192 | Saved
2025-04-03 15:29:25 | [maml_trainer] epoch #192 | Time 92187.48 s
2025-04-03 15:29:25 | [maml_trainer] epoch #192 | EpochTime 486.97 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4559
Average/AverageReturn                              -32.066
Average/Iteration                                  192
Average/MaxReturn                                   42.2026
Average/MinReturn                                  -53.3542
Average/NumEpisodes                                 80
Average/StdReturn                                   12.8271
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.9048
GaussianMLPPolicy/KLAfter                            0.00491402
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000234955
GaussianMLPPolicy/LossBefore                         1.52588e-08
GaussianMLPPolicy/dLoss                             -0.00023494
Iteration                                          192
MetaTest/Average/AverageDiscountedReturn           -34.9151
MetaTest/Average/AverageReturn                     -34.9151
MetaTest/Average/Iteration                         192
MetaTest/Average/MaxReturn                          -6.60547
MetaTest/Average/MinReturn                         -54.2211
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.386
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.9151
MetaTest/__unnamed_task__/AverageReturn            -34.9151
MetaTest/__unnamed_task__/Iteration                192
MetaTest/__unnamed_task__/MaxReturn                 -6.60547
MetaTest/__unnamed_task__/MinReturn                -54.2211
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.386
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.176e+06
__unnamed_task__/AverageDiscountedReturn           -15.4559
__unnamed_task__/AverageReturn                     -32.066
__unnamed_task__/Iteration                         192
__unnamed_task__/MaxReturn                          42.2026
__unnamed_task__/MinReturn                         -53.3542
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.8271
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:35:32 | [maml_trainer] epoch #193 | Sampling for adapation and meta-testing...
2025-04-03 15:37:03 | [maml_trainer] epoch #193 | Finished meta-testing...
2025-04-03 15:37:03 | [maml_trainer] epoch #193 | Saving snapshot...
2025-04-03 15:37:27 | [maml_trainer] epoch #193 | Saved
2025-04-03 15:37:27 | [maml_trainer] epoch #193 | Time 92669.55 s
2025-04-03 15:37:27 | [maml_trainer] epoch #193 | EpochTime 482.07 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.5644
Average/AverageReturn                              -33.8369
Average/Iteration                                  193
Average/MaxReturn                                   -2.12092
Average/MinReturn                                  -51.5724
Average/NumEpisodes                                 80
Average/StdReturn                                    8.76878
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90293
GaussianMLPPolicy/KLAfter                            0.0039128
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00014205
GaussianMLPPolicy/LossBefore                         9.71556e-09
GaussianMLPPolicy/dLoss                             -0.00014204
Iteration                                          193
MetaTest/Average/AverageDiscountedReturn           -35.7007
MetaTest/Average/AverageReturn                     -35.7007
MetaTest/Average/Iteration                         193
MetaTest/Average/MaxReturn                         -21.4273
MetaTest/Average/MinReturn                         -57.8176
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.00377
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.7007
MetaTest/__unnamed_task__/AverageReturn            -35.7007
MetaTest/__unnamed_task__/Iteration                193
MetaTest/__unnamed_task__/MaxReturn                -21.4273
MetaTest/__unnamed_task__/MinReturn                -57.8176
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.00377
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.208e+06
__unnamed_task__/AverageDiscountedReturn           -15.5644
__unnamed_task__/AverageReturn                     -33.8369
__unnamed_task__/Iteration                         193
__unnamed_task__/MaxReturn                          -2.12092
__unnamed_task__/MinReturn                         -51.5724
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.76878
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:43:35 | [maml_trainer] epoch #194 | Sampling for adapation and meta-testing...
2025-04-03 15:45:06 | [maml_trainer] epoch #194 | Finished meta-testing...
2025-04-03 15:45:06 | [maml_trainer] epoch #194 | Saving snapshot...
2025-04-03 15:45:29 | [maml_trainer] epoch #194 | Saved
2025-04-03 15:45:29 | [maml_trainer] epoch #194 | Time 93151.03 s
2025-04-03 15:45:29 | [maml_trainer] epoch #194 | EpochTime 481.48 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9089
Average/AverageReturn                              -36.0761
Average/Iteration                                  194
Average/MaxReturn                                   -6.55522
Average/MinReturn                                  -54.5036
Average/NumEpisodes                                 80
Average/StdReturn                                    9.38681
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90148
GaussianMLPPolicy/KLAfter                            0.00249881
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          3.39766e-05
GaussianMLPPolicy/LossBefore                         8.64267e-09
GaussianMLPPolicy/dLoss                             -3.39679e-05
Iteration                                          194
MetaTest/Average/AverageDiscountedReturn           -34.1532
MetaTest/Average/AverageReturn                     -34.1532
MetaTest/Average/Iteration                         194
MetaTest/Average/MaxReturn                         -18.2892
MetaTest/Average/MinReturn                         -55.4881
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.37526
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.1532
MetaTest/__unnamed_task__/AverageReturn            -34.1532
MetaTest/__unnamed_task__/Iteration                194
MetaTest/__unnamed_task__/MaxReturn                -18.2892
MetaTest/__unnamed_task__/MinReturn                -55.4881
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.37526
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.24e+06
__unnamed_task__/AverageDiscountedReturn           -16.9089
__unnamed_task__/AverageReturn                     -36.0761
__unnamed_task__/Iteration                         194
__unnamed_task__/MaxReturn                          -6.55522
__unnamed_task__/MinReturn                         -54.5036
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.38681
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:51:35 | [maml_trainer] epoch #195 | Sampling for adapation and meta-testing...
2025-04-03 15:53:05 | [maml_trainer] epoch #195 | Finished meta-testing...
2025-04-03 15:53:05 | [maml_trainer] epoch #195 | Saving snapshot...
2025-04-03 15:53:30 | [maml_trainer] epoch #195 | Saved
2025-04-03 15:53:30 | [maml_trainer] epoch #195 | Time 93632.11 s
2025-04-03 15:53:30 | [maml_trainer] epoch #195 | EpochTime 481.08 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3335
Average/AverageReturn                              -35.3011
Average/Iteration                                  195
Average/MaxReturn                                  -19.4369
Average/MinReturn                                  -58.4086
Average/NumEpisodes                                 80
Average/StdReturn                                    8.98074
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.90018
GaussianMLPPolicy/KLAfter                            0.0034708
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.73943e-05
GaussianMLPPolicy/LossBefore                        -2.6226e-09
GaussianMLPPolicy/dLoss                             -1.73969e-05
Iteration                                          195
MetaTest/Average/AverageDiscountedReturn           -35.9392
MetaTest/Average/AverageReturn                     -35.9392
MetaTest/Average/Iteration                         195
MetaTest/Average/MaxReturn                         -17.958
MetaTest/Average/MinReturn                         -60.8031
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.26962
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.9392
MetaTest/__unnamed_task__/AverageReturn            -35.9392
MetaTest/__unnamed_task__/Iteration                195
MetaTest/__unnamed_task__/MaxReturn                -17.958
MetaTest/__unnamed_task__/MinReturn                -60.8031
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.26962
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.272e+06
__unnamed_task__/AverageDiscountedReturn           -16.3335
__unnamed_task__/AverageReturn                     -35.3011
__unnamed_task__/Iteration                         195
__unnamed_task__/MaxReturn                         -19.4369
__unnamed_task__/MinReturn                         -58.4086
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.98074
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 15:59:39 | [maml_trainer] epoch #196 | Sampling for adapation and meta-testing...
2025-04-03 16:01:11 | [maml_trainer] epoch #196 | Finished meta-testing...
2025-04-03 16:01:11 | [maml_trainer] epoch #196 | Saving snapshot...
2025-04-03 16:01:35 | [maml_trainer] epoch #196 | Saved
2025-04-03 16:01:35 | [maml_trainer] epoch #196 | Time 94117.04 s
2025-04-03 16:01:35 | [maml_trainer] epoch #196 | EpochTime 484.93 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.9424
Average/AverageReturn                              -34.1151
Average/Iteration                                  196
Average/MaxReturn                                   18.0582
Average/MinReturn                                  -52.1879
Average/NumEpisodes                                 80
Average/StdReturn                                    9.73235
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89772
GaussianMLPPolicy/KLAfter                            0.0037197
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.00017909
GaussianMLPPolicy/LossBefore                        -2.59876e-08
GaussianMLPPolicy/dLoss                              0.000179064
Iteration                                          196
MetaTest/Average/AverageDiscountedReturn           -32.7263
MetaTest/Average/AverageReturn                     -32.7263
MetaTest/Average/Iteration                         196
MetaTest/Average/MaxReturn                          -1.48005
MetaTest/Average/MinReturn                         -60.5949
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.2601
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.7263
MetaTest/__unnamed_task__/AverageReturn            -32.7263
MetaTest/__unnamed_task__/Iteration                196
MetaTest/__unnamed_task__/MaxReturn                 -1.48005
MetaTest/__unnamed_task__/MinReturn                -60.5949
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.2601
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.304e+06
__unnamed_task__/AverageDiscountedReturn           -15.9424
__unnamed_task__/AverageReturn                     -34.1151
__unnamed_task__/Iteration                         196
__unnamed_task__/MaxReturn                          18.0582
__unnamed_task__/MinReturn                         -52.1879
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.73235
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:07:43 | [maml_trainer] epoch #197 | Sampling for adapation and meta-testing...
2025-04-03 16:09:17 | [maml_trainer] epoch #197 | Finished meta-testing...
2025-04-03 16:09:17 | [maml_trainer] epoch #197 | Saving snapshot...
2025-04-03 16:09:40 | [maml_trainer] epoch #197 | Saved
2025-04-03 16:09:40 | [maml_trainer] epoch #197 | Time 94602.30 s
2025-04-03 16:09:40 | [maml_trainer] epoch #197 | EpochTime 485.25 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3272
Average/AverageReturn                              -34.1541
Average/Iteration                                  197
Average/MaxReturn                                    6.60798
Average/MinReturn                                  -57.1814
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2441
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89631
GaussianMLPPolicy/KLAfter                            0.00362981
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.48787e-06
GaussianMLPPolicy/LossBefore                         1.65105e-08
GaussianMLPPolicy/dLoss                              4.50438e-06
Iteration                                          197
MetaTest/Average/AverageDiscountedReturn           -32.9235
MetaTest/Average/AverageReturn                     -32.9235
MetaTest/Average/Iteration                         197
MetaTest/Average/MaxReturn                         -23.8559
MetaTest/Average/MinReturn                         -47.0401
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.21318
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.9235
MetaTest/__unnamed_task__/AverageReturn            -32.9235
MetaTest/__unnamed_task__/Iteration                197
MetaTest/__unnamed_task__/MaxReturn                -23.8559
MetaTest/__unnamed_task__/MinReturn                -47.0401
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.21318
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.336e+06
__unnamed_task__/AverageDiscountedReturn           -16.3272
__unnamed_task__/AverageReturn                     -34.1541
__unnamed_task__/Iteration                         197
__unnamed_task__/MaxReturn                           6.60798
__unnamed_task__/MinReturn                         -57.1814
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2441
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:15:47 | [maml_trainer] epoch #198 | Sampling for adapation and meta-testing...
2025-04-03 16:17:20 | [maml_trainer] epoch #198 | Finished meta-testing...
2025-04-03 16:17:20 | [maml_trainer] epoch #198 | Saving snapshot...
2025-04-03 16:17:43 | [maml_trainer] epoch #198 | Saved
2025-04-03 16:17:43 | [maml_trainer] epoch #198 | Time 95085.92 s
2025-04-03 16:17:43 | [maml_trainer] epoch #198 | EpochTime 483.62 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.2721
Average/AverageReturn                              -32.0077
Average/Iteration                                  198
Average/MaxReturn                                   25.3472
Average/MinReturn                                  -53.2422
Average/NumEpisodes                                 80
Average/StdReturn                                   11.265
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89497
GaussianMLPPolicy/KLAfter                            0.00568444
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000180218
GaussianMLPPolicy/LossBefore                        -3.49581e-08
GaussianMLPPolicy/dLoss                              0.000180183
Iteration                                          198
MetaTest/Average/AverageDiscountedReturn           -32.2639
MetaTest/Average/AverageReturn                     -32.2639
MetaTest/Average/Iteration                         198
MetaTest/Average/MaxReturn                         -19.1588
MetaTest/Average/MinReturn                         -43.9894
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.76994
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.2639
MetaTest/__unnamed_task__/AverageReturn            -32.2639
MetaTest/__unnamed_task__/Iteration                198
MetaTest/__unnamed_task__/MaxReturn                -19.1588
MetaTest/__unnamed_task__/MinReturn                -43.9894
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.76994
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.368e+06
__unnamed_task__/AverageDiscountedReturn           -15.2721
__unnamed_task__/AverageReturn                     -32.0077
__unnamed_task__/Iteration                         198
__unnamed_task__/MaxReturn                          25.3472
__unnamed_task__/MinReturn                         -53.2422
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.265
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:23:52 | [maml_trainer] epoch #199 | Sampling for adapation and meta-testing...
2025-04-03 16:25:23 | [maml_trainer] epoch #199 | Finished meta-testing...
2025-04-03 16:25:23 | [maml_trainer] epoch #199 | Saving snapshot...
2025-04-03 16:25:46 | [maml_trainer] epoch #199 | Saved
2025-04-03 16:25:46 | [maml_trainer] epoch #199 | Time 95568.68 s
2025-04-03 16:25:46 | [maml_trainer] epoch #199 | EpochTime 482.75 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.0489
Average/AverageReturn                              -31.9949
Average/Iteration                                  199
Average/MaxReturn                                   -4.24506
Average/MinReturn                                  -49.8063
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1168
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89372
GaussianMLPPolicy/KLAfter                            0.00580496
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.72071e-05
GaussianMLPPolicy/LossBefore                        -1.20401e-08
GaussianMLPPolicy/dLoss                             -6.72191e-05
Iteration                                          199
MetaTest/Average/AverageDiscountedReturn           -31.9268
MetaTest/Average/AverageReturn                     -31.9268
MetaTest/Average/Iteration                         199
MetaTest/Average/MaxReturn                          -7.04093
MetaTest/Average/MinReturn                         -48.4507
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.8897
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.9268
MetaTest/__unnamed_task__/AverageReturn            -31.9268
MetaTest/__unnamed_task__/Iteration                199
MetaTest/__unnamed_task__/MaxReturn                 -7.04093
MetaTest/__unnamed_task__/MinReturn                -48.4507
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.8897
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.4e+06
__unnamed_task__/AverageDiscountedReturn           -15.0489
__unnamed_task__/AverageReturn                     -31.9949
__unnamed_task__/Iteration                         199
__unnamed_task__/MaxReturn                          -4.24506
__unnamed_task__/MinReturn                         -49.8063
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1168
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:31:58 | [maml_trainer] epoch #200 | Sampling for adapation and meta-testing...
2025-04-03 16:33:31 | [maml_trainer] epoch #200 | Finished meta-testing...
2025-04-03 16:33:31 | [maml_trainer] epoch #200 | Saving snapshot...
2025-04-03 16:33:57 | [maml_trainer] epoch #200 | Saved
2025-04-03 16:33:57 | [maml_trainer] epoch #200 | Time 96059.95 s
2025-04-03 16:33:57 | [maml_trainer] epoch #200 | EpochTime 491.27 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6762
Average/AverageReturn                              -33.041
Average/Iteration                                  200
Average/MaxReturn                                   18.2638
Average/MinReturn                                  -56.9375
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4193
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.89108
GaussianMLPPolicy/KLAfter                            0.00566682
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000228491
GaussianMLPPolicy/LossBefore                         2.36034e-08
GaussianMLPPolicy/dLoss                             -0.000228467
Iteration                                          200
MetaTest/Average/AverageDiscountedReturn           -36.6509
MetaTest/Average/AverageReturn                     -36.6509
MetaTest/Average/Iteration                         200
MetaTest/Average/MaxReturn                         -27.9346
MetaTest/Average/MinReturn                         -49.4351
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.25205
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.6509
MetaTest/__unnamed_task__/AverageReturn            -36.6509
MetaTest/__unnamed_task__/Iteration                200
MetaTest/__unnamed_task__/MaxReturn                -27.9346
MetaTest/__unnamed_task__/MinReturn                -49.4351
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.25205
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.432e+06
__unnamed_task__/AverageDiscountedReturn           -15.6762
__unnamed_task__/AverageReturn                     -33.041
__unnamed_task__/Iteration                         200
__unnamed_task__/MaxReturn                          18.2638
__unnamed_task__/MinReturn                         -56.9375
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4193
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:40:16 | [maml_trainer] epoch #201 | Sampling for adapation and meta-testing...
2025-04-03 16:41:49 | [maml_trainer] epoch #201 | Finished meta-testing...
2025-04-03 16:41:49 | [maml_trainer] epoch #201 | Saving snapshot...
2025-04-03 16:42:13 | [maml_trainer] epoch #201 | Saved
2025-04-03 16:42:13 | [maml_trainer] epoch #201 | Time 96555.30 s
2025-04-03 16:42:13 | [maml_trainer] epoch #201 | EpochTime 495.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.703
Average/AverageReturn                              -33.9548
Average/Iteration                                  201
Average/MaxReturn                                   10.5574
Average/MinReturn                                  -62.9949
Average/NumEpisodes                                 80
Average/StdReturn                                    9.9432
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.888
GaussianMLPPolicy/KLAfter                            0.00406525
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00020423
GaussianMLPPolicy/LossBefore                         3.93391e-09
GaussianMLPPolicy/dLoss                             -0.000204226
Iteration                                          201
MetaTest/Average/AverageDiscountedReturn           -34.4525
MetaTest/Average/AverageReturn                     -34.4525
MetaTest/Average/Iteration                         201
MetaTest/Average/MaxReturn                         -18.4578
MetaTest/Average/MinReturn                         -46.5014
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.87809
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.4525
MetaTest/__unnamed_task__/AverageReturn            -34.4525
MetaTest/__unnamed_task__/Iteration                201
MetaTest/__unnamed_task__/MaxReturn                -18.4578
MetaTest/__unnamed_task__/MinReturn                -46.5014
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.87809
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.464e+06
__unnamed_task__/AverageDiscountedReturn           -15.703
__unnamed_task__/AverageReturn                     -33.9548
__unnamed_task__/Iteration                         201
__unnamed_task__/MaxReturn                          10.5574
__unnamed_task__/MinReturn                         -62.9949
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.9432
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:48:25 | [maml_trainer] epoch #202 | Sampling for adapation and meta-testing...
2025-04-03 16:50:00 | [maml_trainer] epoch #202 | Finished meta-testing...
2025-04-03 16:50:00 | [maml_trainer] epoch #202 | Saving snapshot...
2025-04-03 16:50:24 | [maml_trainer] epoch #202 | Saved
2025-04-03 16:50:24 | [maml_trainer] epoch #202 | Time 97046.59 s
2025-04-03 16:50:24 | [maml_trainer] epoch #202 | EpochTime 491.29 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7961
Average/AverageReturn                              -36.8455
Average/Iteration                                  202
Average/MaxReturn                                    8.16796
Average/MinReturn                                  -56.1606
Average/NumEpisodes                                 80
Average/StdReturn                                    9.41137
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.88561
GaussianMLPPolicy/KLAfter                            0.000766305
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.52123e-05
GaussianMLPPolicy/LossBefore                        -2.5928e-08
GaussianMLPPolicy/dLoss                             -8.52382e-05
Iteration                                          202
MetaTest/Average/AverageDiscountedReturn           -40.6363
MetaTest/Average/AverageReturn                     -40.6363
MetaTest/Average/Iteration                         202
MetaTest/Average/MaxReturn                         -26.0081
MetaTest/Average/MinReturn                         -56.4306
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.65301
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -40.6363
MetaTest/__unnamed_task__/AverageReturn            -40.6363
MetaTest/__unnamed_task__/Iteration                202
MetaTest/__unnamed_task__/MaxReturn                -26.0081
MetaTest/__unnamed_task__/MinReturn                -56.4306
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.65301
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.496e+06
__unnamed_task__/AverageDiscountedReturn           -16.7961
__unnamed_task__/AverageReturn                     -36.8455
__unnamed_task__/Iteration                         202
__unnamed_task__/MaxReturn                           8.16796
__unnamed_task__/MinReturn                         -56.1606
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.41137
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 16:56:35 | [maml_trainer] epoch #203 | Sampling for adapation and meta-testing...
2025-04-03 16:58:07 | [maml_trainer] epoch #203 | Finished meta-testing...
2025-04-03 16:58:07 | [maml_trainer] epoch #203 | Saving snapshot...
2025-04-03 16:58:30 | [maml_trainer] epoch #203 | Saved
2025-04-03 16:58:30 | [maml_trainer] epoch #203 | Time 97532.93 s
2025-04-03 16:58:30 | [maml_trainer] epoch #203 | EpochTime 486.33 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0989
Average/AverageReturn                              -35.2196
Average/Iteration                                  203
Average/MaxReturn                                  -19.3645
Average/MinReturn                                  -61.2164
Average/NumEpisodes                                 80
Average/StdReturn                                    8.82715
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.88408
GaussianMLPPolicy/KLAfter                            0.00259937
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000130001
GaussianMLPPolicy/LossBefore                        -2.78354e-08
GaussianMLPPolicy/dLoss                              0.000129973
Iteration                                          203
MetaTest/Average/AverageDiscountedReturn           -32.2582
MetaTest/Average/AverageReturn                     -32.2582
MetaTest/Average/Iteration                         203
MetaTest/Average/MaxReturn                         -16.5725
MetaTest/Average/MinReturn                         -50.5937
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.10004
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.2582
MetaTest/__unnamed_task__/AverageReturn            -32.2582
MetaTest/__unnamed_task__/Iteration                203
MetaTest/__unnamed_task__/MaxReturn                -16.5725
MetaTest/__unnamed_task__/MinReturn                -50.5937
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.10004
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.528e+06
__unnamed_task__/AverageDiscountedReturn           -16.0989
__unnamed_task__/AverageReturn                     -35.2196
__unnamed_task__/Iteration                         203
__unnamed_task__/MaxReturn                         -19.3645
__unnamed_task__/MinReturn                         -61.2164
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.82715
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:04:45 | [maml_trainer] epoch #204 | Sampling for adapation and meta-testing...
2025-04-03 17:06:17 | [maml_trainer] epoch #204 | Finished meta-testing...
2025-04-03 17:06:17 | [maml_trainer] epoch #204 | Saving snapshot...
2025-04-03 17:06:41 | [maml_trainer] epoch #204 | Saved
2025-04-03 17:06:41 | [maml_trainer] epoch #204 | Time 98023.92 s
2025-04-03 17:06:41 | [maml_trainer] epoch #204 | EpochTime 490.99 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3709
Average/AverageReturn                              -35.2765
Average/Iteration                                  204
Average/MaxReturn                                   22.4725
Average/MinReturn                                  -69.9091
Average/NumEpisodes                                 80
Average/StdReturn                                   12.1422
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8817
GaussianMLPPolicy/KLAfter                            0.00410912
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000145511
GaussianMLPPolicy/LossBefore                        -3.30806e-09
GaussianMLPPolicy/dLoss                              0.000145508
Iteration                                          204
MetaTest/Average/AverageDiscountedReturn           -34.4721
MetaTest/Average/AverageReturn                     -34.4721
MetaTest/Average/Iteration                         204
MetaTest/Average/MaxReturn                         -21.9169
MetaTest/Average/MinReturn                         -53.1341
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.92244
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.4721
MetaTest/__unnamed_task__/AverageReturn            -34.4721
MetaTest/__unnamed_task__/Iteration                204
MetaTest/__unnamed_task__/MaxReturn                -21.9169
MetaTest/__unnamed_task__/MinReturn                -53.1341
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.92244
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.56e+06
__unnamed_task__/AverageDiscountedReturn           -16.3709
__unnamed_task__/AverageReturn                     -35.2765
__unnamed_task__/Iteration                         204
__unnamed_task__/MaxReturn                          22.4725
__unnamed_task__/MinReturn                         -69.9091
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.1422
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:12:52 | [maml_trainer] epoch #205 | Sampling for adapation and meta-testing...
2025-04-03 17:14:25 | [maml_trainer] epoch #205 | Finished meta-testing...
2025-04-03 17:14:25 | [maml_trainer] epoch #205 | Saving snapshot...
2025-04-03 17:14:49 | [maml_trainer] epoch #205 | Saved
2025-04-03 17:14:49 | [maml_trainer] epoch #205 | Time 98511.90 s
2025-04-03 17:14:49 | [maml_trainer] epoch #205 | EpochTime 487.98 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.7727
Average/AverageReturn                              -31.0924
Average/Iteration                                  205
Average/MaxReturn                                    0.444659
Average/MinReturn                                  -53.4238
Average/NumEpisodes                                 80
Average/StdReturn                                    9.496
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87963
GaussianMLPPolicy/KLAfter                            0.00490172
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000220844
GaussianMLPPolicy/LossBefore                        -2.25306e-08
GaussianMLPPolicy/dLoss                              0.000220821
Iteration                                          205
MetaTest/Average/AverageDiscountedReturn           -32.2745
MetaTest/Average/AverageReturn                     -32.2745
MetaTest/Average/Iteration                         205
MetaTest/Average/MaxReturn                         -23.6282
MetaTest/Average/MinReturn                         -47.5625
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.45766
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.2745
MetaTest/__unnamed_task__/AverageReturn            -32.2745
MetaTest/__unnamed_task__/Iteration                205
MetaTest/__unnamed_task__/MaxReturn                -23.6282
MetaTest/__unnamed_task__/MinReturn                -47.5625
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.45766
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.592e+06
__unnamed_task__/AverageDiscountedReturn           -14.7727
__unnamed_task__/AverageReturn                     -31.0924
__unnamed_task__/Iteration                         205
__unnamed_task__/MaxReturn                           0.444659
__unnamed_task__/MinReturn                         -53.4238
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.496
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:21:04 | [maml_trainer] epoch #206 | Sampling for adapation and meta-testing...
2025-04-03 17:22:36 | [maml_trainer] epoch #206 | Finished meta-testing...
2025-04-03 17:22:36 | [maml_trainer] epoch #206 | Saving snapshot...
2025-04-03 17:22:59 | [maml_trainer] epoch #206 | Saved
2025-04-03 17:22:59 | [maml_trainer] epoch #206 | Time 99001.93 s
2025-04-03 17:22:59 | [maml_trainer] epoch #206 | EpochTime 490.02 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.975
Average/AverageReturn                              -30.1395
Average/Iteration                                  206
Average/MaxReturn                                   64.2574
Average/MinReturn                                  -58.73
Average/NumEpisodes                                 80
Average/StdReturn                                   16.65
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87715
GaussianMLPPolicy/KLAfter                            0.00498149
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.55355e-05
GaussianMLPPolicy/LossBefore                        -1.78814e-09
GaussianMLPPolicy/dLoss                             -9.55373e-05
Iteration                                          206
MetaTest/Average/AverageDiscountedReturn           -28.9967
MetaTest/Average/AverageReturn                     -28.9967
MetaTest/Average/Iteration                         206
MetaTest/Average/MaxReturn                          11.3353
MetaTest/Average/MinReturn                         -47.8211
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.7714
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.9967
MetaTest/__unnamed_task__/AverageReturn            -28.9967
MetaTest/__unnamed_task__/Iteration                206
MetaTest/__unnamed_task__/MaxReturn                 11.3353
MetaTest/__unnamed_task__/MinReturn                -47.8211
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.7714
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.624e+06
__unnamed_task__/AverageDiscountedReturn           -14.975
__unnamed_task__/AverageReturn                     -30.1395
__unnamed_task__/Iteration                         206
__unnamed_task__/MaxReturn                          64.2574
__unnamed_task__/MinReturn                         -58.73
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          16.65
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:29:11 | [maml_trainer] epoch #207 | Sampling for adapation and meta-testing...
2025-04-03 17:30:45 | [maml_trainer] epoch #207 | Finished meta-testing...
2025-04-03 17:30:45 | [maml_trainer] epoch #207 | Saving snapshot...
2025-04-03 17:31:09 | [maml_trainer] epoch #207 | Saved
2025-04-03 17:31:09 | [maml_trainer] epoch #207 | Time 99491.24 s
2025-04-03 17:31:09 | [maml_trainer] epoch #207 | EpochTime 489.31 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2194
Average/AverageReturn                              -33.5589
Average/Iteration                                  207
Average/MaxReturn                                   -1.46038
Average/MinReturn                                  -59.1115
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1644
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87422
GaussianMLPPolicy/KLAfter                            0.00432361
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.98806e-06
GaussianMLPPolicy/LossBefore                        -4.88758e-09
GaussianMLPPolicy/dLoss                              5.98317e-06
Iteration                                          207
MetaTest/Average/AverageDiscountedReturn           -29.9926
MetaTest/Average/AverageReturn                     -29.9926
MetaTest/Average/Iteration                         207
MetaTest/Average/MaxReturn                          -5.67549
MetaTest/Average/MinReturn                         -41.9314
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.73321
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.9926
MetaTest/__unnamed_task__/AverageReturn            -29.9926
MetaTest/__unnamed_task__/Iteration                207
MetaTest/__unnamed_task__/MaxReturn                 -5.67549
MetaTest/__unnamed_task__/MinReturn                -41.9314
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.73321
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.656e+06
__unnamed_task__/AverageDiscountedReturn           -16.2194
__unnamed_task__/AverageReturn                     -33.5589
__unnamed_task__/Iteration                         207
__unnamed_task__/MaxReturn                          -1.46038
__unnamed_task__/MinReturn                         -59.1115
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1644
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:37:23 | [maml_trainer] epoch #208 | Sampling for adapation and meta-testing...
2025-04-03 17:38:56 | [maml_trainer] epoch #208 | Finished meta-testing...
2025-04-03 17:38:56 | [maml_trainer] epoch #208 | Saving snapshot...
2025-04-03 17:39:20 | [maml_trainer] epoch #208 | Saved
2025-04-03 17:39:20 | [maml_trainer] epoch #208 | Time 99982.85 s
2025-04-03 17:39:20 | [maml_trainer] epoch #208 | EpochTime 491.61 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4052
Average/AverageReturn                              -31.3407
Average/Iteration                                  208
Average/MaxReturn                                   25.8066
Average/MinReturn                                  -51.6447
Average/NumEpisodes                                 80
Average/StdReturn                                   11.3272
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87198
GaussianMLPPolicy/KLAfter                            0.00254273
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.50132e-05
GaussianMLPPolicy/LossBefore                        -1.65701e-08
GaussianMLPPolicy/dLoss                              4.49966e-05
Iteration                                          208
MetaTest/Average/AverageDiscountedReturn           -30.434
MetaTest/Average/AverageReturn                     -30.434
MetaTest/Average/Iteration                         208
MetaTest/Average/MaxReturn                          -4.07474
MetaTest/Average/MinReturn                         -49.942
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.8934
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.434
MetaTest/__unnamed_task__/AverageReturn            -30.434
MetaTest/__unnamed_task__/Iteration                208
MetaTest/__unnamed_task__/MaxReturn                 -4.07474
MetaTest/__unnamed_task__/MinReturn                -49.942
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.8934
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.688e+06
__unnamed_task__/AverageDiscountedReturn           -15.4052
__unnamed_task__/AverageReturn                     -31.3407
__unnamed_task__/Iteration                         208
__unnamed_task__/MaxReturn                          25.8066
__unnamed_task__/MinReturn                         -51.6447
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.3272
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:45:31 | [maml_trainer] epoch #209 | Sampling for adapation and meta-testing...
2025-04-03 17:47:04 | [maml_trainer] epoch #209 | Finished meta-testing...
2025-04-03 17:47:04 | [maml_trainer] epoch #209 | Saving snapshot...
2025-04-03 17:47:27 | [maml_trainer] epoch #209 | Saved
2025-04-03 17:47:27 | [maml_trainer] epoch #209 | Time 100469.35 s
2025-04-03 17:47:27 | [maml_trainer] epoch #209 | EpochTime 486.50 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3065
Average/AverageReturn                              -32.7683
Average/Iteration                                  209
Average/MaxReturn                                   46.3412
Average/MinReturn                                  -54.4511
Average/NumEpisodes                                 80
Average/StdReturn                                   12.3265
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87103
GaussianMLPPolicy/KLAfter                            0.0015756
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.2516e-05
GaussianMLPPolicy/LossBefore                         8.55327e-09
GaussianMLPPolicy/dLoss                              2.25246e-05
Iteration                                          209
MetaTest/Average/AverageDiscountedReturn           -31.1033
MetaTest/Average/AverageReturn                     -31.1033
MetaTest/Average/Iteration                         209
MetaTest/Average/MaxReturn                         -22.278
MetaTest/Average/MinReturn                         -42.6544
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.14617
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.1033
MetaTest/__unnamed_task__/AverageReturn            -31.1033
MetaTest/__unnamed_task__/Iteration                209
MetaTest/__unnamed_task__/MaxReturn                -22.278
MetaTest/__unnamed_task__/MinReturn                -42.6544
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.14617
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.72e+06
__unnamed_task__/AverageDiscountedReturn           -16.3065
__unnamed_task__/AverageReturn                     -32.7683
__unnamed_task__/Iteration                         209
__unnamed_task__/MaxReturn                          46.3412
__unnamed_task__/MinReturn                         -54.4511
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.3265
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 17:53:36 | [maml_trainer] epoch #210 | Sampling for adapation and meta-testing...
2025-04-03 17:55:07 | [maml_trainer] epoch #210 | Finished meta-testing...
2025-04-03 17:55:07 | [maml_trainer] epoch #210 | Saving snapshot...
2025-04-03 17:55:32 | [maml_trainer] epoch #210 | Saved
2025-04-03 17:55:32 | [maml_trainer] epoch #210 | Time 100954.83 s
2025-04-03 17:55:32 | [maml_trainer] epoch #210 | EpochTime 485.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.0636
Average/AverageReturn                              -29.6542
Average/Iteration                                  210
Average/MaxReturn                                   14.2169
Average/MinReturn                                  -53.3251
Average/NumEpisodes                                 80
Average/StdReturn                                   12.5488
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87134
GaussianMLPPolicy/KLAfter                            0.00355319
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.10268e-05
GaussianMLPPolicy/LossBefore                         6.88434e-09
GaussianMLPPolicy/dLoss                              3.10337e-05
Iteration                                          210
MetaTest/Average/AverageDiscountedReturn           -27.9051
MetaTest/Average/AverageReturn                     -27.9051
MetaTest/Average/Iteration                         210
MetaTest/Average/MaxReturn                          18.1526
MetaTest/Average/MinReturn                         -48.7511
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.0317
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -27.9051
MetaTest/__unnamed_task__/AverageReturn            -27.9051
MetaTest/__unnamed_task__/Iteration                210
MetaTest/__unnamed_task__/MaxReturn                 18.1526
MetaTest/__unnamed_task__/MinReturn                -48.7511
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.0317
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.752e+06
__unnamed_task__/AverageDiscountedReturn           -15.0636
__unnamed_task__/AverageReturn                     -29.6542
__unnamed_task__/Iteration                         210
__unnamed_task__/MaxReturn                          14.2169
__unnamed_task__/MinReturn                         -53.3251
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.5488
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:01:43 | [maml_trainer] epoch #211 | Sampling for adapation and meta-testing...
2025-04-03 18:03:15 | [maml_trainer] epoch #211 | Finished meta-testing...
2025-04-03 18:03:15 | [maml_trainer] epoch #211 | Saving snapshot...
2025-04-03 18:03:39 | [maml_trainer] epoch #211 | Saved
2025-04-03 18:03:39 | [maml_trainer] epoch #211 | Time 101441.17 s
2025-04-03 18:03:39 | [maml_trainer] epoch #211 | EpochTime 486.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4061
Average/AverageReturn                              -30.7068
Average/Iteration                                  211
Average/MaxReturn                                   -0.727871
Average/MinReturn                                  -49.0511
Average/NumEpisodes                                 80
Average/StdReturn                                    8.34618
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87212
GaussianMLPPolicy/KLAfter                            0.00242017
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000144649
GaussianMLPPolicy/LossBefore                         1.97887e-08
GaussianMLPPolicy/dLoss                             -0.000144629
Iteration                                          211
MetaTest/Average/AverageDiscountedReturn           -32.1945
MetaTest/Average/AverageReturn                     -32.1945
MetaTest/Average/Iteration                         211
MetaTest/Average/MaxReturn                         -12.9996
MetaTest/Average/MinReturn                         -51.7684
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.6822
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.1945
MetaTest/__unnamed_task__/AverageReturn            -32.1945
MetaTest/__unnamed_task__/Iteration                211
MetaTest/__unnamed_task__/MaxReturn                -12.9996
MetaTest/__unnamed_task__/MinReturn                -51.7684
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.6822
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.784e+06
__unnamed_task__/AverageDiscountedReturn           -15.4061
__unnamed_task__/AverageReturn                     -30.7068
__unnamed_task__/Iteration                         211
__unnamed_task__/MaxReturn                          -0.727871
__unnamed_task__/MinReturn                         -49.0511
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.34618
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:09:49 | [maml_trainer] epoch #212 | Sampling for adapation and meta-testing...
2025-04-03 18:11:22 | [maml_trainer] epoch #212 | Finished meta-testing...
2025-04-03 18:11:22 | [maml_trainer] epoch #212 | Saving snapshot...
2025-04-03 18:11:45 | [maml_trainer] epoch #212 | Saved
2025-04-03 18:11:45 | [maml_trainer] epoch #212 | Time 101927.16 s
2025-04-03 18:11:45 | [maml_trainer] epoch #212 | EpochTime 485.99 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.526
Average/AverageReturn                              -29.5662
Average/Iteration                                  212
Average/MaxReturn                                   18.0941
Average/MinReturn                                  -57.5752
Average/NumEpisodes                                 80
Average/StdReturn                                    9.52227
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87248
GaussianMLPPolicy/KLAfter                            0.00267848
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.46363e-05
GaussianMLPPolicy/LossBefore                         2.38419e-09
GaussianMLPPolicy/dLoss                              3.46387e-05
Iteration                                          212
MetaTest/Average/AverageDiscountedReturn           -27.8975
MetaTest/Average/AverageReturn                     -27.8975
MetaTest/Average/Iteration                         212
MetaTest/Average/MaxReturn                          -4.45983
MetaTest/Average/MinReturn                         -36.5199
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.55869
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -27.8975
MetaTest/__unnamed_task__/AverageReturn            -27.8975
MetaTest/__unnamed_task__/Iteration                212
MetaTest/__unnamed_task__/MaxReturn                 -4.45983
MetaTest/__unnamed_task__/MinReturn                -36.5199
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.55869
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.816e+06
__unnamed_task__/AverageDiscountedReturn           -14.526
__unnamed_task__/AverageReturn                     -29.5662
__unnamed_task__/Iteration                         212
__unnamed_task__/MaxReturn                          18.0941
__unnamed_task__/MinReturn                         -57.5752
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.52227
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:17:54 | [maml_trainer] epoch #213 | Sampling for adapation and meta-testing...
2025-04-03 18:19:28 | [maml_trainer] epoch #213 | Finished meta-testing...
2025-04-03 18:19:28 | [maml_trainer] epoch #213 | Saving snapshot...
2025-04-03 18:19:52 | [maml_trainer] epoch #213 | Saved
2025-04-03 18:19:52 | [maml_trainer] epoch #213 | Time 102414.43 s
2025-04-03 18:19:52 | [maml_trainer] epoch #213 | EpochTime 487.26 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3085
Average/AverageReturn                              -31.4056
Average/Iteration                                  213
Average/MaxReturn                                    8.16902
Average/MinReturn                                  -53.8946
Average/NumEpisodes                                 80
Average/StdReturn                                    8.6288
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87307
GaussianMLPPolicy/KLAfter                            0.00552239
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000125195
GaussianMLPPolicy/LossBefore                        -1.13249e-09
GaussianMLPPolicy/dLoss                             -0.000125196
Iteration                                          213
MetaTest/Average/AverageDiscountedReturn           -29.2875
MetaTest/Average/AverageReturn                     -29.2875
MetaTest/Average/Iteration                         213
MetaTest/Average/MaxReturn                          14.464
MetaTest/Average/MinReturn                         -45.408
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.9909
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.2875
MetaTest/__unnamed_task__/AverageReturn            -29.2875
MetaTest/__unnamed_task__/Iteration                213
MetaTest/__unnamed_task__/MaxReturn                 14.464
MetaTest/__unnamed_task__/MinReturn                -45.408
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.9909
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.848e+06
__unnamed_task__/AverageDiscountedReturn           -15.3085
__unnamed_task__/AverageReturn                     -31.4056
__unnamed_task__/Iteration                         213
__unnamed_task__/MaxReturn                           8.16902
__unnamed_task__/MinReturn                         -53.8946
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.6288
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:26:04 | [maml_trainer] epoch #214 | Sampling for adapation and meta-testing...
2025-04-03 18:27:36 | [maml_trainer] epoch #214 | Finished meta-testing...
2025-04-03 18:27:36 | [maml_trainer] epoch #214 | Saving snapshot...
2025-04-03 18:28:00 | [maml_trainer] epoch #214 | Saved
2025-04-03 18:28:00 | [maml_trainer] epoch #214 | Time 102902.72 s
2025-04-03 18:28:00 | [maml_trainer] epoch #214 | EpochTime 488.29 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.5053
Average/AverageReturn                              -31.5563
Average/Iteration                                  214
Average/MaxReturn                                    9.38562
Average/MinReturn                                  -55.8861
Average/NumEpisodes                                 80
Average/StdReturn                                    9.02206
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87268
GaussianMLPPolicy/KLAfter                            0.0064025
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          7.72955e-05
GaussianMLPPolicy/LossBefore                        -1.01328e-09
GaussianMLPPolicy/dLoss                             -7.72965e-05
Iteration                                          214
MetaTest/Average/AverageDiscountedReturn           -30.0876
MetaTest/Average/AverageReturn                     -30.0876
MetaTest/Average/Iteration                         214
MetaTest/Average/MaxReturn                           5.37967
MetaTest/Average/MinReturn                         -43.9203
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.1033
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.0876
MetaTest/__unnamed_task__/AverageReturn            -30.0876
MetaTest/__unnamed_task__/Iteration                214
MetaTest/__unnamed_task__/MaxReturn                  5.37967
MetaTest/__unnamed_task__/MinReturn                -43.9203
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.1033
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.88e+06
__unnamed_task__/AverageDiscountedReturn           -15.5053
__unnamed_task__/AverageReturn                     -31.5563
__unnamed_task__/Iteration                         214
__unnamed_task__/MaxReturn                           9.38562
__unnamed_task__/MinReturn                         -55.8861
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.02206
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:34:12 | [maml_trainer] epoch #215 | Sampling for adapation and meta-testing...
2025-04-03 18:35:45 | [maml_trainer] epoch #215 | Finished meta-testing...
2025-04-03 18:35:45 | [maml_trainer] epoch #215 | Saving snapshot...
2025-04-03 18:36:07 | [maml_trainer] epoch #215 | Saved
2025-04-03 18:36:07 | [maml_trainer] epoch #215 | Time 103389.84 s
2025-04-03 18:36:07 | [maml_trainer] epoch #215 | EpochTime 487.11 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.2718
Average/AverageReturn                              -31.2047
Average/Iteration                                  215
Average/MaxReturn                                  -11.508
Average/MinReturn                                  -46.9995
Average/NumEpisodes                                 80
Average/StdReturn                                    6.87953
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87167
GaussianMLPPolicy/KLAfter                            0.00393195
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000110943
GaussianMLPPolicy/LossBefore                         2.56896e-08
GaussianMLPPolicy/dLoss                              0.000110968
Iteration                                          215
MetaTest/Average/AverageDiscountedReturn           -31.2913
MetaTest/Average/AverageReturn                     -31.2913
MetaTest/Average/Iteration                         215
MetaTest/Average/MaxReturn                         -21.0594
MetaTest/Average/MinReturn                         -46.5084
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.56684
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.2913
MetaTest/__unnamed_task__/AverageReturn            -31.2913
MetaTest/__unnamed_task__/Iteration                215
MetaTest/__unnamed_task__/MaxReturn                -21.0594
MetaTest/__unnamed_task__/MinReturn                -46.5084
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.56684
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.912e+06
__unnamed_task__/AverageDiscountedReturn           -15.2718
__unnamed_task__/AverageReturn                     -31.2047
__unnamed_task__/Iteration                         215
__unnamed_task__/MaxReturn                         -11.508
__unnamed_task__/MinReturn                         -46.9995
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.87953
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:42:16 | [maml_trainer] epoch #216 | Sampling for adapation and meta-testing...
2025-04-03 18:43:47 | [maml_trainer] epoch #216 | Finished meta-testing...
2025-04-03 18:43:47 | [maml_trainer] epoch #216 | Saving snapshot...
2025-04-03 18:44:12 | [maml_trainer] epoch #216 | Saved
2025-04-03 18:44:12 | [maml_trainer] epoch #216 | Time 103874.47 s
2025-04-03 18:44:12 | [maml_trainer] epoch #216 | EpochTime 484.63 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3823
Average/AverageReturn                              -32.866
Average/Iteration                                  216
Average/MaxReturn                                   -4.06642
Average/MinReturn                                  -53.5694
Average/NumEpisodes                                 80
Average/StdReturn                                    9.73017
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87206
GaussianMLPPolicy/KLAfter                            0.00818862
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000122501
GaussianMLPPolicy/LossBefore                        -7.39098e-09
GaussianMLPPolicy/dLoss                              0.000122493
Iteration                                          216
MetaTest/Average/AverageDiscountedReturn           -31.2395
MetaTest/Average/AverageReturn                     -31.2395
MetaTest/Average/Iteration                         216
MetaTest/Average/MaxReturn                          45.029
MetaTest/Average/MinReturn                         -54.9389
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          19.8014
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.2395
MetaTest/__unnamed_task__/AverageReturn            -31.2395
MetaTest/__unnamed_task__/Iteration                216
MetaTest/__unnamed_task__/MaxReturn                 45.029
MetaTest/__unnamed_task__/MinReturn                -54.9389
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 19.8014
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.944e+06
__unnamed_task__/AverageDiscountedReturn           -16.3823
__unnamed_task__/AverageReturn                     -32.866
__unnamed_task__/Iteration                         216
__unnamed_task__/MaxReturn                          -4.06642
__unnamed_task__/MinReturn                         -53.5694
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.73017
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:50:21 | [maml_trainer] epoch #217 | Sampling for adapation and meta-testing...
2025-04-03 18:51:52 | [maml_trainer] epoch #217 | Finished meta-testing...
2025-04-03 18:51:52 | [maml_trainer] epoch #217 | Saving snapshot...
2025-04-03 18:52:17 | [maml_trainer] epoch #217 | Saved
2025-04-03 18:52:17 | [maml_trainer] epoch #217 | Time 104359.11 s
2025-04-03 18:52:17 | [maml_trainer] epoch #217 | EpochTime 484.64 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4008
Average/AverageReturn                              -32.5021
Average/Iteration                                  217
Average/MaxReturn                                  -12.2909
Average/MinReturn                                  -55.883
Average/NumEpisodes                                 80
Average/StdReturn                                    8.13841
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87216
GaussianMLPPolicy/KLAfter                            0.00711212
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000472457
GaussianMLPPolicy/LossBefore                        -1.69873e-08
GaussianMLPPolicy/dLoss                              0.00047244
Iteration                                          217
MetaTest/Average/AverageDiscountedReturn           -27.0328
MetaTest/Average/AverageReturn                     -27.0328
MetaTest/Average/Iteration                         217
MetaTest/Average/MaxReturn                          12.0509
MetaTest/Average/MinReturn                         -43.9717
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.3475
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -27.0328
MetaTest/__unnamed_task__/AverageReturn            -27.0328
MetaTest/__unnamed_task__/Iteration                217
MetaTest/__unnamed_task__/MaxReturn                 12.0509
MetaTest/__unnamed_task__/MinReturn                -43.9717
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.3475
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        6.976e+06
__unnamed_task__/AverageDiscountedReturn           -16.4008
__unnamed_task__/AverageReturn                     -32.5021
__unnamed_task__/Iteration                         217
__unnamed_task__/MaxReturn                         -12.2909
__unnamed_task__/MinReturn                         -55.883
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.13841
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 18:58:29 | [maml_trainer] epoch #218 | Sampling for adapation and meta-testing...
2025-04-03 19:00:00 | [maml_trainer] epoch #218 | Finished meta-testing...
2025-04-03 19:00:00 | [maml_trainer] epoch #218 | Saving snapshot...
2025-04-03 19:00:23 | [maml_trainer] epoch #218 | Saved
2025-04-03 19:00:23 | [maml_trainer] epoch #218 | Time 104845.78 s
2025-04-03 19:00:23 | [maml_trainer] epoch #218 | EpochTime 486.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.046
Average/AverageReturn                              -30.3646
Average/Iteration                                  218
Average/MaxReturn                                   15.1631
Average/MinReturn                                  -54.1575
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1488
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87298
GaussianMLPPolicy/KLAfter                            0.00964648
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000186043
GaussianMLPPolicy/LossBefore                        -1.86861e-08
GaussianMLPPolicy/dLoss                             -0.000186062
Iteration                                          218
MetaTest/Average/AverageDiscountedReturn           -31.0874
MetaTest/Average/AverageReturn                     -31.0874
MetaTest/Average/Iteration                         218
MetaTest/Average/MaxReturn                         -10.7102
MetaTest/Average/MinReturn                         -45.9815
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.99333
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.0874
MetaTest/__unnamed_task__/AverageReturn            -31.0874
MetaTest/__unnamed_task__/Iteration                218
MetaTest/__unnamed_task__/MaxReturn                -10.7102
MetaTest/__unnamed_task__/MinReturn                -45.9815
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.99333
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.008e+06
__unnamed_task__/AverageDiscountedReturn           -16.046
__unnamed_task__/AverageReturn                     -30.3646
__unnamed_task__/Iteration                         218
__unnamed_task__/MaxReturn                          15.1631
__unnamed_task__/MinReturn                         -54.1575
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1488
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:06:29 | [maml_trainer] epoch #219 | Sampling for adapation and meta-testing...
2025-04-03 19:07:57 | [maml_trainer] epoch #219 | Finished meta-testing...
2025-04-03 19:07:57 | [maml_trainer] epoch #219 | Saving snapshot...
2025-04-03 19:08:21 | [maml_trainer] epoch #219 | Saved
2025-04-03 19:08:21 | [maml_trainer] epoch #219 | Time 105323.02 s
2025-04-03 19:08:21 | [maml_trainer] epoch #219 | EpochTime 477.24 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.632
Average/AverageReturn                              -30.1553
Average/Iteration                                  219
Average/MaxReturn                                   10.3888
Average/MinReturn                                  -51.0433
Average/NumEpisodes                                 80
Average/StdReturn                                   10.021
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87339
GaussianMLPPolicy/KLAfter                            0.00939891
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000253738
GaussianMLPPolicy/LossBefore                         2.98023e-09
GaussianMLPPolicy/dLoss                             -0.000253735
Iteration                                          219
MetaTest/Average/AverageDiscountedReturn           -31.0297
MetaTest/Average/AverageReturn                     -31.0297
MetaTest/Average/Iteration                         219
MetaTest/Average/MaxReturn                         -14.8554
MetaTest/Average/MinReturn                         -45.3497
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.238
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.0297
MetaTest/__unnamed_task__/AverageReturn            -31.0297
MetaTest/__unnamed_task__/Iteration                219
MetaTest/__unnamed_task__/MaxReturn                -14.8554
MetaTest/__unnamed_task__/MinReturn                -45.3497
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.238
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.04e+06
__unnamed_task__/AverageDiscountedReturn           -15.632
__unnamed_task__/AverageReturn                     -30.1553
__unnamed_task__/Iteration                         219
__unnamed_task__/MaxReturn                          10.3888
__unnamed_task__/MinReturn                         -51.0433
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.021
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:14:06 | [maml_trainer] epoch #220 | Sampling for adapation and meta-testing...
2025-04-03 19:15:32 | [maml_trainer] epoch #220 | Finished meta-testing...
2025-04-03 19:15:32 | [maml_trainer] epoch #220 | Saving snapshot...
2025-04-03 19:15:55 | [maml_trainer] epoch #220 | Saved
2025-04-03 19:15:55 | [maml_trainer] epoch #220 | Time 105777.40 s
2025-04-03 19:15:55 | [maml_trainer] epoch #220 | EpochTime 454.37 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5428
Average/AverageReturn                              -32.6075
Average/Iteration                                  220
Average/MaxReturn                                   11.4338
Average/MinReturn                                  -61.7577
Average/NumEpisodes                                 80
Average/StdReturn                                   12.3961
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87398
GaussianMLPPolicy/KLAfter                            0.00809536
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.17913e-05
GaussianMLPPolicy/LossBefore                        -1.06692e-08
GaussianMLPPolicy/dLoss                             -4.1802e-05
Iteration                                          220
MetaTest/Average/AverageDiscountedReturn           -35.7866
MetaTest/Average/AverageReturn                     -35.7866
MetaTest/Average/Iteration                         220
MetaTest/Average/MaxReturn                         -22.3814
MetaTest/Average/MinReturn                         -67.6302
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.1545
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.7866
MetaTest/__unnamed_task__/AverageReturn            -35.7866
MetaTest/__unnamed_task__/Iteration                220
MetaTest/__unnamed_task__/MaxReturn                -22.3814
MetaTest/__unnamed_task__/MinReturn                -67.6302
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.1545
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.072e+06
__unnamed_task__/AverageDiscountedReturn           -16.5428
__unnamed_task__/AverageReturn                     -32.6075
__unnamed_task__/Iteration                         220
__unnamed_task__/MaxReturn                          11.4338
__unnamed_task__/MinReturn                         -61.7577
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.3961
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:21:42 | [maml_trainer] epoch #221 | Sampling for adapation and meta-testing...
2025-04-03 19:23:09 | [maml_trainer] epoch #221 | Finished meta-testing...
2025-04-03 19:23:09 | [maml_trainer] epoch #221 | Saving snapshot...
2025-04-03 19:23:31 | [maml_trainer] epoch #221 | Saved
2025-04-03 19:23:31 | [maml_trainer] epoch #221 | Time 106233.87 s
2025-04-03 19:23:31 | [maml_trainer] epoch #221 | EpochTime 456.47 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.1557
Average/AverageReturn                              -31.7935
Average/Iteration                                  221
Average/MaxReturn                                   18.6632
Average/MinReturn                                  -58.7293
Average/NumEpisodes                                 80
Average/StdReturn                                   11.4792
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87415
GaussianMLPPolicy/KLAfter                            0.00584499
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.35772e-05
GaussianMLPPolicy/LossBefore                        -1.77622e-08
GaussianMLPPolicy/dLoss                              3.35595e-05
Iteration                                          221
MetaTest/Average/AverageDiscountedReturn           -35.9393
MetaTest/Average/AverageReturn                     -35.9393
MetaTest/Average/Iteration                         221
MetaTest/Average/MaxReturn                         -24.5374
MetaTest/Average/MinReturn                         -58.3235
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.60868
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.9393
MetaTest/__unnamed_task__/AverageReturn            -35.9393
MetaTest/__unnamed_task__/Iteration                221
MetaTest/__unnamed_task__/MaxReturn                -24.5374
MetaTest/__unnamed_task__/MinReturn                -58.3235
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.60868
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.104e+06
__unnamed_task__/AverageDiscountedReturn           -16.1557
__unnamed_task__/AverageReturn                     -31.7935
__unnamed_task__/Iteration                         221
__unnamed_task__/MaxReturn                          18.6632
__unnamed_task__/MinReturn                         -58.7293
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.4792
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:29:23 | [maml_trainer] epoch #222 | Sampling for adapation and meta-testing...
2025-04-03 19:30:48 | [maml_trainer] epoch #222 | Finished meta-testing...
2025-04-03 19:30:48 | [maml_trainer] epoch #222 | Saving snapshot...
2025-04-03 19:31:11 | [maml_trainer] epoch #222 | Saved
2025-04-03 19:31:11 | [maml_trainer] epoch #222 | Time 106693.95 s
2025-04-03 19:31:11 | [maml_trainer] epoch #222 | EpochTime 460.08 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9585
Average/AverageReturn                              -34.3249
Average/Iteration                                  222
Average/MaxReturn                                   -1.4804
Average/MinReturn                                  -65.5084
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1691
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87436
GaussianMLPPolicy/KLAfter                            0.00518719
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.37194e-05
GaussianMLPPolicy/LossBefore                         4.17233e-10
GaussianMLPPolicy/dLoss                              2.37198e-05
Iteration                                          222
MetaTest/Average/AverageDiscountedReturn           -34.4667
MetaTest/Average/AverageReturn                     -34.4667
MetaTest/Average/Iteration                         222
MetaTest/Average/MaxReturn                          -2.8891
MetaTest/Average/MinReturn                         -61.3189
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.5454
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.4667
MetaTest/__unnamed_task__/AverageReturn            -34.4667
MetaTest/__unnamed_task__/Iteration                222
MetaTest/__unnamed_task__/MaxReturn                 -2.8891
MetaTest/__unnamed_task__/MinReturn                -61.3189
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.5454
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.136e+06
__unnamed_task__/AverageDiscountedReturn           -16.9585
__unnamed_task__/AverageReturn                     -34.3249
__unnamed_task__/Iteration                         222
__unnamed_task__/MaxReturn                          -1.4804
__unnamed_task__/MinReturn                         -65.5084
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1691
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:36:54 | [maml_trainer] epoch #223 | Sampling for adapation and meta-testing...
2025-04-03 19:38:20 | [maml_trainer] epoch #223 | Finished meta-testing...
2025-04-03 19:38:20 | [maml_trainer] epoch #223 | Saving snapshot...
2025-04-03 19:38:43 | [maml_trainer] epoch #223 | Saved
2025-04-03 19:38:43 | [maml_trainer] epoch #223 | Time 107145.41 s
2025-04-03 19:38:43 | [maml_trainer] epoch #223 | EpochTime 451.46 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.8222
Average/AverageReturn                              -35.9921
Average/Iteration                                  223
Average/MaxReturn                                   -1.98077
Average/MinReturn                                  -68.8502
Average/NumEpisodes                                 80
Average/StdReturn                                   10.3495
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87443
GaussianMLPPolicy/KLAfter                            0.00622569
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.38318e-05
GaussianMLPPolicy/LossBefore                        -6.55651e-09
GaussianMLPPolicy/dLoss                              7.38253e-05
Iteration                                          223
MetaTest/Average/AverageDiscountedReturn           -38.861
MetaTest/Average/AverageReturn                     -38.861
MetaTest/Average/Iteration                         223
MetaTest/Average/MaxReturn                         -23.5075
MetaTest/Average/MinReturn                         -59.3318
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.70906
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -38.861
MetaTest/__unnamed_task__/AverageReturn            -38.861
MetaTest/__unnamed_task__/Iteration                223
MetaTest/__unnamed_task__/MaxReturn                -23.5075
MetaTest/__unnamed_task__/MinReturn                -59.3318
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.70906
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.168e+06
__unnamed_task__/AverageDiscountedReturn           -17.8222
__unnamed_task__/AverageReturn                     -35.9921
__unnamed_task__/Iteration                         223
__unnamed_task__/MaxReturn                          -1.98077
__unnamed_task__/MinReturn                         -68.8502
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.3495
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:44:44 | [maml_trainer] epoch #224 | Sampling for adapation and meta-testing...
2025-04-03 19:46:16 | [maml_trainer] epoch #224 | Finished meta-testing...
2025-04-03 19:46:16 | [maml_trainer] epoch #224 | Saving snapshot...
2025-04-03 19:46:39 | [maml_trainer] epoch #224 | Saved
2025-04-03 19:46:39 | [maml_trainer] epoch #224 | Time 107621.72 s
2025-04-03 19:46:39 | [maml_trainer] epoch #224 | EpochTime 476.30 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.601
Average/AverageReturn                              -34.9604
Average/Iteration                                  224
Average/MaxReturn                                   -3.96904
Average/MinReturn                                  -73.0513
Average/NumEpisodes                                 80
Average/StdReturn                                   10.769
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8746
GaussianMLPPolicy/KLAfter                            0.00399106
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000126438
GaussianMLPPolicy/LossBefore                         1.34707e-08
GaussianMLPPolicy/dLoss                              0.000126452
Iteration                                          224
MetaTest/Average/AverageDiscountedReturn           -32.9786
MetaTest/Average/AverageReturn                     -32.9786
MetaTest/Average/Iteration                         224
MetaTest/Average/MaxReturn                          -8.63131
MetaTest/Average/MinReturn                         -54.152
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.4776
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.9786
MetaTest/__unnamed_task__/AverageReturn            -32.9786
MetaTest/__unnamed_task__/Iteration                224
MetaTest/__unnamed_task__/MaxReturn                 -8.63131
MetaTest/__unnamed_task__/MinReturn                -54.152
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.4776
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.2e+06
__unnamed_task__/AverageDiscountedReturn           -17.601
__unnamed_task__/AverageReturn                     -34.9604
__unnamed_task__/Iteration                         224
__unnamed_task__/MaxReturn                          -3.96904
__unnamed_task__/MinReturn                         -73.0513
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.769
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 19:52:49 | [maml_trainer] epoch #225 | Sampling for adapation and meta-testing...
2025-04-03 19:54:21 | [maml_trainer] epoch #225 | Finished meta-testing...
2025-04-03 19:54:21 | [maml_trainer] epoch #225 | Saving snapshot...
2025-04-03 19:54:47 | [maml_trainer] epoch #225 | Saved
2025-04-03 19:54:47 | [maml_trainer] epoch #225 | Time 108109.39 s
2025-04-03 19:54:47 | [maml_trainer] epoch #225 | EpochTime 487.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.336
Average/AverageReturn                              -34.5331
Average/Iteration                                  225
Average/MaxReturn                                  -17.627
Average/MinReturn                                  -57.3649
Average/NumEpisodes                                 80
Average/StdReturn                                    8.17941
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87443
GaussianMLPPolicy/KLAfter                            0.00283235
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000117792
GaussianMLPPolicy/LossBefore                         1.03116e-08
GaussianMLPPolicy/dLoss                             -0.000117781
Iteration                                          225
MetaTest/Average/AverageDiscountedReturn           -33.1252
MetaTest/Average/AverageReturn                     -33.1252
MetaTest/Average/Iteration                         225
MetaTest/Average/MaxReturn                          36.0742
MetaTest/Average/MinReturn                         -58.3462
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          18.5639
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.1252
MetaTest/__unnamed_task__/AverageReturn            -33.1252
MetaTest/__unnamed_task__/Iteration                225
MetaTest/__unnamed_task__/MaxReturn                 36.0742
MetaTest/__unnamed_task__/MinReturn                -58.3462
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 18.5639
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.232e+06
__unnamed_task__/AverageDiscountedReturn           -17.336
__unnamed_task__/AverageReturn                     -34.5331
__unnamed_task__/Iteration                         225
__unnamed_task__/MaxReturn                         -17.627
__unnamed_task__/MinReturn                         -57.3649
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.17941
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:01:13 | [maml_trainer] epoch #226 | Sampling for adapation and meta-testing...
2025-04-03 20:02:45 | [maml_trainer] epoch #226 | Finished meta-testing...
2025-04-03 20:02:45 | [maml_trainer] epoch #226 | Saving snapshot...
2025-04-03 20:03:09 | [maml_trainer] epoch #226 | Saved
2025-04-03 20:03:09 | [maml_trainer] epoch #226 | Time 108611.67 s
2025-04-03 20:03:09 | [maml_trainer] epoch #226 | EpochTime 502.28 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.2604
Average/AverageReturn                              -33.9029
Average/Iteration                                  226
Average/MaxReturn                                    2.32998
Average/MinReturn                                  -60.9104
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2617
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87546
GaussianMLPPolicy/KLAfter                            0.00119208
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.07024e-05
GaussianMLPPolicy/LossBefore                         2.90871e-08
GaussianMLPPolicy/dLoss                              2.07315e-05
Iteration                                          226
MetaTest/Average/AverageDiscountedReturn           -32.1933
MetaTest/Average/AverageReturn                     -32.1933
MetaTest/Average/Iteration                         226
MetaTest/Average/MaxReturn                         -15.2746
MetaTest/Average/MinReturn                         -51.8583
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.12732
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.1933
MetaTest/__unnamed_task__/AverageReturn            -32.1933
MetaTest/__unnamed_task__/Iteration                226
MetaTest/__unnamed_task__/MaxReturn                -15.2746
MetaTest/__unnamed_task__/MinReturn                -51.8583
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.12732
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.264e+06
__unnamed_task__/AverageDiscountedReturn           -17.2604
__unnamed_task__/AverageReturn                     -33.9029
__unnamed_task__/Iteration                         226
__unnamed_task__/MaxReturn                           2.32998
__unnamed_task__/MinReturn                         -60.9104
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2617
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:09:23 | [maml_trainer] epoch #227 | Sampling for adapation and meta-testing...
2025-04-03 20:10:57 | [maml_trainer] epoch #227 | Finished meta-testing...
2025-04-03 20:10:57 | [maml_trainer] epoch #227 | Saving snapshot...
2025-04-03 20:11:22 | [maml_trainer] epoch #227 | Saved
2025-04-03 20:11:22 | [maml_trainer] epoch #227 | Time 109104.12 s
2025-04-03 20:11:22 | [maml_trainer] epoch #227 | EpochTime 492.45 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.0557
Average/AverageReturn                              -35.5945
Average/Iteration                                  227
Average/MaxReturn                                   -8.18357
Average/MinReturn                                  -58.747
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1013
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87554
GaussianMLPPolicy/KLAfter                            0.00121761
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.42265e-05
GaussianMLPPolicy/LossBefore                         2.44379e-09
GaussianMLPPolicy/dLoss                              2.4229e-05
Iteration                                          227
MetaTest/Average/AverageDiscountedReturn           -31.6607
MetaTest/Average/AverageReturn                     -31.6607
MetaTest/Average/Iteration                         227
MetaTest/Average/MaxReturn                         -16.6241
MetaTest/Average/MinReturn                         -42.2725
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.0538
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.6607
MetaTest/__unnamed_task__/AverageReturn            -31.6607
MetaTest/__unnamed_task__/Iteration                227
MetaTest/__unnamed_task__/MaxReturn                -16.6241
MetaTest/__unnamed_task__/MinReturn                -42.2725
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.0538
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.296e+06
__unnamed_task__/AverageDiscountedReturn           -18.0557
__unnamed_task__/AverageReturn                     -35.5945
__unnamed_task__/Iteration                         227
__unnamed_task__/MaxReturn                          -8.18357
__unnamed_task__/MinReturn                         -58.747
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1013
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:17:18 | [maml_trainer] epoch #228 | Sampling for adapation and meta-testing...
2025-04-03 20:19:12 | [maml_trainer] epoch #228 | Finished meta-testing...
2025-04-03 20:19:12 | [maml_trainer] epoch #228 | Saving snapshot...
2025-04-03 20:19:39 | [maml_trainer] epoch #228 | Saved
2025-04-03 20:19:39 | [maml_trainer] epoch #228 | Time 109601.27 s
2025-04-03 20:19:39 | [maml_trainer] epoch #228 | EpochTime 497.15 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5791
Average/AverageReturn                              -34.6572
Average/Iteration                                  228
Average/MaxReturn                                    4.55914
Average/MinReturn                                  -62.731
Average/NumEpisodes                                 80
Average/StdReturn                                   11.7714
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87475
GaussianMLPPolicy/KLAfter                            0.00165685
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.70321e-05
GaussianMLPPolicy/LossBefore                         4.17232e-09
GaussianMLPPolicy/dLoss                             -8.70279e-05
Iteration                                          228
MetaTest/Average/AverageDiscountedReturn           -32.9679
MetaTest/Average/AverageReturn                     -32.9679
MetaTest/Average/Iteration                         228
MetaTest/Average/MaxReturn                         -21.167
MetaTest/Average/MinReturn                         -49.4788
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.68428
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.9679
MetaTest/__unnamed_task__/AverageReturn            -32.9679
MetaTest/__unnamed_task__/Iteration                228
MetaTest/__unnamed_task__/MaxReturn                -21.167
MetaTest/__unnamed_task__/MinReturn                -49.4788
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.68428
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.328e+06
__unnamed_task__/AverageDiscountedReturn           -17.5791
__unnamed_task__/AverageReturn                     -34.6572
__unnamed_task__/Iteration                         228
__unnamed_task__/MaxReturn                           4.55914
__unnamed_task__/MinReturn                         -62.731
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.7714
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:25:32 | [maml_trainer] epoch #229 | Sampling for adapation and meta-testing...
2025-04-03 20:27:00 | [maml_trainer] epoch #229 | Finished meta-testing...
2025-04-03 20:27:00 | [maml_trainer] epoch #229 | Saving snapshot...
2025-04-03 20:27:22 | [maml_trainer] epoch #229 | Saved
2025-04-03 20:27:22 | [maml_trainer] epoch #229 | Time 110064.62 s
2025-04-03 20:27:22 | [maml_trainer] epoch #229 | EpochTime 463.34 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.0713
Average/AverageReturn                              -33.3429
Average/Iteration                                  229
Average/MaxReturn                                   18.1931
Average/MinReturn                                  -59.6554
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6183
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87346
GaussianMLPPolicy/KLAfter                            0.0013369
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000108625
GaussianMLPPolicy/LossBefore                         8.9407e-10
GaussianMLPPolicy/dLoss                              0.000108626
Iteration                                          229
MetaTest/Average/AverageDiscountedReturn           -33.6757
MetaTest/Average/AverageReturn                     -33.6757
MetaTest/Average/Iteration                         229
MetaTest/Average/MaxReturn                         -15.2992
MetaTest/Average/MinReturn                         -54.1673
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.47039
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.6757
MetaTest/__unnamed_task__/AverageReturn            -33.6757
MetaTest/__unnamed_task__/Iteration                229
MetaTest/__unnamed_task__/MaxReturn                -15.2992
MetaTest/__unnamed_task__/MinReturn                -54.1673
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.47039
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.36e+06
__unnamed_task__/AverageDiscountedReturn           -17.0713
__unnamed_task__/AverageReturn                     -33.3429
__unnamed_task__/Iteration                         229
__unnamed_task__/MaxReturn                          18.1931
__unnamed_task__/MinReturn                         -59.6554
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6183
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:33:16 | [maml_trainer] epoch #230 | Sampling for adapation and meta-testing...
2025-04-03 20:34:46 | [maml_trainer] epoch #230 | Finished meta-testing...
2025-04-03 20:34:46 | [maml_trainer] epoch #230 | Saving snapshot...
2025-04-03 20:35:12 | [maml_trainer] epoch #230 | Saved
2025-04-03 20:35:12 | [maml_trainer] epoch #230 | Time 110534.06 s
2025-04-03 20:35:12 | [maml_trainer] epoch #230 | EpochTime 469.44 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -18.2204
Average/AverageReturn                              -36.0206
Average/Iteration                                  230
Average/MaxReturn                                  -10.1894
Average/MinReturn                                  -59.8046
Average/NumEpisodes                                 80
Average/StdReturn                                    9.26776
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87286
GaussianMLPPolicy/KLAfter                            0.00173376
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.10444e-05
GaussianMLPPolicy/LossBefore                        -7.92742e-09
GaussianMLPPolicy/dLoss                              1.10365e-05
Iteration                                          230
MetaTest/Average/AverageDiscountedReturn           -31.8793
MetaTest/Average/AverageReturn                     -31.8793
MetaTest/Average/Iteration                         230
MetaTest/Average/MaxReturn                         -17.3862
MetaTest/Average/MinReturn                         -58.4897
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.13403
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.8793
MetaTest/__unnamed_task__/AverageReturn            -31.8793
MetaTest/__unnamed_task__/Iteration                230
MetaTest/__unnamed_task__/MaxReturn                -17.3862
MetaTest/__unnamed_task__/MinReturn                -58.4897
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.13403
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.392e+06
__unnamed_task__/AverageDiscountedReturn           -18.2204
__unnamed_task__/AverageReturn                     -36.0206
__unnamed_task__/Iteration                         230
__unnamed_task__/MaxReturn                         -10.1894
__unnamed_task__/MinReturn                         -59.8046
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.26776
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:41:09 | [maml_trainer] epoch #231 | Sampling for adapation and meta-testing...
2025-04-03 20:42:39 | [maml_trainer] epoch #231 | Finished meta-testing...
2025-04-03 20:42:39 | [maml_trainer] epoch #231 | Saving snapshot...
2025-04-03 20:43:03 | [maml_trainer] epoch #231 | Saved
2025-04-03 20:43:03 | [maml_trainer] epoch #231 | Time 111005.18 s
2025-04-03 20:43:03 | [maml_trainer] epoch #231 | EpochTime 471.12 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4855
Average/AverageReturn                              -34.5873
Average/Iteration                                  231
Average/MaxReturn                                   24.9121
Average/MinReturn                                  -56.5397
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2078
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87272
GaussianMLPPolicy/KLAfter                            0.0025754
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000206014
GaussianMLPPolicy/LossBefore                        -1.51992e-09
GaussianMLPPolicy/dLoss                              0.000206012
Iteration                                          231
MetaTest/Average/AverageDiscountedReturn           -33.2672
MetaTest/Average/AverageReturn                     -33.2672
MetaTest/Average/Iteration                         231
MetaTest/Average/MaxReturn                         -20.6589
MetaTest/Average/MinReturn                         -50.4219
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.7574
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.2672
MetaTest/__unnamed_task__/AverageReturn            -33.2672
MetaTest/__unnamed_task__/Iteration                231
MetaTest/__unnamed_task__/MaxReturn                -20.6589
MetaTest/__unnamed_task__/MinReturn                -50.4219
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.7574
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.424e+06
__unnamed_task__/AverageDiscountedReturn           -17.4855
__unnamed_task__/AverageReturn                     -34.5873
__unnamed_task__/Iteration                         231
__unnamed_task__/MaxReturn                          24.9121
__unnamed_task__/MinReturn                         -56.5397
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2078
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:49:01 | [maml_trainer] epoch #232 | Sampling for adapation and meta-testing...
2025-04-03 20:50:33 | [maml_trainer] epoch #232 | Finished meta-testing...
2025-04-03 20:50:33 | [maml_trainer] epoch #232 | Saving snapshot...
2025-04-03 20:50:56 | [maml_trainer] epoch #232 | Saved
2025-04-03 20:50:56 | [maml_trainer] epoch #232 | Time 111478.55 s
2025-04-03 20:50:56 | [maml_trainer] epoch #232 | EpochTime 473.37 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5843
Average/AverageReturn                              -32.1775
Average/Iteration                                  232
Average/MaxReturn                                   26.9667
Average/MinReturn                                  -60.666
Average/NumEpisodes                                 80
Average/StdReturn                                   13.2066
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87244
GaussianMLPPolicy/KLAfter                            0.00373923
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000161531
GaussianMLPPolicy/LossBefore                         8.9407e-09
GaussianMLPPolicy/dLoss                              0.00016154
Iteration                                          232
MetaTest/Average/AverageDiscountedReturn           -32.9794
MetaTest/Average/AverageReturn                     -32.9794
MetaTest/Average/Iteration                         232
MetaTest/Average/MaxReturn                          -3.58206
MetaTest/Average/MinReturn                         -50.4131
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.7296
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.9794
MetaTest/__unnamed_task__/AverageReturn            -32.9794
MetaTest/__unnamed_task__/Iteration                232
MetaTest/__unnamed_task__/MaxReturn                 -3.58206
MetaTest/__unnamed_task__/MinReturn                -50.4131
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.7296
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.456e+06
__unnamed_task__/AverageDiscountedReturn           -16.5843
__unnamed_task__/AverageReturn                     -32.1775
__unnamed_task__/Iteration                         232
__unnamed_task__/MaxReturn                          26.9667
__unnamed_task__/MinReturn                         -60.666
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.2066
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 20:56:57 | [maml_trainer] epoch #233 | Sampling for adapation and meta-testing...
2025-04-03 20:58:27 | [maml_trainer] epoch #233 | Finished meta-testing...
2025-04-03 20:58:27 | [maml_trainer] epoch #233 | Saving snapshot...
2025-04-03 20:58:50 | [maml_trainer] epoch #233 | Saved
2025-04-03 20:58:50 | [maml_trainer] epoch #233 | Time 111952.14 s
2025-04-03 20:58:50 | [maml_trainer] epoch #233 | EpochTime 473.58 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7773
Average/AverageReturn                              -30.3631
Average/Iteration                                  233
Average/MaxReturn                                   17.2819
Average/MinReturn                                  -55.7666
Average/NumEpisodes                                 80
Average/StdReturn                                   11.417
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.87216
GaussianMLPPolicy/KLAfter                            0.00422931
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000114672
GaussianMLPPolicy/LossBefore                         3.09944e-09
GaussianMLPPolicy/dLoss                              0.000114675
Iteration                                          233
MetaTest/Average/AverageDiscountedReturn           -33.0271
MetaTest/Average/AverageReturn                     -33.0271
MetaTest/Average/Iteration                         233
MetaTest/Average/MaxReturn                         -21.9658
MetaTest/Average/MinReturn                         -43.8917
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.45293
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.0271
MetaTest/__unnamed_task__/AverageReturn            -33.0271
MetaTest/__unnamed_task__/Iteration                233
MetaTest/__unnamed_task__/MaxReturn                -21.9658
MetaTest/__unnamed_task__/MinReturn                -43.8917
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.45293
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.488e+06
__unnamed_task__/AverageDiscountedReturn           -15.7773
__unnamed_task__/AverageReturn                     -30.3631
__unnamed_task__/Iteration                         233
__unnamed_task__/MaxReturn                          17.2819
__unnamed_task__/MinReturn                         -55.7666
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.417
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:04:42 | [maml_trainer] epoch #234 | Sampling for adapation and meta-testing...
2025-04-03 21:06:12 | [maml_trainer] epoch #234 | Finished meta-testing...
2025-04-03 21:06:12 | [maml_trainer] epoch #234 | Saving snapshot...
2025-04-03 21:06:37 | [maml_trainer] epoch #234 | Saved
2025-04-03 21:06:37 | [maml_trainer] epoch #234 | Time 112419.05 s
2025-04-03 21:06:37 | [maml_trainer] epoch #234 | EpochTime 466.91 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7153
Average/AverageReturn                              -30.1009
Average/Iteration                                  234
Average/MaxReturn                                   25.9986
Average/MinReturn                                  -51.7522
Average/NumEpisodes                                 80
Average/StdReturn                                   12.5031
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8717
GaussianMLPPolicy/KLAfter                            0.00344896
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000108329
GaussianMLPPolicy/LossBefore                         7.80821e-09
GaussianMLPPolicy/dLoss                             -0.000108321
Iteration                                          234
MetaTest/Average/AverageDiscountedReturn           -33.6828
MetaTest/Average/AverageReturn                     -33.6828
MetaTest/Average/Iteration                         234
MetaTest/Average/MaxReturn                         -19.4716
MetaTest/Average/MinReturn                         -46.7989
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.17601
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.6828
MetaTest/__unnamed_task__/AverageReturn            -33.6828
MetaTest/__unnamed_task__/Iteration                234
MetaTest/__unnamed_task__/MaxReturn                -19.4716
MetaTest/__unnamed_task__/MinReturn                -46.7989
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.17601
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.52e+06
__unnamed_task__/AverageDiscountedReturn           -15.7153
__unnamed_task__/AverageReturn                     -30.1009
__unnamed_task__/Iteration                         234
__unnamed_task__/MaxReturn                          25.9986
__unnamed_task__/MinReturn                         -51.7522
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.5031
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:12:41 | [maml_trainer] epoch #235 | Sampling for adapation and meta-testing...
2025-04-03 21:14:07 | [maml_trainer] epoch #235 | Finished meta-testing...
2025-04-03 21:14:07 | [maml_trainer] epoch #235 | Saving snapshot...
2025-04-03 21:14:29 | [maml_trainer] epoch #235 | Saved
2025-04-03 21:14:29 | [maml_trainer] epoch #235 | Time 112891.37 s
2025-04-03 21:14:29 | [maml_trainer] epoch #235 | EpochTime 472.32 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9523
Average/AverageReturn                              -34.3865
Average/Iteration                                  235
Average/MaxReturn                                   -6.32435
Average/MinReturn                                  -52.632
Average/NumEpisodes                                 80
Average/StdReturn                                    8.44564
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86975
GaussianMLPPolicy/KLAfter                            0.00390951
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          1.41703e-05
GaussianMLPPolicy/LossBefore                        -6.91414e-09
GaussianMLPPolicy/dLoss                             -1.41773e-05
Iteration                                          235
MetaTest/Average/AverageDiscountedReturn           -31.3468
MetaTest/Average/AverageReturn                     -31.3468
MetaTest/Average/Iteration                         235
MetaTest/Average/MaxReturn                           7.48094
MetaTest/Average/MinReturn                         -52.8668
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.6093
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.3468
MetaTest/__unnamed_task__/AverageReturn            -31.3468
MetaTest/__unnamed_task__/Iteration                235
MetaTest/__unnamed_task__/MaxReturn                  7.48094
MetaTest/__unnamed_task__/MinReturn                -52.8668
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.6093
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.552e+06
__unnamed_task__/AverageDiscountedReturn           -16.9523
__unnamed_task__/AverageReturn                     -34.3865
__unnamed_task__/Iteration                         235
__unnamed_task__/MaxReturn                          -6.32435
__unnamed_task__/MinReturn                         -52.632
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.44564
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:20:43 | [maml_trainer] epoch #236 | Sampling for adapation and meta-testing...
2025-04-03 21:22:12 | [maml_trainer] epoch #236 | Finished meta-testing...
2025-04-03 21:22:12 | [maml_trainer] epoch #236 | Saving snapshot...
2025-04-03 21:22:36 | [maml_trainer] epoch #236 | Saved
2025-04-03 21:22:36 | [maml_trainer] epoch #236 | Time 113378.53 s
2025-04-03 21:22:36 | [maml_trainer] epoch #236 | EpochTime 487.15 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2399
Average/AverageReturn                              -32.4307
Average/Iteration                                  236
Average/MaxReturn                                   -3.63031
Average/MinReturn                                  -52.1637
Average/NumEpisodes                                 80
Average/StdReturn                                    9.54102
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.868
GaussianMLPPolicy/KLAfter                            0.00430893
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.37355e-05
GaussianMLPPolicy/LossBefore                         1.2517e-09
GaussianMLPPolicy/dLoss                              6.37367e-05
Iteration                                          236
MetaTest/Average/AverageDiscountedReturn           -36.6632
MetaTest/Average/AverageReturn                     -36.6632
MetaTest/Average/Iteration                         236
MetaTest/Average/MaxReturn                         -23.1222
MetaTest/Average/MinReturn                         -55.3907
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.51912
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.6632
MetaTest/__unnamed_task__/AverageReturn            -36.6632
MetaTest/__unnamed_task__/Iteration                236
MetaTest/__unnamed_task__/MaxReturn                -23.1222
MetaTest/__unnamed_task__/MinReturn                -55.3907
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.51912
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.584e+06
__unnamed_task__/AverageDiscountedReturn           -16.2399
__unnamed_task__/AverageReturn                     -32.4307
__unnamed_task__/Iteration                         236
__unnamed_task__/MaxReturn                          -3.63031
__unnamed_task__/MinReturn                         -52.1637
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.54102
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:28:55 | [maml_trainer] epoch #237 | Sampling for adapation and meta-testing...
2025-04-03 21:30:22 | [maml_trainer] epoch #237 | Finished meta-testing...
2025-04-03 21:30:22 | [maml_trainer] epoch #237 | Saving snapshot...
2025-04-03 21:30:45 | [maml_trainer] epoch #237 | Saved
2025-04-03 21:30:45 | [maml_trainer] epoch #237 | Time 113867.84 s
2025-04-03 21:30:45 | [maml_trainer] epoch #237 | EpochTime 489.31 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4274
Average/AverageReturn                              -32.5221
Average/Iteration                                  237
Average/MaxReturn                                   -5.7152
Average/MinReturn                                  -60.0314
Average/NumEpisodes                                 80
Average/StdReturn                                    8.93074
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86734
GaussianMLPPolicy/KLAfter                            0.00264751
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.58835e-05
GaussianMLPPolicy/LossBefore                        -1.91331e-08
GaussianMLPPolicy/dLoss                             -4.59027e-05
Iteration                                          237
MetaTest/Average/AverageDiscountedReturn           -30.3026
MetaTest/Average/AverageReturn                     -30.3026
MetaTest/Average/Iteration                         237
MetaTest/Average/MaxReturn                         -11.6164
MetaTest/Average/MinReturn                         -50.3382
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.1826
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.3026
MetaTest/__unnamed_task__/AverageReturn            -30.3026
MetaTest/__unnamed_task__/Iteration                237
MetaTest/__unnamed_task__/MaxReturn                -11.6164
MetaTest/__unnamed_task__/MinReturn                -50.3382
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.1826
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.616e+06
__unnamed_task__/AverageDiscountedReturn           -16.4274
__unnamed_task__/AverageReturn                     -32.5221
__unnamed_task__/Iteration                         237
__unnamed_task__/MaxReturn                          -5.7152
__unnamed_task__/MinReturn                         -60.0314
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.93074
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:36:32 | [maml_trainer] epoch #238 | Sampling for adapation and meta-testing...
2025-04-03 21:37:59 | [maml_trainer] epoch #238 | Finished meta-testing...
2025-04-03 21:37:59 | [maml_trainer] epoch #238 | Saving snapshot...
2025-04-03 21:38:20 | [maml_trainer] epoch #238 | Saved
2025-04-03 21:38:20 | [maml_trainer] epoch #238 | Time 114322.77 s
2025-04-03 21:38:20 | [maml_trainer] epoch #238 | EpochTime 454.93 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8633
Average/AverageReturn                              -32.607
Average/Iteration                                  238
Average/MaxReturn                                    5.48344
Average/MinReturn                                  -51.7166
Average/NumEpisodes                                 80
Average/StdReturn                                   10.2992
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86495
GaussianMLPPolicy/KLAfter                            0.00316588
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000135541
GaussianMLPPolicy/LossBefore                         5.06639e-09
GaussianMLPPolicy/dLoss                              0.000135546
Iteration                                          238
MetaTest/Average/AverageDiscountedReturn           -30.5579
MetaTest/Average/AverageReturn                     -30.5579
MetaTest/Average/Iteration                         238
MetaTest/Average/MaxReturn                         -19.0215
MetaTest/Average/MinReturn                         -47.5033
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.45738
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.5579
MetaTest/__unnamed_task__/AverageReturn            -30.5579
MetaTest/__unnamed_task__/Iteration                238
MetaTest/__unnamed_task__/MaxReturn                -19.0215
MetaTest/__unnamed_task__/MinReturn                -47.5033
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.45738
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.648e+06
__unnamed_task__/AverageDiscountedReturn           -16.8633
__unnamed_task__/AverageReturn                     -32.607
__unnamed_task__/Iteration                         238
__unnamed_task__/MaxReturn                           5.48344
__unnamed_task__/MinReturn                         -51.7166
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.2992
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:44:01 | [maml_trainer] epoch #239 | Sampling for adapation and meta-testing...
2025-04-03 21:45:28 | [maml_trainer] epoch #239 | Finished meta-testing...
2025-04-03 21:45:28 | [maml_trainer] epoch #239 | Saving snapshot...
2025-04-03 21:45:51 | [maml_trainer] epoch #239 | Saved
2025-04-03 21:45:51 | [maml_trainer] epoch #239 | Time 114773.40 s
2025-04-03 21:45:51 | [maml_trainer] epoch #239 | EpochTime 450.63 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.7726
Average/AverageReturn                              -32.7072
Average/Iteration                                  239
Average/MaxReturn                                  -13.6736
Average/MinReturn                                  -53.2705
Average/NumEpisodes                                 80
Average/StdReturn                                    7.20469
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86292
GaussianMLPPolicy/KLAfter                            0.00318875
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.41672e-05
GaussianMLPPolicy/LossBefore                         5.00679e-09
GaussianMLPPolicy/dLoss                              2.41722e-05
Iteration                                          239
MetaTest/Average/AverageDiscountedReturn           -27.6049
MetaTest/Average/AverageReturn                     -27.6049
MetaTest/Average/Iteration                         239
MetaTest/Average/MaxReturn                          12.2661
MetaTest/Average/MinReturn                         -49.7924
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          14.4717
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -27.6049
MetaTest/__unnamed_task__/AverageReturn            -27.6049
MetaTest/__unnamed_task__/Iteration                239
MetaTest/__unnamed_task__/MaxReturn                 12.2661
MetaTest/__unnamed_task__/MinReturn                -49.7924
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 14.4717
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.68e+06
__unnamed_task__/AverageDiscountedReturn           -16.7726
__unnamed_task__/AverageReturn                     -32.7072
__unnamed_task__/Iteration                         239
__unnamed_task__/MaxReturn                         -13.6736
__unnamed_task__/MinReturn                         -53.2705
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.20469
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:51:34 | [maml_trainer] epoch #240 | Sampling for adapation and meta-testing...
2025-04-03 21:53:01 | [maml_trainer] epoch #240 | Finished meta-testing...
2025-04-03 21:53:01 | [maml_trainer] epoch #240 | Saving snapshot...
2025-04-03 21:53:23 | [maml_trainer] epoch #240 | Saved
2025-04-03 21:53:23 | [maml_trainer] epoch #240 | Time 115225.89 s
2025-04-03 21:53:23 | [maml_trainer] epoch #240 | EpochTime 452.49 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.5205
Average/AverageReturn                              -33.9265
Average/Iteration                                  240
Average/MaxReturn                                   11.2735
Average/MinReturn                                  -63.2428
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1875
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86142
GaussianMLPPolicy/KLAfter                            0.0027988
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00011136
GaussianMLPPolicy/LossBefore                        -1.09375e-08
GaussianMLPPolicy/dLoss                             -0.000111371
Iteration                                          240
MetaTest/Average/AverageDiscountedReturn           -32.4025
MetaTest/Average/AverageReturn                     -32.4025
MetaTest/Average/Iteration                         240
MetaTest/Average/MaxReturn                           0.494428
MetaTest/Average/MinReturn                         -64.1431
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          13.6932
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.4025
MetaTest/__unnamed_task__/AverageReturn            -32.4025
MetaTest/__unnamed_task__/Iteration                240
MetaTest/__unnamed_task__/MaxReturn                  0.494428
MetaTest/__unnamed_task__/MinReturn                -64.1431
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 13.6932
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.712e+06
__unnamed_task__/AverageDiscountedReturn           -17.5205
__unnamed_task__/AverageReturn                     -33.9265
__unnamed_task__/Iteration                         240
__unnamed_task__/MaxReturn                          11.2735
__unnamed_task__/MinReturn                         -63.2428
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1875
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 21:59:09 | [maml_trainer] epoch #241 | Sampling for adapation and meta-testing...
2025-04-03 22:00:36 | [maml_trainer] epoch #241 | Finished meta-testing...
2025-04-03 22:00:36 | [maml_trainer] epoch #241 | Saving snapshot...
2025-04-03 22:00:58 | [maml_trainer] epoch #241 | Saved
2025-04-03 22:00:58 | [maml_trainer] epoch #241 | Time 115680.00 s
2025-04-03 22:00:58 | [maml_trainer] epoch #241 | EpochTime 454.10 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.2154
Average/AverageReturn                              -33.2385
Average/Iteration                                  241
Average/MaxReturn                                    5.80603
Average/MinReturn                                  -61.4112
Average/NumEpisodes                                 80
Average/StdReturn                                   11.5307
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85991
GaussianMLPPolicy/KLAfter                            0.00222073
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          8.2686e-05
GaussianMLPPolicy/LossBefore                        -1.5229e-08
GaussianMLPPolicy/dLoss                             -8.27013e-05
Iteration                                          241
MetaTest/Average/AverageDiscountedReturn           -34.6177
MetaTest/Average/AverageReturn                     -34.6177
MetaTest/Average/Iteration                         241
MetaTest/Average/MaxReturn                          -7.28354
MetaTest/Average/MinReturn                         -52.1718
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.60454
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.6177
MetaTest/__unnamed_task__/AverageReturn            -34.6177
MetaTest/__unnamed_task__/Iteration                241
MetaTest/__unnamed_task__/MaxReturn                 -7.28354
MetaTest/__unnamed_task__/MinReturn                -52.1718
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.60454
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.744e+06
__unnamed_task__/AverageDiscountedReturn           -17.2154
__unnamed_task__/AverageReturn                     -33.2385
__unnamed_task__/Iteration                         241
__unnamed_task__/MaxReturn                           5.80603
__unnamed_task__/MinReturn                         -61.4112
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.5307
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:06:38 | [maml_trainer] epoch #242 | Sampling for adapation and meta-testing...
2025-04-03 22:08:03 | [maml_trainer] epoch #242 | Finished meta-testing...
2025-04-03 22:08:03 | [maml_trainer] epoch #242 | Saving snapshot...
2025-04-03 22:08:27 | [maml_trainer] epoch #242 | Saved
2025-04-03 22:08:27 | [maml_trainer] epoch #242 | Time 116129.69 s
2025-04-03 22:08:27 | [maml_trainer] epoch #242 | EpochTime 449.68 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.1737
Average/AverageReturn                              -33.5931
Average/Iteration                                  242
Average/MaxReturn                                  -11.5778
Average/MinReturn                                  -60.1661
Average/NumEpisodes                                 80
Average/StdReturn                                    9.51785
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85966
GaussianMLPPolicy/KLAfter                            0.00131943
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -4.32019e-05
GaussianMLPPolicy/LossBefore                         5.126e-09
GaussianMLPPolicy/dLoss                              4.3207e-05
Iteration                                          242
MetaTest/Average/AverageDiscountedReturn           -37.3092
MetaTest/Average/AverageReturn                     -37.3092
MetaTest/Average/Iteration                         242
MetaTest/Average/MaxReturn                         -24.2314
MetaTest/Average/MinReturn                         -58.7115
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.59853
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.3092
MetaTest/__unnamed_task__/AverageReturn            -37.3092
MetaTest/__unnamed_task__/Iteration                242
MetaTest/__unnamed_task__/MaxReturn                -24.2314
MetaTest/__unnamed_task__/MinReturn                -58.7115
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.59853
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.776e+06
__unnamed_task__/AverageDiscountedReturn           -17.1737
__unnamed_task__/AverageReturn                     -33.5931
__unnamed_task__/Iteration                         242
__unnamed_task__/MaxReturn                         -11.5778
__unnamed_task__/MinReturn                         -60.1661
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.51785
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:14:19 | [maml_trainer] epoch #243 | Sampling for adapation and meta-testing...
2025-04-03 22:15:52 | [maml_trainer] epoch #243 | Finished meta-testing...
2025-04-03 22:15:52 | [maml_trainer] epoch #243 | Saving snapshot...
2025-04-03 22:16:16 | [maml_trainer] epoch #243 | Saved
2025-04-03 22:16:16 | [maml_trainer] epoch #243 | Time 116598.73 s
2025-04-03 22:16:16 | [maml_trainer] epoch #243 | EpochTime 469.04 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.3925
Average/AverageReturn                              -33.9822
Average/Iteration                                  243
Average/MaxReturn                                   -1.54747
Average/MinReturn                                  -66.0087
Average/NumEpisodes                                 80
Average/StdReturn                                   12.4184
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85867
GaussianMLPPolicy/KLAfter                            0.00127442
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.46105e-06
GaussianMLPPolicy/LossBefore                         1.97887e-08
GaussianMLPPolicy/dLoss                             -6.44127e-06
Iteration                                          243
MetaTest/Average/AverageDiscountedReturn           -35.3253
MetaTest/Average/AverageReturn                     -35.3253
MetaTest/Average/Iteration                         243
MetaTest/Average/MaxReturn                         -16.9336
MetaTest/Average/MinReturn                         -59.368
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.68308
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.3253
MetaTest/__unnamed_task__/AverageReturn            -35.3253
MetaTest/__unnamed_task__/Iteration                243
MetaTest/__unnamed_task__/MaxReturn                -16.9336
MetaTest/__unnamed_task__/MinReturn                -59.368
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.68308
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.808e+06
__unnamed_task__/AverageDiscountedReturn           -17.3925
__unnamed_task__/AverageReturn                     -33.9822
__unnamed_task__/Iteration                         243
__unnamed_task__/MaxReturn                          -1.54747
__unnamed_task__/MinReturn                         -66.0087
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.4184
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:22:35 | [maml_trainer] epoch #244 | Sampling for adapation and meta-testing...
2025-04-03 22:24:18 | [maml_trainer] epoch #244 | Finished meta-testing...
2025-04-03 22:24:18 | [maml_trainer] epoch #244 | Saving snapshot...
2025-04-03 22:24:41 | [maml_trainer] epoch #244 | Saved
2025-04-03 22:24:41 | [maml_trainer] epoch #244 | Time 117103.33 s
2025-04-03 22:24:41 | [maml_trainer] epoch #244 | EpochTime 504.60 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5722
Average/AverageReturn                              -31.5757
Average/Iteration                                  244
Average/MaxReturn                                    3.17201
Average/MinReturn                                  -58.588
Average/NumEpisodes                                 80
Average/StdReturn                                   11.2161
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85841
GaussianMLPPolicy/KLAfter                            0.00446976
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000167975
GaussianMLPPolicy/LossBefore                        -3.63588e-09
GaussianMLPPolicy/dLoss                             -0.000167978
Iteration                                          244
MetaTest/Average/AverageDiscountedReturn           -30.2438
MetaTest/Average/AverageReturn                     -30.2438
MetaTest/Average/Iteration                         244
MetaTest/Average/MaxReturn                         -14.4808
MetaTest/Average/MinReturn                         -58.1693
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.1472
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.2438
MetaTest/__unnamed_task__/AverageReturn            -30.2438
MetaTest/__unnamed_task__/Iteration                244
MetaTest/__unnamed_task__/MaxReturn                -14.4808
MetaTest/__unnamed_task__/MinReturn                -58.1693
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.1472
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.84e+06
__unnamed_task__/AverageDiscountedReturn           -16.5722
__unnamed_task__/AverageReturn                     -31.5757
__unnamed_task__/Iteration                         244
__unnamed_task__/MaxReturn                           3.17201
__unnamed_task__/MinReturn                         -58.588
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.2161
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:30:59 | [maml_trainer] epoch #245 | Sampling for adapation and meta-testing...
2025-04-03 22:32:31 | [maml_trainer] epoch #245 | Finished meta-testing...
2025-04-03 22:32:31 | [maml_trainer] epoch #245 | Saving snapshot...
2025-04-03 22:32:55 | [maml_trainer] epoch #245 | Saved
2025-04-03 22:32:55 | [maml_trainer] epoch #245 | Time 117597.25 s
2025-04-03 22:32:55 | [maml_trainer] epoch #245 | EpochTime 493.92 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.0828
Average/AverageReturn                              -30.0528
Average/Iteration                                  245
Average/MaxReturn                                   12.4375
Average/MinReturn                                  -51.5847
Average/NumEpisodes                                 80
Average/StdReturn                                   10.227
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85896
GaussianMLPPolicy/KLAfter                            0.00579469
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.79062e-06
GaussianMLPPolicy/LossBefore                         6.79493e-09
GaussianMLPPolicy/dLoss                             -5.78383e-06
Iteration                                          245
MetaTest/Average/AverageDiscountedReturn           -31.5047
MetaTest/Average/AverageReturn                     -31.5047
MetaTest/Average/Iteration                         245
MetaTest/Average/MaxReturn                           8.33095
MetaTest/Average/MinReturn                         -50.2065
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.5126
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.5047
MetaTest/__unnamed_task__/AverageReturn            -31.5047
MetaTest/__unnamed_task__/Iteration                245
MetaTest/__unnamed_task__/MaxReturn                  8.33095
MetaTest/__unnamed_task__/MinReturn                -50.2065
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.5126
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.872e+06
__unnamed_task__/AverageDiscountedReturn           -16.0828
__unnamed_task__/AverageReturn                     -30.0528
__unnamed_task__/Iteration                         245
__unnamed_task__/MaxReturn                          12.4375
__unnamed_task__/MinReturn                         -51.5847
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.227
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:38:49 | [maml_trainer] epoch #246 | Sampling for adapation and meta-testing...
2025-04-03 22:40:16 | [maml_trainer] epoch #246 | Finished meta-testing...
2025-04-03 22:40:16 | [maml_trainer] epoch #246 | Saving snapshot...
2025-04-03 22:40:38 | [maml_trainer] epoch #246 | Saved
2025-04-03 22:40:38 | [maml_trainer] epoch #246 | Time 118060.61 s
2025-04-03 22:40:38 | [maml_trainer] epoch #246 | EpochTime 463.35 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.8048
Average/AverageReturn                              -33.1831
Average/Iteration                                  246
Average/MaxReturn                                    4.92859
Average/MinReturn                                  -56.2546
Average/NumEpisodes                                 80
Average/StdReturn                                   11.8155
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85947
GaussianMLPPolicy/KLAfter                            0.00571666
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000326572
GaussianMLPPolicy/LossBefore                        -7.27177e-09
GaussianMLPPolicy/dLoss                             -0.000326579
Iteration                                          246
MetaTest/Average/AverageDiscountedReturn           -32.7545
MetaTest/Average/AverageReturn                     -32.7545
MetaTest/Average/Iteration                         246
MetaTest/Average/MaxReturn                         -15.6461
MetaTest/Average/MinReturn                         -44.2087
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.26258
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.7545
MetaTest/__unnamed_task__/AverageReturn            -32.7545
MetaTest/__unnamed_task__/Iteration                246
MetaTest/__unnamed_task__/MaxReturn                -15.6461
MetaTest/__unnamed_task__/MinReturn                -44.2087
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.26258
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.904e+06
__unnamed_task__/AverageDiscountedReturn           -16.8048
__unnamed_task__/AverageReturn                     -33.1831
__unnamed_task__/Iteration                         246
__unnamed_task__/MaxReturn                           4.92859
__unnamed_task__/MinReturn                         -56.2546
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.8155
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:46:26 | [maml_trainer] epoch #247 | Sampling for adapation and meta-testing...
2025-04-03 22:47:55 | [maml_trainer] epoch #247 | Finished meta-testing...
2025-04-03 22:47:55 | [maml_trainer] epoch #247 | Saving snapshot...
2025-04-03 22:48:19 | [maml_trainer] epoch #247 | Saved
2025-04-03 22:48:19 | [maml_trainer] epoch #247 | Time 118521.35 s
2025-04-03 22:48:19 | [maml_trainer] epoch #247 | EpochTime 460.73 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5978
Average/AverageReturn                              -32.5997
Average/Iteration                                  247
Average/MaxReturn                                    3.36004
Average/MinReturn                                  -49.8894
Average/NumEpisodes                                 80
Average/StdReturn                                    8.67863
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86093
GaussianMLPPolicy/KLAfter                            0.00542741
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000217984
GaussianMLPPolicy/LossBefore                         7.7486e-10
GaussianMLPPolicy/dLoss                             -0.000217983
Iteration                                          247
MetaTest/Average/AverageDiscountedReturn           -36.1036
MetaTest/Average/AverageReturn                     -36.1036
MetaTest/Average/Iteration                         247
MetaTest/Average/MaxReturn                         -24.9563
MetaTest/Average/MinReturn                         -55.5918
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.16197
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -36.1036
MetaTest/__unnamed_task__/AverageReturn            -36.1036
MetaTest/__unnamed_task__/Iteration                247
MetaTest/__unnamed_task__/MaxReturn                -24.9563
MetaTest/__unnamed_task__/MinReturn                -55.5918
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.16197
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.936e+06
__unnamed_task__/AverageDiscountedReturn           -16.5978
__unnamed_task__/AverageReturn                     -32.5997
__unnamed_task__/Iteration                         247
__unnamed_task__/MaxReturn                           3.36004
__unnamed_task__/MinReturn                         -49.8894
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.67863
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 22:54:05 | [maml_trainer] epoch #248 | Sampling for adapation and meta-testing...
2025-04-03 22:55:35 | [maml_trainer] epoch #248 | Finished meta-testing...
2025-04-03 22:55:35 | [maml_trainer] epoch #248 | Saving snapshot...
2025-04-03 22:55:59 | [maml_trainer] epoch #248 | Saved
2025-04-03 22:55:59 | [maml_trainer] epoch #248 | Time 118981.00 s
2025-04-03 22:55:59 | [maml_trainer] epoch #248 | EpochTime 459.65 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.2397
Average/AverageReturn                              -32.902
Average/Iteration                                  248
Average/MaxReturn                                   -1.62621
Average/MinReturn                                  -66.4008
Average/NumEpisodes                                 80
Average/StdReturn                                   10.3683
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.86057
GaussianMLPPolicy/KLAfter                            0.0036658
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000263084
GaussianMLPPolicy/LossBefore                        -2.24113e-08
GaussianMLPPolicy/dLoss                              0.000263061
Iteration                                          248
MetaTest/Average/AverageDiscountedReturn           -35.5903
MetaTest/Average/AverageReturn                     -35.5903
MetaTest/Average/Iteration                         248
MetaTest/Average/MaxReturn                         -26.4871
MetaTest/Average/MinReturn                         -51.132
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.02003
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.5903
MetaTest/__unnamed_task__/AverageReturn            -35.5903
MetaTest/__unnamed_task__/Iteration                248
MetaTest/__unnamed_task__/MaxReturn                -26.4871
MetaTest/__unnamed_task__/MinReturn                -51.132
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.02003
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        7.968e+06
__unnamed_task__/AverageDiscountedReturn           -16.2397
__unnamed_task__/AverageReturn                     -32.902
__unnamed_task__/Iteration                         248
__unnamed_task__/MaxReturn                          -1.62621
__unnamed_task__/MinReturn                         -66.4008
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.3683
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:02:00 | [maml_trainer] epoch #249 | Sampling for adapation and meta-testing...
2025-04-03 23:03:32 | [maml_trainer] epoch #249 | Finished meta-testing...
2025-04-03 23:03:32 | [maml_trainer] epoch #249 | Saving snapshot...
2025-04-03 23:03:55 | [maml_trainer] epoch #249 | Saved
2025-04-03 23:03:55 | [maml_trainer] epoch #249 | Time 119457.05 s
2025-04-03 23:03:55 | [maml_trainer] epoch #249 | EpochTime 476.05 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.9689
Average/AverageReturn                              -34.6457
Average/Iteration                                  249
Average/MaxReturn                                  -20.5539
Average/MinReturn                                  -69.4793
Average/NumEpisodes                                 80
Average/StdReturn                                    7.41108
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85839
GaussianMLPPolicy/KLAfter                            0.00422551
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.93154e-05
GaussianMLPPolicy/LossBefore                         3.57629e-10
GaussianMLPPolicy/dLoss                              6.93158e-05
Iteration                                          249
MetaTest/Average/AverageDiscountedReturn           -31.5912
MetaTest/Average/AverageReturn                     -31.5912
MetaTest/Average/Iteration                         249
MetaTest/Average/MaxReturn                         -18.2352
MetaTest/Average/MinReturn                         -42.3416
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.10098
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.5912
MetaTest/__unnamed_task__/AverageReturn            -31.5912
MetaTest/__unnamed_task__/Iteration                249
MetaTest/__unnamed_task__/MaxReturn                -18.2352
MetaTest/__unnamed_task__/MinReturn                -42.3416
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.10098
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8e+06
__unnamed_task__/AverageDiscountedReturn           -16.9689
__unnamed_task__/AverageReturn                     -34.6457
__unnamed_task__/Iteration                         249
__unnamed_task__/MaxReturn                         -20.5539
__unnamed_task__/MinReturn                         -69.4793
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.41108
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:09:58 | [maml_trainer] epoch #250 | Sampling for adapation and meta-testing...
2025-04-03 23:11:28 | [maml_trainer] epoch #250 | Finished meta-testing...
2025-04-03 23:11:28 | [maml_trainer] epoch #250 | Saving snapshot...
2025-04-03 23:11:53 | [maml_trainer] epoch #250 | Saved
2025-04-03 23:11:53 | [maml_trainer] epoch #250 | Time 119935.14 s
2025-04-03 23:11:53 | [maml_trainer] epoch #250 | EpochTime 478.09 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7977
Average/AverageReturn                              -32.1161
Average/Iteration                                  250
Average/MaxReturn                                  -15.9373
Average/MinReturn                                  -56.8944
Average/NumEpisodes                                 80
Average/StdReturn                                    7.50688
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8567
GaussianMLPPolicy/KLAfter                            0.00394163
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000394507
GaussianMLPPolicy/LossBefore                        -2.63453e-08
GaussianMLPPolicy/dLoss                              0.00039448
Iteration                                          250
MetaTest/Average/AverageDiscountedReturn           -30.8278
MetaTest/Average/AverageReturn                     -30.8278
MetaTest/Average/Iteration                         250
MetaTest/Average/MaxReturn                          -6.24935
MetaTest/Average/MinReturn                         -45.2931
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.27546
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.8278
MetaTest/__unnamed_task__/AverageReturn            -30.8278
MetaTest/__unnamed_task__/Iteration                250
MetaTest/__unnamed_task__/MaxReturn                 -6.24935
MetaTest/__unnamed_task__/MinReturn                -45.2931
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.27546
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.032e+06
__unnamed_task__/AverageDiscountedReturn           -15.7977
__unnamed_task__/AverageReturn                     -32.1161
__unnamed_task__/Iteration                         250
__unnamed_task__/MaxReturn                         -15.9373
__unnamed_task__/MinReturn                         -56.8944
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.50688
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:17:55 | [maml_trainer] epoch #251 | Sampling for adapation and meta-testing...
2025-04-03 23:19:28 | [maml_trainer] epoch #251 | Finished meta-testing...
2025-04-03 23:19:28 | [maml_trainer] epoch #251 | Saving snapshot...
2025-04-03 23:19:52 | [maml_trainer] epoch #251 | Saved
2025-04-03 23:19:52 | [maml_trainer] epoch #251 | Time 120414.94 s
2025-04-03 23:19:52 | [maml_trainer] epoch #251 | EpochTime 479.80 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3488
Average/AverageReturn                              -29.7249
Average/Iteration                                  251
Average/MaxReturn                                   11.5618
Average/MinReturn                                  -53.2295
Average/NumEpisodes                                 80
Average/StdReturn                                   12.7859
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85576
GaussianMLPPolicy/KLAfter                            0.0038123
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000214025
GaussianMLPPolicy/LossBefore                        -5.0962e-09
GaussianMLPPolicy/dLoss                              0.00021402
Iteration                                          251
MetaTest/Average/AverageDiscountedReturn           -30.3229
MetaTest/Average/AverageReturn                     -30.3229
MetaTest/Average/Iteration                         251
MetaTest/Average/MaxReturn                          -9.64626
MetaTest/Average/MinReturn                         -44.5151
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.81947
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.3229
MetaTest/__unnamed_task__/AverageReturn            -30.3229
MetaTest/__unnamed_task__/Iteration                251
MetaTest/__unnamed_task__/MaxReturn                 -9.64626
MetaTest/__unnamed_task__/MinReturn                -44.5151
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.81947
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.064e+06
__unnamed_task__/AverageDiscountedReturn           -15.3488
__unnamed_task__/AverageReturn                     -29.7249
__unnamed_task__/Iteration                         251
__unnamed_task__/MaxReturn                          11.5618
__unnamed_task__/MinReturn                         -53.2295
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.7859
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:25:55 | [maml_trainer] epoch #252 | Sampling for adapation and meta-testing...
2025-04-03 23:27:27 | [maml_trainer] epoch #252 | Finished meta-testing...
2025-04-03 23:27:27 | [maml_trainer] epoch #252 | Saving snapshot...
2025-04-03 23:27:50 | [maml_trainer] epoch #252 | Saved
2025-04-03 23:27:50 | [maml_trainer] epoch #252 | Time 120892.69 s
2025-04-03 23:27:50 | [maml_trainer] epoch #252 | EpochTime 477.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.5829
Average/AverageReturn                              -30.5136
Average/Iteration                                  252
Average/MaxReturn                                    7.6847
Average/MinReturn                                  -58.3803
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1684
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8542
GaussianMLPPolicy/KLAfter                            0.00639167
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000202269
GaussianMLPPolicy/LossBefore                         5.78165e-09
GaussianMLPPolicy/dLoss                              0.000202275
Iteration                                          252
MetaTest/Average/AverageDiscountedReturn           -28.5307
MetaTest/Average/AverageReturn                     -28.5307
MetaTest/Average/Iteration                         252
MetaTest/Average/MaxReturn                          -2.02714
MetaTest/Average/MinReturn                         -45.0272
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.553
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.5307
MetaTest/__unnamed_task__/AverageReturn            -28.5307
MetaTest/__unnamed_task__/Iteration                252
MetaTest/__unnamed_task__/MaxReturn                 -2.02714
MetaTest/__unnamed_task__/MinReturn                -45.0272
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.553
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.096e+06
__unnamed_task__/AverageDiscountedReturn           -15.5829
__unnamed_task__/AverageReturn                     -30.5136
__unnamed_task__/Iteration                         252
__unnamed_task__/MaxReturn                           7.6847
__unnamed_task__/MinReturn                         -58.3803
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1684
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:33:58 | [maml_trainer] epoch #253 | Sampling for adapation and meta-testing...
2025-04-03 23:35:30 | [maml_trainer] epoch #253 | Finished meta-testing...
2025-04-03 23:35:30 | [maml_trainer] epoch #253 | Saving snapshot...
2025-04-03 23:35:54 | [maml_trainer] epoch #253 | Saved
2025-04-03 23:35:54 | [maml_trainer] epoch #253 | Time 121376.62 s
2025-04-03 23:35:54 | [maml_trainer] epoch #253 | EpochTime 483.92 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7077
Average/AverageReturn                              -30.1699
Average/Iteration                                  253
Average/MaxReturn                                   -3.2687
Average/MinReturn                                  -50.518
Average/NumEpisodes                                 80
Average/StdReturn                                    8.05908
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85309
GaussianMLPPolicy/KLAfter                            0.00499923
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00031054
GaussianMLPPolicy/LossBefore                        -7.51019e-09
GaussianMLPPolicy/dLoss                             -0.000310547
Iteration                                          253
MetaTest/Average/AverageDiscountedReturn           -32.2345
MetaTest/Average/AverageReturn                     -32.2345
MetaTest/Average/Iteration                         253
MetaTest/Average/MaxReturn                         -12.1986
MetaTest/Average/MinReturn                         -50.9046
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.1203
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.2345
MetaTest/__unnamed_task__/AverageReturn            -32.2345
MetaTest/__unnamed_task__/Iteration                253
MetaTest/__unnamed_task__/MaxReturn                -12.1986
MetaTest/__unnamed_task__/MinReturn                -50.9046
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.1203
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.128e+06
__unnamed_task__/AverageDiscountedReturn           -15.7077
__unnamed_task__/AverageReturn                     -30.1699
__unnamed_task__/Iteration                         253
__unnamed_task__/MaxReturn                          -3.2687
__unnamed_task__/MinReturn                         -50.518
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.05908
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:42:01 | [maml_trainer] epoch #254 | Sampling for adapation and meta-testing...
2025-04-03 23:43:32 | [maml_trainer] epoch #254 | Finished meta-testing...
2025-04-03 23:43:32 | [maml_trainer] epoch #254 | Saving snapshot...
2025-04-03 23:43:56 | [maml_trainer] epoch #254 | Saved
2025-04-03 23:43:56 | [maml_trainer] epoch #254 | Time 121858.59 s
2025-04-03 23:43:56 | [maml_trainer] epoch #254 | EpochTime 481.97 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.1236
Average/AverageReturn                              -32.5369
Average/Iteration                                  254
Average/MaxReturn                                   -0.110867
Average/MinReturn                                  -53.6195
Average/NumEpisodes                                 80
Average/StdReturn                                    8.15434
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8524
GaussianMLPPolicy/KLAfter                            0.0023487
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000112468
GaussianMLPPolicy/LossBefore                         1.54972e-09
GaussianMLPPolicy/dLoss                             -0.000112467
Iteration                                          254
MetaTest/Average/AverageDiscountedReturn           -37.3473
MetaTest/Average/AverageReturn                     -37.3473
MetaTest/Average/Iteration                         254
MetaTest/Average/MaxReturn                         -25.3506
MetaTest/Average/MinReturn                         -51.0367
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.1795
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.3473
MetaTest/__unnamed_task__/AverageReturn            -37.3473
MetaTest/__unnamed_task__/Iteration                254
MetaTest/__unnamed_task__/MaxReturn                -25.3506
MetaTest/__unnamed_task__/MinReturn                -51.0367
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.1795
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.16e+06
__unnamed_task__/AverageDiscountedReturn           -16.1236
__unnamed_task__/AverageReturn                     -32.5369
__unnamed_task__/Iteration                         254
__unnamed_task__/MaxReturn                          -0.110867
__unnamed_task__/MinReturn                         -53.6195
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.15434
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:50:03 | [maml_trainer] epoch #255 | Sampling for adapation and meta-testing...
2025-04-03 23:51:34 | [maml_trainer] epoch #255 | Finished meta-testing...
2025-04-03 23:51:34 | [maml_trainer] epoch #255 | Saving snapshot...
2025-04-03 23:51:58 | [maml_trainer] epoch #255 | Saved
2025-04-03 23:51:58 | [maml_trainer] epoch #255 | Time 122340.61 s
2025-04-03 23:51:58 | [maml_trainer] epoch #255 | EpochTime 482.02 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4357
Average/AverageReturn                              -33.3001
Average/Iteration                                  255
Average/MaxReturn                                   -0.360736
Average/MinReturn                                  -59.8581
Average/NumEpisodes                                 80
Average/StdReturn                                    8.25476
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8524
GaussianMLPPolicy/KLAfter                            0.00233318
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000186192
GaussianMLPPolicy/LossBefore                        -2.12789e-08
GaussianMLPPolicy/dLoss                             -0.000186213
Iteration                                          255
MetaTest/Average/AverageDiscountedReturn           -34.8843
MetaTest/Average/AverageReturn                     -34.8843
MetaTest/Average/Iteration                         255
MetaTest/Average/MaxReturn                         -11.8947
MetaTest/Average/MinReturn                         -59.1312
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.70199
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.8843
MetaTest/__unnamed_task__/AverageReturn            -34.8843
MetaTest/__unnamed_task__/Iteration                255
MetaTest/__unnamed_task__/MaxReturn                -11.8947
MetaTest/__unnamed_task__/MinReturn                -59.1312
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.70199
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.192e+06
__unnamed_task__/AverageDiscountedReturn           -16.4357
__unnamed_task__/AverageReturn                     -33.3001
__unnamed_task__/Iteration                         255
__unnamed_task__/MaxReturn                          -0.360736
__unnamed_task__/MinReturn                         -59.8581
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.25476
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-03 23:58:02 | [maml_trainer] epoch #256 | Sampling for adapation and meta-testing...
2025-04-03 23:59:34 | [maml_trainer] epoch #256 | Finished meta-testing...
2025-04-03 23:59:34 | [maml_trainer] epoch #256 | Saving snapshot...
2025-04-03 23:59:58 | [maml_trainer] epoch #256 | Saved
2025-04-03 23:59:58 | [maml_trainer] epoch #256 | Time 122820.38 s
2025-04-03 23:59:58 | [maml_trainer] epoch #256 | EpochTime 479.77 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -17.4778
Average/AverageReturn                              -35.8922
Average/Iteration                                  256
Average/MaxReturn                                   16.1805
Average/MinReturn                                  -60.7126
Average/NumEpisodes                                 80
Average/StdReturn                                   10.7565
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.85076
GaussianMLPPolicy/KLAfter                            0.0022195
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000116427
GaussianMLPPolicy/LossBefore                         3.5286e-08
GaussianMLPPolicy/dLoss                              0.000116462
Iteration                                          256
MetaTest/Average/AverageDiscountedReturn           -39.4945
MetaTest/Average/AverageReturn                     -39.4945
MetaTest/Average/Iteration                         256
MetaTest/Average/MaxReturn                         -25.8393
MetaTest/Average/MinReturn                         -59.8067
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.3848
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -39.4945
MetaTest/__unnamed_task__/AverageReturn            -39.4945
MetaTest/__unnamed_task__/Iteration                256
MetaTest/__unnamed_task__/MaxReturn                -25.8393
MetaTest/__unnamed_task__/MinReturn                -59.8067
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.3848
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.224e+06
__unnamed_task__/AverageDiscountedReturn           -17.4778
__unnamed_task__/AverageReturn                     -35.8922
__unnamed_task__/Iteration                         256
__unnamed_task__/MaxReturn                          16.1805
__unnamed_task__/MinReturn                         -60.7126
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.7565
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:06:03 | [maml_trainer] epoch #257 | Sampling for adapation and meta-testing...
2025-04-04 00:07:35 | [maml_trainer] epoch #257 | Finished meta-testing...
2025-04-04 00:07:35 | [maml_trainer] epoch #257 | Saving snapshot...
2025-04-04 00:07:58 | [maml_trainer] epoch #257 | Saved
2025-04-04 00:07:58 | [maml_trainer] epoch #257 | Time 123300.04 s
2025-04-04 00:07:58 | [maml_trainer] epoch #257 | EpochTime 479.65 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.428
Average/AverageReturn                              -33.6306
Average/Iteration                                  257
Average/MaxReturn                                   -3.46599
Average/MinReturn                                  -50.2605
Average/NumEpisodes                                 80
Average/StdReturn                                    8.43597
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.84913
GaussianMLPPolicy/KLAfter                            0.00530483
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000381086
GaussianMLPPolicy/LossBefore                        -3.02792e-08
GaussianMLPPolicy/dLoss                              0.000381056
Iteration                                          257
MetaTest/Average/AverageDiscountedReturn           -29.4142
MetaTest/Average/AverageReturn                     -29.4142
MetaTest/Average/Iteration                         257
MetaTest/Average/MaxReturn                          -1.37287
MetaTest/Average/MinReturn                         -42.6494
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.17618
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.4142
MetaTest/__unnamed_task__/AverageReturn            -29.4142
MetaTest/__unnamed_task__/Iteration                257
MetaTest/__unnamed_task__/MaxReturn                 -1.37287
MetaTest/__unnamed_task__/MinReturn                -42.6494
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.17618
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.256e+06
__unnamed_task__/AverageDiscountedReturn           -16.428
__unnamed_task__/AverageReturn                     -33.6306
__unnamed_task__/Iteration                         257
__unnamed_task__/MaxReturn                          -3.46599
__unnamed_task__/MinReturn                         -50.2605
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.43597
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:14:00 | [maml_trainer] epoch #258 | Sampling for adapation and meta-testing...
2025-04-04 00:15:31 | [maml_trainer] epoch #258 | Finished meta-testing...
2025-04-04 00:15:31 | [maml_trainer] epoch #258 | Saving snapshot...
2025-04-04 00:15:56 | [maml_trainer] epoch #258 | Saved
2025-04-04 00:15:56 | [maml_trainer] epoch #258 | Time 123778.93 s
2025-04-04 00:15:56 | [maml_trainer] epoch #258 | EpochTime 478.89 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.4046
Average/AverageReturn                              -33.217
Average/Iteration                                  258
Average/MaxReturn                                   15.4374
Average/MinReturn                                  -64.1166
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1004
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8485
GaussianMLPPolicy/KLAfter                            0.00863303
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000308417
GaussianMLPPolicy/LossBefore                        -7.7486e-09
GaussianMLPPolicy/dLoss                              0.00030841
Iteration                                          258
MetaTest/Average/AverageDiscountedReturn           -30.3235
MetaTest/Average/AverageReturn                     -30.3235
MetaTest/Average/Iteration                         258
MetaTest/Average/MaxReturn                         -12.5241
MetaTest/Average/MinReturn                         -47.9031
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.55115
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.3235
MetaTest/__unnamed_task__/AverageReturn            -30.3235
MetaTest/__unnamed_task__/Iteration                258
MetaTest/__unnamed_task__/MaxReturn                -12.5241
MetaTest/__unnamed_task__/MinReturn                -47.9031
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.55115
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.288e+06
__unnamed_task__/AverageDiscountedReturn           -16.4046
__unnamed_task__/AverageReturn                     -33.217
__unnamed_task__/Iteration                         258
__unnamed_task__/MaxReturn                          15.4374
__unnamed_task__/MinReturn                         -64.1166
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1004
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:22:11 | [maml_trainer] epoch #259 | Sampling for adapation and meta-testing...
2025-04-04 00:23:43 | [maml_trainer] epoch #259 | Finished meta-testing...
2025-04-04 00:23:43 | [maml_trainer] epoch #259 | Saving snapshot...
2025-04-04 00:24:07 | [maml_trainer] epoch #259 | Saved
2025-04-04 00:24:07 | [maml_trainer] epoch #259 | Time 124269.89 s
2025-04-04 00:24:07 | [maml_trainer] epoch #259 | EpochTime 490.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.9096
Average/AverageReturn                              -29.3779
Average/Iteration                                  259
Average/MaxReturn                                   15.4253
Average/MinReturn                                  -59.9211
Average/NumEpisodes                                 80
Average/StdReturn                                   12.5425
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8471
GaussianMLPPolicy/KLAfter                            0.00480934
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000154482
GaussianMLPPolicy/LossBefore                         1.59144e-08
GaussianMLPPolicy/dLoss                              0.000154498
Iteration                                          259
MetaTest/Average/AverageDiscountedReturn           -37.7734
MetaTest/Average/AverageReturn                     -37.7734
MetaTest/Average/Iteration                         259
MetaTest/Average/MaxReturn                         -16.5359
MetaTest/Average/MinReturn                         -62.8311
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.111
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -37.7734
MetaTest/__unnamed_task__/AverageReturn            -37.7734
MetaTest/__unnamed_task__/Iteration                259
MetaTest/__unnamed_task__/MaxReturn                -16.5359
MetaTest/__unnamed_task__/MinReturn                -62.8311
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.111
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.32e+06
__unnamed_task__/AverageDiscountedReturn           -14.9096
__unnamed_task__/AverageReturn                     -29.3779
__unnamed_task__/Iteration                         259
__unnamed_task__/MaxReturn                          15.4253
__unnamed_task__/MinReturn                         -59.9211
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          12.5425
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:30:12 | [maml_trainer] epoch #260 | Sampling for adapation and meta-testing...
2025-04-04 00:31:43 | [maml_trainer] epoch #260 | Finished meta-testing...
2025-04-04 00:31:43 | [maml_trainer] epoch #260 | Saving snapshot...
2025-04-04 00:32:06 | [maml_trainer] epoch #260 | Saved
2025-04-04 00:32:06 | [maml_trainer] epoch #260 | Time 124748.66 s
2025-04-04 00:32:06 | [maml_trainer] epoch #260 | EpochTime 478.77 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.1833
Average/AverageReturn                              -29.8719
Average/Iteration                                  260
Average/MaxReturn                                   17.7546
Average/MinReturn                                  -57.4994
Average/NumEpisodes                                 80
Average/StdReturn                                   11.1523
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.84657
GaussianMLPPolicy/KLAfter                            0.0035866
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000149142
GaussianMLPPolicy/LossBefore                        -2.96831e-08
GaussianMLPPolicy/dLoss                             -0.000149172
Iteration                                          260
MetaTest/Average/AverageDiscountedReturn           -31.5135
MetaTest/Average/AverageReturn                     -31.5135
MetaTest/Average/Iteration                         260
MetaTest/Average/MaxReturn                         -11.8205
MetaTest/Average/MinReturn                         -59.4852
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.0516
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.5135
MetaTest/__unnamed_task__/AverageReturn            -31.5135
MetaTest/__unnamed_task__/Iteration                260
MetaTest/__unnamed_task__/MaxReturn                -11.8205
MetaTest/__unnamed_task__/MinReturn                -59.4852
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.0516
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.352e+06
__unnamed_task__/AverageDiscountedReturn           -15.1833
__unnamed_task__/AverageReturn                     -29.8719
__unnamed_task__/Iteration                         260
__unnamed_task__/MaxReturn                          17.7546
__unnamed_task__/MinReturn                         -57.4994
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.1523
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:38:07 | [maml_trainer] epoch #261 | Sampling for adapation and meta-testing...
2025-04-04 00:39:38 | [maml_trainer] epoch #261 | Finished meta-testing...
2025-04-04 00:39:38 | [maml_trainer] epoch #261 | Saving snapshot...
2025-04-04 00:40:02 | [maml_trainer] epoch #261 | Saved
2025-04-04 00:40:02 | [maml_trainer] epoch #261 | Time 125224.58 s
2025-04-04 00:40:02 | [maml_trainer] epoch #261 | EpochTime 475.92 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7129
Average/AverageReturn                              -31.51
Average/Iteration                                  261
Average/MaxReturn                                   21.8307
Average/MinReturn                                  -62.844
Average/NumEpisodes                                 80
Average/StdReturn                                   10.8067
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.84564
GaussianMLPPolicy/KLAfter                            0.00183941
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.38224e-05
GaussianMLPPolicy/LossBefore                         2.17557e-08
GaussianMLPPolicy/dLoss                              3.38442e-05
Iteration                                          261
MetaTest/Average/AverageDiscountedReturn           -33.2467
MetaTest/Average/AverageReturn                     -33.2467
MetaTest/Average/Iteration                         261
MetaTest/Average/MaxReturn                         -15.9784
MetaTest/Average/MinReturn                         -46.4393
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.10796
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.2467
MetaTest/__unnamed_task__/AverageReturn            -33.2467
MetaTest/__unnamed_task__/Iteration                261
MetaTest/__unnamed_task__/MaxReturn                -15.9784
MetaTest/__unnamed_task__/MinReturn                -46.4393
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.10796
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.384e+06
__unnamed_task__/AverageDiscountedReturn           -15.7129
__unnamed_task__/AverageReturn                     -31.51
__unnamed_task__/Iteration                         261
__unnamed_task__/MaxReturn                          21.8307
__unnamed_task__/MinReturn                         -62.844
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.8067
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:46:07 | [maml_trainer] epoch #262 | Sampling for adapation and meta-testing...
2025-04-04 00:47:39 | [maml_trainer] epoch #262 | Finished meta-testing...
2025-04-04 00:47:39 | [maml_trainer] epoch #262 | Saving snapshot...
2025-04-04 00:48:03 | [maml_trainer] epoch #262 | Saved
2025-04-04 00:48:03 | [maml_trainer] epoch #262 | Time 125705.78 s
2025-04-04 00:48:03 | [maml_trainer] epoch #262 | EpochTime 481.20 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.7717
Average/AverageReturn                              -31.8456
Average/Iteration                                  262
Average/MaxReturn                                   -7.63414
Average/MinReturn                                  -58.8641
Average/NumEpisodes                                 80
Average/StdReturn                                    9.41271
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.84346
GaussianMLPPolicy/KLAfter                            0.00109424
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.0064e-06
GaussianMLPPolicy/LossBefore                        -1.41263e-08
GaussianMLPPolicy/dLoss                              2.99227e-06
Iteration                                          262
MetaTest/Average/AverageDiscountedReturn           -29.7806
MetaTest/Average/AverageReturn                     -29.7806
MetaTest/Average/Iteration                         262
MetaTest/Average/MaxReturn                           8.7188
MetaTest/Average/MinReturn                         -44.046
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.7306
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.7806
MetaTest/__unnamed_task__/AverageReturn            -29.7806
MetaTest/__unnamed_task__/Iteration                262
MetaTest/__unnamed_task__/MaxReturn                  8.7188
MetaTest/__unnamed_task__/MinReturn                -44.046
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.7306
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.416e+06
__unnamed_task__/AverageDiscountedReturn           -15.7717
__unnamed_task__/AverageReturn                     -31.8456
__unnamed_task__/Iteration                         262
__unnamed_task__/MaxReturn                          -7.63414
__unnamed_task__/MinReturn                         -58.8641
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.41271
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 00:54:08 | [maml_trainer] epoch #263 | Sampling for adapation and meta-testing...
2025-04-04 00:55:40 | [maml_trainer] epoch #263 | Finished meta-testing...
2025-04-04 00:55:40 | [maml_trainer] epoch #263 | Saving snapshot...
2025-04-04 00:56:02 | [maml_trainer] epoch #263 | Saved
2025-04-04 00:56:02 | [maml_trainer] epoch #263 | Time 126184.96 s
2025-04-04 00:56:02 | [maml_trainer] epoch #263 | EpochTime 479.18 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.5273
Average/AverageReturn                              -31.4338
Average/Iteration                                  263
Average/MaxReturn                                    2.13765
Average/MinReturn                                  -65.6314
Average/NumEpisodes                                 80
Average/StdReturn                                    9.98225
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.84116
GaussianMLPPolicy/KLAfter                            0.00141651
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.54676e-05
GaussianMLPPolicy/LossBefore                         2.44379e-09
GaussianMLPPolicy/dLoss                              3.547e-05
Iteration                                          263
MetaTest/Average/AverageDiscountedReturn           -31.8475
MetaTest/Average/AverageReturn                     -31.8475
MetaTest/Average/Iteration                         263
MetaTest/Average/MaxReturn                          -5.5256
MetaTest/Average/MinReturn                         -43.5691
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.16203
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.8475
MetaTest/__unnamed_task__/AverageReturn            -31.8475
MetaTest/__unnamed_task__/Iteration                263
MetaTest/__unnamed_task__/MaxReturn                 -5.5256
MetaTest/__unnamed_task__/MinReturn                -43.5691
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.16203
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.448e+06
__unnamed_task__/AverageDiscountedReturn           -15.5273
__unnamed_task__/AverageReturn                     -31.4338
__unnamed_task__/Iteration                         263
__unnamed_task__/MaxReturn                           2.13765
__unnamed_task__/MinReturn                         -65.6314
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.98225
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:02:12 | [maml_trainer] epoch #264 | Sampling for adapation and meta-testing...
2025-04-04 01:03:42 | [maml_trainer] epoch #264 | Finished meta-testing...
2025-04-04 01:03:42 | [maml_trainer] epoch #264 | Saving snapshot...
2025-04-04 01:04:07 | [maml_trainer] epoch #264 | Saved
2025-04-04 01:04:07 | [maml_trainer] epoch #264 | Time 126669.87 s
2025-04-04 01:04:07 | [maml_trainer] epoch #264 | EpochTime 484.91 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.5778
Average/AverageReturn                              -33.7036
Average/Iteration                                  264
Average/MaxReturn                                   -7.18534
Average/MinReturn                                  -55.053
Average/NumEpisodes                                 80
Average/StdReturn                                    8.52942
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83985
GaussianMLPPolicy/KLAfter                            0.00191822
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.14746e-05
GaussianMLPPolicy/LossBefore                         1.23978e-08
GaussianMLPPolicy/dLoss                             -2.14622e-05
Iteration                                          264
MetaTest/Average/AverageDiscountedReturn           -30.8674
MetaTest/Average/AverageReturn                     -30.8674
MetaTest/Average/Iteration                         264
MetaTest/Average/MaxReturn                          -8.52149
MetaTest/Average/MinReturn                         -48.4366
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.18625
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.8674
MetaTest/__unnamed_task__/AverageReturn            -30.8674
MetaTest/__unnamed_task__/Iteration                264
MetaTest/__unnamed_task__/MaxReturn                 -8.52149
MetaTest/__unnamed_task__/MinReturn                -48.4366
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.18625
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.48e+06
__unnamed_task__/AverageDiscountedReturn           -16.5778
__unnamed_task__/AverageReturn                     -33.7036
__unnamed_task__/Iteration                         264
__unnamed_task__/MaxReturn                          -7.18534
__unnamed_task__/MinReturn                         -55.053
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.52942
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:10:11 | [maml_trainer] epoch #265 | Sampling for adapation and meta-testing...
2025-04-04 01:11:42 | [maml_trainer] epoch #265 | Finished meta-testing...
2025-04-04 01:11:42 | [maml_trainer] epoch #265 | Saving snapshot...
2025-04-04 01:12:06 | [maml_trainer] epoch #265 | Saved
2025-04-04 01:12:06 | [maml_trainer] epoch #265 | Time 127148.83 s
2025-04-04 01:12:06 | [maml_trainer] epoch #265 | EpochTime 478.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -16.3526
Average/AverageReturn                              -32.7387
Average/Iteration                                  265
Average/MaxReturn                                    4.29343
Average/MinReturn                                  -55.2064
Average/NumEpisodes                                 80
Average/StdReturn                                    9.26369
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83807
GaussianMLPPolicy/KLAfter                            0.00219037
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00015887
GaussianMLPPolicy/LossBefore                         7.15256e-10
GaussianMLPPolicy/dLoss                             -0.000158869
Iteration                                          265
MetaTest/Average/AverageDiscountedReturn           -28.9252
MetaTest/Average/AverageReturn                     -28.9252
MetaTest/Average/Iteration                         265
MetaTest/Average/MaxReturn                           7.32031
MetaTest/Average/MinReturn                         -43.5228
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.6154
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.9252
MetaTest/__unnamed_task__/AverageReturn            -28.9252
MetaTest/__unnamed_task__/Iteration                265
MetaTest/__unnamed_task__/MaxReturn                  7.32031
MetaTest/__unnamed_task__/MinReturn                -43.5228
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.6154
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.512e+06
__unnamed_task__/AverageDiscountedReturn           -16.3526
__unnamed_task__/AverageReturn                     -32.7387
__unnamed_task__/Iteration                         265
__unnamed_task__/MaxReturn                           4.29343
__unnamed_task__/MinReturn                         -55.2064
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.26369
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:18:13 | [maml_trainer] epoch #266 | Sampling for adapation and meta-testing...
2025-04-04 01:19:45 | [maml_trainer] epoch #266 | Finished meta-testing...
2025-04-04 01:19:45 | [maml_trainer] epoch #266 | Saving snapshot...
2025-04-04 01:20:08 | [maml_trainer] epoch #266 | Saved
2025-04-04 01:20:08 | [maml_trainer] epoch #266 | Time 127630.50 s
2025-04-04 01:20:08 | [maml_trainer] epoch #266 | EpochTime 481.67 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6345
Average/AverageReturn                              -30.9817
Average/Iteration                                  266
Average/MaxReturn                                   -0.693005
Average/MinReturn                                  -45.6915
Average/NumEpisodes                                 80
Average/StdReturn                                    7.84196
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83582
GaussianMLPPolicy/KLAfter                            0.00184901
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000226197
GaussianMLPPolicy/LossBefore                        -3.57628e-09
GaussianMLPPolicy/dLoss                             -0.000226201
Iteration                                          266
MetaTest/Average/AverageDiscountedReturn           -31.5278
MetaTest/Average/AverageReturn                     -31.5278
MetaTest/Average/Iteration                         266
MetaTest/Average/MaxReturn                         -15.1378
MetaTest/Average/MinReturn                         -43.673
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.15347
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.5278
MetaTest/__unnamed_task__/AverageReturn            -31.5278
MetaTest/__unnamed_task__/Iteration                266
MetaTest/__unnamed_task__/MaxReturn                -15.1378
MetaTest/__unnamed_task__/MinReturn                -43.673
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.15347
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.544e+06
__unnamed_task__/AverageDiscountedReturn           -15.6345
__unnamed_task__/AverageReturn                     -30.9817
__unnamed_task__/Iteration                         266
__unnamed_task__/MaxReturn                          -0.693005
__unnamed_task__/MinReturn                         -45.6915
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.84196
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:26:08 | [maml_trainer] epoch #267 | Sampling for adapation and meta-testing...
2025-04-04 01:27:36 | [maml_trainer] epoch #267 | Finished meta-testing...
2025-04-04 01:27:36 | [maml_trainer] epoch #267 | Saving snapshot...
2025-04-04 01:28:00 | [maml_trainer] epoch #267 | Saved
2025-04-04 01:28:00 | [maml_trainer] epoch #267 | Time 128102.10 s
2025-04-04 01:28:00 | [maml_trainer] epoch #267 | EpochTime 471.59 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3586
Average/AverageReturn                              -30.2305
Average/Iteration                                  267
Average/MaxReturn                                   27.2513
Average/MinReturn                                  -48.9457
Average/NumEpisodes                                 80
Average/StdReturn                                   11.9609
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83295
GaussianMLPPolicy/KLAfter                            0.00347683
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.99129e-05
GaussianMLPPolicy/LossBefore                         1.51992e-09
GaussianMLPPolicy/dLoss                             -6.99114e-05
Iteration                                          267
MetaTest/Average/AverageDiscountedReturn           -29.2862
MetaTest/Average/AverageReturn                     -29.2862
MetaTest/Average/Iteration                         267
MetaTest/Average/MaxReturn                         -17.6794
MetaTest/Average/MinReturn                         -42.8663
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.07356
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.2862
MetaTest/__unnamed_task__/AverageReturn            -29.2862
MetaTest/__unnamed_task__/Iteration                267
MetaTest/__unnamed_task__/MaxReturn                -17.6794
MetaTest/__unnamed_task__/MinReturn                -42.8663
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.07356
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.576e+06
__unnamed_task__/AverageDiscountedReturn           -15.3586
__unnamed_task__/AverageReturn                     -30.2305
__unnamed_task__/Iteration                         267
__unnamed_task__/MaxReturn                          27.2513
__unnamed_task__/MinReturn                         -48.9457
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.9609
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:33:46 | [maml_trainer] epoch #268 | Sampling for adapation and meta-testing...
2025-04-04 01:35:11 | [maml_trainer] epoch #268 | Finished meta-testing...
2025-04-04 01:35:11 | [maml_trainer] epoch #268 | Saving snapshot...
2025-04-04 01:35:33 | [maml_trainer] epoch #268 | Saved
2025-04-04 01:35:33 | [maml_trainer] epoch #268 | Time 128555.72 s
2025-04-04 01:35:33 | [maml_trainer] epoch #268 | EpochTime 453.62 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3998
Average/AverageReturn                              -31.1587
Average/Iteration                                  268
Average/MaxReturn                                   -5.12321
Average/MinReturn                                  -52.9689
Average/NumEpisodes                                 80
Average/StdReturn                                    7.76223
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83122
GaussianMLPPolicy/KLAfter                            0.00254264
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000125633
GaussianMLPPolicy/LossBefore                         1.56164e-08
GaussianMLPPolicy/dLoss                              0.000125649
Iteration                                          268
MetaTest/Average/AverageDiscountedReturn           -32.6817
MetaTest/Average/AverageReturn                     -32.6817
MetaTest/Average/Iteration                         268
MetaTest/Average/MaxReturn                         -23.8523
MetaTest/Average/MinReturn                         -41.2305
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.58996
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.6817
MetaTest/__unnamed_task__/AverageReturn            -32.6817
MetaTest/__unnamed_task__/Iteration                268
MetaTest/__unnamed_task__/MaxReturn                -23.8523
MetaTest/__unnamed_task__/MinReturn                -41.2305
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.58996
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.608e+06
__unnamed_task__/AverageDiscountedReturn           -15.3998
__unnamed_task__/AverageReturn                     -31.1587
__unnamed_task__/Iteration                         268
__unnamed_task__/MaxReturn                          -5.12321
__unnamed_task__/MinReturn                         -52.9689
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.76223
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:41:17 | [maml_trainer] epoch #269 | Sampling for adapation and meta-testing...
2025-04-04 01:42:45 | [maml_trainer] epoch #269 | Finished meta-testing...
2025-04-04 01:42:45 | [maml_trainer] epoch #269 | Saving snapshot...
2025-04-04 01:43:07 | [maml_trainer] epoch #269 | Saved
2025-04-04 01:43:07 | [maml_trainer] epoch #269 | Time 129009.68 s
2025-04-04 01:43:07 | [maml_trainer] epoch #269 | EpochTime 453.95 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.401
Average/AverageReturn                              -31.4863
Average/Iteration                                  269
Average/MaxReturn                                    5.65537
Average/MinReturn                                  -51.0605
Average/NumEpisodes                                 80
Average/StdReturn                                    8.9625
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83047
GaussianMLPPolicy/KLAfter                            0.00518084
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000243511
GaussianMLPPolicy/LossBefore                        -7.21216e-09
GaussianMLPPolicy/dLoss                              0.000243504
Iteration                                          269
MetaTest/Average/AverageDiscountedReturn           -31.7856
MetaTest/Average/AverageReturn                     -31.7856
MetaTest/Average/Iteration                         269
MetaTest/Average/MaxReturn                           4.78192
MetaTest/Average/MinReturn                         -54.9269
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.7945
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.7856
MetaTest/__unnamed_task__/AverageReturn            -31.7856
MetaTest/__unnamed_task__/Iteration                269
MetaTest/__unnamed_task__/MaxReturn                  4.78192
MetaTest/__unnamed_task__/MinReturn                -54.9269
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.7945
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.64e+06
__unnamed_task__/AverageDiscountedReturn           -15.401
__unnamed_task__/AverageReturn                     -31.4863
__unnamed_task__/Iteration                         269
__unnamed_task__/MaxReturn                           5.65537
__unnamed_task__/MinReturn                         -51.0605
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.9625
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:48:53 | [maml_trainer] epoch #270 | Sampling for adapation and meta-testing...
2025-04-04 01:50:18 | [maml_trainer] epoch #270 | Finished meta-testing...
2025-04-04 01:50:18 | [maml_trainer] epoch #270 | Saving snapshot...
2025-04-04 01:50:41 | [maml_trainer] epoch #270 | Saved
2025-04-04 01:50:41 | [maml_trainer] epoch #270 | Time 129463.67 s
2025-04-04 01:50:41 | [maml_trainer] epoch #270 | EpochTime 453.99 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.8034
Average/AverageReturn                              -30.1899
Average/Iteration                                  270
Average/MaxReturn                                   17.6971
Average/MinReturn                                  -44.7769
Average/NumEpisodes                                 80
Average/StdReturn                                   10.7066
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83161
GaussianMLPPolicy/KLAfter                            0.00551129
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.49737e-06
GaussianMLPPolicy/LossBefore                         3.47793e-08
GaussianMLPPolicy/dLoss                             -9.46259e-06
Iteration                                          270
MetaTest/Average/AverageDiscountedReturn           -33.459
MetaTest/Average/AverageReturn                     -33.459
MetaTest/Average/Iteration                         270
MetaTest/Average/MaxReturn                         -23.1203
MetaTest/Average/MinReturn                         -45.1979
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.77514
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.459
MetaTest/__unnamed_task__/AverageReturn            -33.459
MetaTest/__unnamed_task__/Iteration                270
MetaTest/__unnamed_task__/MaxReturn                -23.1203
MetaTest/__unnamed_task__/MinReturn                -45.1979
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.77514
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.672e+06
__unnamed_task__/AverageDiscountedReturn           -14.8034
__unnamed_task__/AverageReturn                     -30.1899
__unnamed_task__/Iteration                         270
__unnamed_task__/MaxReturn                          17.6971
__unnamed_task__/MinReturn                         -44.7769
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.7066
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 01:56:32 | [maml_trainer] epoch #271 | Sampling for adapation and meta-testing...
2025-04-04 01:57:58 | [maml_trainer] epoch #271 | Finished meta-testing...
2025-04-04 01:57:58 | [maml_trainer] epoch #271 | Saving snapshot...
2025-04-04 01:58:20 | [maml_trainer] epoch #271 | Saved
2025-04-04 01:58:20 | [maml_trainer] epoch #271 | Time 129922.12 s
2025-04-04 01:58:20 | [maml_trainer] epoch #271 | EpochTime 458.44 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.709
Average/AverageReturn                              -32.3261
Average/Iteration                                  271
Average/MaxReturn                                    0.53047
Average/MinReturn                                  -49.1263
Average/NumEpisodes                                 80
Average/StdReturn                                    8.18668
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83265
GaussianMLPPolicy/KLAfter                            0.00438798
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.58732e-05
GaussianMLPPolicy/LossBefore                        -1.11461e-08
GaussianMLPPolicy/dLoss                              6.58621e-05
Iteration                                          271
MetaTest/Average/AverageDiscountedReturn           -32.2568
MetaTest/Average/AverageReturn                     -32.2568
MetaTest/Average/Iteration                         271
MetaTest/Average/MaxReturn                         -11.6582
MetaTest/Average/MinReturn                         -46.7588
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.08697
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.2568
MetaTest/__unnamed_task__/AverageReturn            -32.2568
MetaTest/__unnamed_task__/Iteration                271
MetaTest/__unnamed_task__/MaxReturn                -11.6582
MetaTest/__unnamed_task__/MinReturn                -46.7588
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.08697
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.704e+06
__unnamed_task__/AverageDiscountedReturn           -15.709
__unnamed_task__/AverageReturn                     -32.3261
__unnamed_task__/Iteration                         271
__unnamed_task__/MaxReturn                           0.53047
__unnamed_task__/MinReturn                         -49.1263
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.18668
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:04:14 | [maml_trainer] epoch #272 | Sampling for adapation and meta-testing...
2025-04-04 02:05:37 | [maml_trainer] epoch #272 | Finished meta-testing...
2025-04-04 02:05:37 | [maml_trainer] epoch #272 | Saving snapshot...
2025-04-04 02:06:01 | [maml_trainer] epoch #272 | Saved
2025-04-04 02:06:01 | [maml_trainer] epoch #272 | Time 130383.01 s
2025-04-04 02:06:01 | [maml_trainer] epoch #272 | EpochTime 460.89 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.8747
Average/AverageReturn                              -30.2588
Average/Iteration                                  272
Average/MaxReturn                                    9.29846
Average/MinReturn                                  -57.3247
Average/NumEpisodes                                 80
Average/StdReturn                                    9.69638
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83257
GaussianMLPPolicy/KLAfter                            0.00416441
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.75368e-05
GaussianMLPPolicy/LossBefore                        -1.11461e-08
GaussianMLPPolicy/dLoss                             -4.75479e-05
Iteration                                          272
MetaTest/Average/AverageDiscountedReturn           -30.4712
MetaTest/Average/AverageReturn                     -30.4712
MetaTest/Average/Iteration                         272
MetaTest/Average/MaxReturn                         -20.1547
MetaTest/Average/MinReturn                         -44.3867
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.28266
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.4712
MetaTest/__unnamed_task__/AverageReturn            -30.4712
MetaTest/__unnamed_task__/Iteration                272
MetaTest/__unnamed_task__/MaxReturn                -20.1547
MetaTest/__unnamed_task__/MinReturn                -44.3867
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.28266
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.736e+06
__unnamed_task__/AverageDiscountedReturn           -14.8747
__unnamed_task__/AverageReturn                     -30.2588
__unnamed_task__/Iteration                         272
__unnamed_task__/MaxReturn                           9.29846
__unnamed_task__/MinReturn                         -57.3247
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.69638
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:11:38 | [maml_trainer] epoch #273 | Sampling for adapation and meta-testing...
2025-04-04 02:13:05 | [maml_trainer] epoch #273 | Finished meta-testing...
2025-04-04 02:13:05 | [maml_trainer] epoch #273 | Saving snapshot...
2025-04-04 02:13:28 | [maml_trainer] epoch #273 | Saved
2025-04-04 02:13:28 | [maml_trainer] epoch #273 | Time 130830.18 s
2025-04-04 02:13:28 | [maml_trainer] epoch #273 | EpochTime 447.16 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3813
Average/AverageReturn                              -32.0102
Average/Iteration                                  273
Average/MaxReturn                                  -14.4238
Average/MinReturn                                  -54.2858
Average/NumEpisodes                                 80
Average/StdReturn                                    7.82044
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83259
GaussianMLPPolicy/KLAfter                            0.00384715
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.40257e-06
GaussianMLPPolicy/LossBefore                         1.4782e-08
GaussianMLPPolicy/dLoss                              5.41735e-06
Iteration                                          273
MetaTest/Average/AverageDiscountedReturn           -31.9069
MetaTest/Average/AverageReturn                     -31.9069
MetaTest/Average/Iteration                         273
MetaTest/Average/MaxReturn                         -19.9663
MetaTest/Average/MinReturn                         -44.7171
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.08976
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.9069
MetaTest/__unnamed_task__/AverageReturn            -31.9069
MetaTest/__unnamed_task__/Iteration                273
MetaTest/__unnamed_task__/MaxReturn                -19.9663
MetaTest/__unnamed_task__/MinReturn                -44.7171
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.08976
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.768e+06
__unnamed_task__/AverageDiscountedReturn           -15.3813
__unnamed_task__/AverageReturn                     -32.0102
__unnamed_task__/Iteration                         273
__unnamed_task__/MaxReturn                         -14.4238
__unnamed_task__/MinReturn                         -54.2858
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.82044
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:19:18 | [maml_trainer] epoch #274 | Sampling for adapation and meta-testing...
2025-04-04 02:20:44 | [maml_trainer] epoch #274 | Finished meta-testing...
2025-04-04 02:20:44 | [maml_trainer] epoch #274 | Saving snapshot...
2025-04-04 02:21:05 | [maml_trainer] epoch #274 | Saved
2025-04-04 02:21:05 | [maml_trainer] epoch #274 | Time 131287.79 s
2025-04-04 02:21:05 | [maml_trainer] epoch #274 | EpochTime 457.61 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3486
Average/AverageReturn                              -32.1291
Average/Iteration                                  274
Average/MaxReturn                                    0.431649
Average/MinReturn                                  -63.0275
Average/NumEpisodes                                 80
Average/StdReturn                                   10.6343
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83446
GaussianMLPPolicy/KLAfter                            0.00445865
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.36098e-05
GaussianMLPPolicy/LossBefore                         2.05636e-08
GaussianMLPPolicy/dLoss                             -6.35892e-05
Iteration                                          274
MetaTest/Average/AverageDiscountedReturn           -35.8173
MetaTest/Average/AverageReturn                     -35.8173
MetaTest/Average/Iteration                         274
MetaTest/Average/MaxReturn                         -23.2747
MetaTest/Average/MinReturn                         -60.6084
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.5187
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.8173
MetaTest/__unnamed_task__/AverageReturn            -35.8173
MetaTest/__unnamed_task__/Iteration                274
MetaTest/__unnamed_task__/MaxReturn                -23.2747
MetaTest/__unnamed_task__/MinReturn                -60.6084
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.5187
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.8e+06
__unnamed_task__/AverageDiscountedReturn           -15.3486
__unnamed_task__/AverageReturn                     -32.1291
__unnamed_task__/Iteration                         274
__unnamed_task__/MaxReturn                           0.431649
__unnamed_task__/MinReturn                         -63.0275
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.6343
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:26:48 | [maml_trainer] epoch #275 | Sampling for adapation and meta-testing...
2025-04-04 02:28:16 | [maml_trainer] epoch #275 | Finished meta-testing...
2025-04-04 02:28:16 | [maml_trainer] epoch #275 | Saving snapshot...
2025-04-04 02:28:38 | [maml_trainer] epoch #275 | Saved
2025-04-04 02:28:38 | [maml_trainer] epoch #275 | Time 131740.96 s
2025-04-04 02:28:38 | [maml_trainer] epoch #275 | EpochTime 453.16 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.6162
Average/AverageReturn                              -30.47
Average/Iteration                                  275
Average/MaxReturn                                   -0.13661
Average/MinReturn                                  -62.7281
Average/NumEpisodes                                 80
Average/StdReturn                                    9.94243
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83564
GaussianMLPPolicy/KLAfter                            0.00298466
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000169791
GaussianMLPPolicy/LossBefore                        -5.78165e-09
GaussianMLPPolicy/dLoss                             -0.000169796
Iteration                                          275
MetaTest/Average/AverageDiscountedReturn           -35.7838
MetaTest/Average/AverageReturn                     -35.7838
MetaTest/Average/Iteration                         275
MetaTest/Average/MaxReturn                         -13.4004
MetaTest/Average/MinReturn                         -59.4059
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.4533
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.7838
MetaTest/__unnamed_task__/AverageReturn            -35.7838
MetaTest/__unnamed_task__/Iteration                275
MetaTest/__unnamed_task__/MaxReturn                -13.4004
MetaTest/__unnamed_task__/MinReturn                -59.4059
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.4533
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.832e+06
__unnamed_task__/AverageDiscountedReturn           -14.6162
__unnamed_task__/AverageReturn                     -30.47
__unnamed_task__/Iteration                         275
__unnamed_task__/MaxReturn                          -0.13661
__unnamed_task__/MinReturn                         -62.7281
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.94243
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:34:24 | [maml_trainer] epoch #276 | Sampling for adapation and meta-testing...
2025-04-04 02:35:49 | [maml_trainer] epoch #276 | Finished meta-testing...
2025-04-04 02:35:49 | [maml_trainer] epoch #276 | Saving snapshot...
2025-04-04 02:36:12 | [maml_trainer] epoch #276 | Saved
2025-04-04 02:36:12 | [maml_trainer] epoch #276 | Time 132194.12 s
2025-04-04 02:36:12 | [maml_trainer] epoch #276 | EpochTime 453.16 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.354
Average/AverageReturn                              -32.0651
Average/Iteration                                  276
Average/MaxReturn                                    4.74467
Average/MinReturn                                  -60.4305
Average/NumEpisodes                                 80
Average/StdReturn                                   11.8145
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83575
GaussianMLPPolicy/KLAfter                            0.00158171
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000106035
GaussianMLPPolicy/LossBefore                        -1.01328e-09
GaussianMLPPolicy/dLoss                             -0.000106036
Iteration                                          276
MetaTest/Average/AverageDiscountedReturn           -34.3669
MetaTest/Average/AverageReturn                     -34.3669
MetaTest/Average/Iteration                         276
MetaTest/Average/MaxReturn                         -22.9739
MetaTest/Average/MinReturn                         -47.9789
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.81493
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.3669
MetaTest/__unnamed_task__/AverageReturn            -34.3669
MetaTest/__unnamed_task__/Iteration                276
MetaTest/__unnamed_task__/MaxReturn                -22.9739
MetaTest/__unnamed_task__/MinReturn                -47.9789
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.81493
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.864e+06
__unnamed_task__/AverageDiscountedReturn           -15.354
__unnamed_task__/AverageReturn                     -32.0651
__unnamed_task__/Iteration                         276
__unnamed_task__/MaxReturn                           4.74467
__unnamed_task__/MinReturn                         -60.4305
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.8145
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:41:56 | [maml_trainer] epoch #277 | Sampling for adapation and meta-testing...
2025-04-04 02:43:22 | [maml_trainer] epoch #277 | Finished meta-testing...
2025-04-04 02:43:22 | [maml_trainer] epoch #277 | Saving snapshot...
2025-04-04 02:43:43 | [maml_trainer] epoch #277 | Saved
2025-04-04 02:43:43 | [maml_trainer] epoch #277 | Time 132645.65 s
2025-04-04 02:43:43 | [maml_trainer] epoch #277 | EpochTime 451.53 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4272
Average/AverageReturn                              -32.6619
Average/Iteration                                  277
Average/MaxReturn                                    8.06306
Average/MinReturn                                  -62.0861
Average/NumEpisodes                                 80
Average/StdReturn                                   13.0528
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83591
GaussianMLPPolicy/KLAfter                            0.00122189
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -1.75235e-06
GaussianMLPPolicy/LossBefore                        -1.61231e-08
GaussianMLPPolicy/dLoss                              1.73622e-06
Iteration                                          277
MetaTest/Average/AverageDiscountedReturn           -34.0253
MetaTest/Average/AverageReturn                     -34.0253
MetaTest/Average/Iteration                         277
MetaTest/Average/MaxReturn                         -22.9949
MetaTest/Average/MinReturn                         -42.5606
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.80059
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -34.0253
MetaTest/__unnamed_task__/AverageReturn            -34.0253
MetaTest/__unnamed_task__/Iteration                277
MetaTest/__unnamed_task__/MaxReturn                -22.9949
MetaTest/__unnamed_task__/MinReturn                -42.5606
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.80059
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.896e+06
__unnamed_task__/AverageDiscountedReturn           -15.4272
__unnamed_task__/AverageReturn                     -32.6619
__unnamed_task__/Iteration                         277
__unnamed_task__/MaxReturn                           8.06306
__unnamed_task__/MinReturn                         -62.0861
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          13.0528
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:49:27 | [maml_trainer] epoch #278 | Sampling for adapation and meta-testing...
2025-04-04 02:50:54 | [maml_trainer] epoch #278 | Finished meta-testing...
2025-04-04 02:50:54 | [maml_trainer] epoch #278 | Saving snapshot...
2025-04-04 02:51:18 | [maml_trainer] epoch #278 | Saved
2025-04-04 02:51:18 | [maml_trainer] epoch #278 | Time 133100.07 s
2025-04-04 02:51:18 | [maml_trainer] epoch #278 | EpochTime 454.42 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.8637
Average/AverageReturn                              -32.4269
Average/Iteration                                  278
Average/MaxReturn                                   -1.82316
Average/MinReturn                                  -59.8552
Average/NumEpisodes                                 80
Average/StdReturn                                   11.383
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83559
GaussianMLPPolicy/KLAfter                            0.00160437
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          6.11494e-05
GaussianMLPPolicy/LossBefore                        -1.00136e-08
GaussianMLPPolicy/dLoss                             -6.11594e-05
Iteration                                          278
MetaTest/Average/AverageDiscountedReturn           -30.6894
MetaTest/Average/AverageReturn                     -30.6894
MetaTest/Average/Iteration                         278
MetaTest/Average/MaxReturn                         -10.0498
MetaTest/Average/MinReturn                         -59.2179
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.05263
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.6894
MetaTest/__unnamed_task__/AverageReturn            -30.6894
MetaTest/__unnamed_task__/Iteration                278
MetaTest/__unnamed_task__/MaxReturn                -10.0498
MetaTest/__unnamed_task__/MinReturn                -59.2179
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.05263
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.928e+06
__unnamed_task__/AverageDiscountedReturn           -15.8637
__unnamed_task__/AverageReturn                     -32.4269
__unnamed_task__/Iteration                         278
__unnamed_task__/MaxReturn                          -1.82316
__unnamed_task__/MinReturn                         -59.8552
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.383
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 02:57:04 | [maml_trainer] epoch #279 | Sampling for adapation and meta-testing...
2025-04-04 02:58:29 | [maml_trainer] epoch #279 | Finished meta-testing...
2025-04-04 02:58:29 | [maml_trainer] epoch #279 | Saving snapshot...
2025-04-04 02:58:52 | [maml_trainer] epoch #279 | Saved
2025-04-04 02:58:52 | [maml_trainer] epoch #279 | Time 133554.68 s
2025-04-04 02:58:52 | [maml_trainer] epoch #279 | EpochTime 454.61 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.1383
Average/AverageReturn                              -31.1418
Average/Iteration                                  279
Average/MaxReturn                                   10.2481
Average/MinReturn                                  -59.4906
Average/NumEpisodes                                 80
Average/StdReturn                                   10.4565
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83564
GaussianMLPPolicy/KLAfter                            0.00161106
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.19419e-05
GaussianMLPPolicy/LossBefore                         3.20077e-08
GaussianMLPPolicy/dLoss                             -2.19099e-05
Iteration                                          279
MetaTest/Average/AverageDiscountedReturn           -31.5589
MetaTest/Average/AverageReturn                     -31.5589
MetaTest/Average/Iteration                         279
MetaTest/Average/MaxReturn                          -8.21881
MetaTest/Average/MinReturn                         -54.2416
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           9.59297
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -31.5589
MetaTest/__unnamed_task__/AverageReturn            -31.5589
MetaTest/__unnamed_task__/Iteration                279
MetaTest/__unnamed_task__/MaxReturn                 -8.21881
MetaTest/__unnamed_task__/MinReturn                -54.2416
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  9.59297
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.96e+06
__unnamed_task__/AverageDiscountedReturn           -15.1383
__unnamed_task__/AverageReturn                     -31.1418
__unnamed_task__/Iteration                         279
__unnamed_task__/MaxReturn                          10.2481
__unnamed_task__/MinReturn                         -59.4906
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.4565
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:04:39 | [maml_trainer] epoch #280 | Sampling for adapation and meta-testing...
2025-04-04 03:06:05 | [maml_trainer] epoch #280 | Finished meta-testing...
2025-04-04 03:06:05 | [maml_trainer] epoch #280 | Saving snapshot...
2025-04-04 03:06:26 | [maml_trainer] epoch #280 | Saved
2025-04-04 03:06:26 | [maml_trainer] epoch #280 | Time 134008.55 s
2025-04-04 03:06:26 | [maml_trainer] epoch #280 | EpochTime 453.86 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.0409
Average/AverageReturn                              -30.9891
Average/Iteration                                  280
Average/MaxReturn                                   -1.52524
Average/MinReturn                                  -48.4797
Average/NumEpisodes                                 80
Average/StdReturn                                    7.95249
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83554
GaussianMLPPolicy/KLAfter                            0.00202826
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -6.18249e-06
GaussianMLPPolicy/LossBefore                        -4.17232e-10
GaussianMLPPolicy/dLoss                              6.18207e-06
Iteration                                          280
MetaTest/Average/AverageDiscountedReturn           -35.8646
MetaTest/Average/AverageReturn                     -35.8646
MetaTest/Average/Iteration                         280
MetaTest/Average/MaxReturn                         -19.3001
MetaTest/Average/MinReturn                         -50.0103
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.158
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -35.8646
MetaTest/__unnamed_task__/AverageReturn            -35.8646
MetaTest/__unnamed_task__/Iteration                280
MetaTest/__unnamed_task__/MaxReturn                -19.3001
MetaTest/__unnamed_task__/MinReturn                -50.0103
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.158
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        8.992e+06
__unnamed_task__/AverageDiscountedReturn           -15.0409
__unnamed_task__/AverageReturn                     -30.9891
__unnamed_task__/Iteration                         280
__unnamed_task__/MaxReturn                          -1.52524
__unnamed_task__/MinReturn                         -48.4797
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.95249
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:12:09 | [maml_trainer] epoch #281 | Sampling for adapation and meta-testing...
2025-04-04 03:13:34 | [maml_trainer] epoch #281 | Finished meta-testing...
2025-04-04 03:13:34 | [maml_trainer] epoch #281 | Saving snapshot...
2025-04-04 03:13:56 | [maml_trainer] epoch #281 | Saved
2025-04-04 03:13:56 | [maml_trainer] epoch #281 | Time 134458.82 s
2025-04-04 03:13:56 | [maml_trainer] epoch #281 | EpochTime 450.27 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.5613
Average/AverageReturn                              -32.5773
Average/Iteration                                  281
Average/MaxReturn                                   -6.70908
Average/MinReturn                                  -63.7004
Average/NumEpisodes                                 80
Average/StdReturn                                    9.56076
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83415
GaussianMLPPolicy/KLAfter                            0.00254492
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000106015
GaussianMLPPolicy/LossBefore                         1.61529e-08
GaussianMLPPolicy/dLoss                              0.000106031
Iteration                                          281
MetaTest/Average/AverageDiscountedReturn           -30.3855
MetaTest/Average/AverageReturn                     -30.3855
MetaTest/Average/Iteration                         281
MetaTest/Average/MaxReturn                         -12.1055
MetaTest/Average/MinReturn                         -40.2801
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.81792
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.3855
MetaTest/__unnamed_task__/AverageReturn            -30.3855
MetaTest/__unnamed_task__/Iteration                281
MetaTest/__unnamed_task__/MaxReturn                -12.1055
MetaTest/__unnamed_task__/MinReturn                -40.2801
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.81792
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.024e+06
__unnamed_task__/AverageDiscountedReturn           -15.5613
__unnamed_task__/AverageReturn                     -32.5773
__unnamed_task__/Iteration                         281
__unnamed_task__/MaxReturn                          -6.70908
__unnamed_task__/MinReturn                         -63.7004
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.56076
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:19:36 | [maml_trainer] epoch #282 | Sampling for adapation and meta-testing...
2025-04-04 03:21:02 | [maml_trainer] epoch #282 | Finished meta-testing...
2025-04-04 03:21:02 | [maml_trainer] epoch #282 | Saving snapshot...
2025-04-04 03:21:24 | [maml_trainer] epoch #282 | Saved
2025-04-04 03:21:24 | [maml_trainer] epoch #282 | Time 134906.53 s
2025-04-04 03:21:24 | [maml_trainer] epoch #282 | EpochTime 447.71 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3937
Average/AverageReturn                              -30.7175
Average/Iteration                                  282
Average/MaxReturn                                   28.3031
Average/MinReturn                                  -48.3517
Average/NumEpisodes                                 80
Average/StdReturn                                   11.6909
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.83255
GaussianMLPPolicy/KLAfter                            0.00309119
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          4.42219e-05
GaussianMLPPolicy/LossBefore                         1.12057e-08
GaussianMLPPolicy/dLoss                             -4.42107e-05
Iteration                                          282
MetaTest/Average/AverageDiscountedReturn           -33.0147
MetaTest/Average/AverageReturn                     -33.0147
MetaTest/Average/Iteration                         282
MetaTest/Average/MaxReturn                         -20.3397
MetaTest/Average/MinReturn                         -47.6009
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.94803
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -33.0147
MetaTest/__unnamed_task__/AverageReturn            -33.0147
MetaTest/__unnamed_task__/Iteration                282
MetaTest/__unnamed_task__/MaxReturn                -20.3397
MetaTest/__unnamed_task__/MinReturn                -47.6009
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.94803
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.056e+06
__unnamed_task__/AverageDiscountedReturn           -15.3937
__unnamed_task__/AverageReturn                     -30.7175
__unnamed_task__/Iteration                         282
__unnamed_task__/MaxReturn                          28.3031
__unnamed_task__/MinReturn                         -48.3517
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.6909
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:27:07 | [maml_trainer] epoch #283 | Sampling for adapation and meta-testing...
2025-04-04 03:28:32 | [maml_trainer] epoch #283 | Finished meta-testing...
2025-04-04 03:28:32 | [maml_trainer] epoch #283 | Saving snapshot...
2025-04-04 03:28:54 | [maml_trainer] epoch #283 | Saved
2025-04-04 03:28:54 | [maml_trainer] epoch #283 | Time 135356.54 s
2025-04-04 03:28:54 | [maml_trainer] epoch #283 | EpochTime 450.00 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.5575
Average/AverageReturn                              -29.1777
Average/Iteration                                  283
Average/MaxReturn                                   21.0306
Average/MinReturn                                  -46.9902
Average/NumEpisodes                                 80
Average/StdReturn                                   11.2313
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.8302
GaussianMLPPolicy/KLAfter                            0.00397535
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          9.06307e-06
GaussianMLPPolicy/LossBefore                         6.13928e-09
GaussianMLPPolicy/dLoss                             -9.05693e-06
Iteration                                          283
MetaTest/Average/AverageDiscountedReturn           -30.0073
MetaTest/Average/AverageReturn                     -30.0073
MetaTest/Average/Iteration                         283
MetaTest/Average/MaxReturn                          -4.66376
MetaTest/Average/MinReturn                         -42.08
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.2191
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.0073
MetaTest/__unnamed_task__/AverageReturn            -30.0073
MetaTest/__unnamed_task__/Iteration                283
MetaTest/__unnamed_task__/MaxReturn                 -4.66376
MetaTest/__unnamed_task__/MinReturn                -42.08
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.2191
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.088e+06
__unnamed_task__/AverageDiscountedReturn           -14.5575
__unnamed_task__/AverageReturn                     -29.1777
__unnamed_task__/Iteration                         283
__unnamed_task__/MaxReturn                          21.0306
__unnamed_task__/MinReturn                         -46.9902
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.2313
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:34:38 | [maml_trainer] epoch #284 | Sampling for adapation and meta-testing...
2025-04-04 03:36:01 | [maml_trainer] epoch #284 | Finished meta-testing...
2025-04-04 03:36:01 | [maml_trainer] epoch #284 | Saving snapshot...
2025-04-04 03:36:24 | [maml_trainer] epoch #284 | Saved
2025-04-04 03:36:25 | [maml_trainer] epoch #284 | Time 135806.98 s
2025-04-04 03:36:25 | [maml_trainer] epoch #284 | EpochTime 450.44 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.272
Average/AverageReturn                              -30.583
Average/Iteration                                  284
Average/MaxReturn                                   -8.35786
Average/MinReturn                                  -53.6617
Average/NumEpisodes                                 80
Average/StdReturn                                    7.59319
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82879
GaussianMLPPolicy/KLAfter                            0.00526852
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -9.44374e-05
GaussianMLPPolicy/LossBefore                         2.63453e-08
GaussianMLPPolicy/dLoss                              9.44638e-05
Iteration                                          284
MetaTest/Average/AverageDiscountedReturn           -26.6958
MetaTest/Average/AverageReturn                     -26.6958
MetaTest/Average/Iteration                         284
MetaTest/Average/MaxReturn                           3.01377
MetaTest/Average/MinReturn                         -45.9007
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          12.9873
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -26.6958
MetaTest/__unnamed_task__/AverageReturn            -26.6958
MetaTest/__unnamed_task__/Iteration                284
MetaTest/__unnamed_task__/MaxReturn                  3.01377
MetaTest/__unnamed_task__/MinReturn                -45.9007
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 12.9873
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.12e+06
__unnamed_task__/AverageDiscountedReturn           -15.272
__unnamed_task__/AverageReturn                     -30.583
__unnamed_task__/Iteration                         284
__unnamed_task__/MaxReturn                          -8.35786
__unnamed_task__/MinReturn                         -53.6617
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.59319
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:42:03 | [maml_trainer] epoch #285 | Sampling for adapation and meta-testing...
2025-04-04 03:43:29 | [maml_trainer] epoch #285 | Finished meta-testing...
2025-04-04 03:43:29 | [maml_trainer] epoch #285 | Saving snapshot...
2025-04-04 03:43:52 | [maml_trainer] epoch #285 | Saved
2025-04-04 03:43:52 | [maml_trainer] epoch #285 | Time 136254.65 s
2025-04-04 03:43:52 | [maml_trainer] epoch #285 | EpochTime 447.66 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.3914
Average/AverageReturn                              -27.9103
Average/Iteration                                  285
Average/MaxReturn                                   14.4876
Average/MinReturn                                  -48.7384
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1852
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82815
GaussianMLPPolicy/KLAfter                            0.00574501
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.75908e-05
GaussianMLPPolicy/LossBefore                         1.17421e-08
GaussianMLPPolicy/dLoss                              7.76025e-05
Iteration                                          285
MetaTest/Average/AverageDiscountedReturn           -30.4515
MetaTest/Average/AverageReturn                     -30.4515
MetaTest/Average/Iteration                         285
MetaTest/Average/MaxReturn                         -14.3683
MetaTest/Average/MinReturn                         -42.5816
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.2499
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.4515
MetaTest/__unnamed_task__/AverageReturn            -30.4515
MetaTest/__unnamed_task__/Iteration                285
MetaTest/__unnamed_task__/MaxReturn                -14.3683
MetaTest/__unnamed_task__/MinReturn                -42.5816
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.2499
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.152e+06
__unnamed_task__/AverageDiscountedReturn           -14.3914
__unnamed_task__/AverageReturn                     -27.9103
__unnamed_task__/Iteration                         285
__unnamed_task__/MaxReturn                          14.4876
__unnamed_task__/MinReturn                         -48.7384
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1852
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:49:37 | [maml_trainer] epoch #286 | Sampling for adapation and meta-testing...
2025-04-04 03:51:03 | [maml_trainer] epoch #286 | Finished meta-testing...
2025-04-04 03:51:03 | [maml_trainer] epoch #286 | Saving snapshot...
2025-04-04 03:51:25 | [maml_trainer] epoch #286 | Saved
2025-04-04 03:51:25 | [maml_trainer] epoch #286 | Time 136707.45 s
2025-04-04 03:51:25 | [maml_trainer] epoch #286 | EpochTime 452.80 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.0582
Average/AverageReturn                              -28.6619
Average/Iteration                                  286
Average/MaxReturn                                   18.4117
Average/MinReturn                                  -46.9877
Average/NumEpisodes                                 80
Average/StdReturn                                    9.5765
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82789
GaussianMLPPolicy/KLAfter                            0.00518873
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.00036918
GaussianMLPPolicy/LossBefore                         1.96695e-09
GaussianMLPPolicy/dLoss                             -0.000369178
Iteration                                          286
MetaTest/Average/AverageDiscountedReturn           -28.1758
MetaTest/Average/AverageReturn                     -28.1758
MetaTest/Average/Iteration                         286
MetaTest/Average/MaxReturn                         -20.1646
MetaTest/Average/MinReturn                         -42.0494
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.74727
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.1758
MetaTest/__unnamed_task__/AverageReturn            -28.1758
MetaTest/__unnamed_task__/Iteration                286
MetaTest/__unnamed_task__/MaxReturn                -20.1646
MetaTest/__unnamed_task__/MinReturn                -42.0494
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.74727
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.184e+06
__unnamed_task__/AverageDiscountedReturn           -15.0582
__unnamed_task__/AverageReturn                     -28.6619
__unnamed_task__/Iteration                         286
__unnamed_task__/MaxReturn                          18.4117
__unnamed_task__/MinReturn                         -46.9877
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.5765
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 03:57:08 | [maml_trainer] epoch #287 | Sampling for adapation and meta-testing...
2025-04-04 03:58:35 | [maml_trainer] epoch #287 | Finished meta-testing...
2025-04-04 03:58:35 | [maml_trainer] epoch #287 | Saving snapshot...
2025-04-04 03:58:58 | [maml_trainer] epoch #287 | Saved
2025-04-04 03:58:58 | [maml_trainer] epoch #287 | Time 137160.39 s
2025-04-04 03:58:58 | [maml_trainer] epoch #287 | EpochTime 452.93 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.2182
Average/AverageReturn                              -28.6811
Average/Iteration                                  287
Average/MaxReturn                                    9.37092
Average/MinReturn                                  -57.7594
Average/NumEpisodes                                 80
Average/StdReturn                                    9.59552
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82797
GaussianMLPPolicy/KLAfter                            0.00450477
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.30803e-05
GaussianMLPPolicy/LossBefore                         2.49147e-08
GaussianMLPPolicy/dLoss                             -5.30554e-05
Iteration                                          287
MetaTest/Average/AverageDiscountedReturn           -29.4894
MetaTest/Average/AverageReturn                     -29.4894
MetaTest/Average/Iteration                         287
MetaTest/Average/MaxReturn                         -10.6568
MetaTest/Average/MinReturn                         -44.0586
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.75984
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.4894
MetaTest/__unnamed_task__/AverageReturn            -29.4894
MetaTest/__unnamed_task__/Iteration                287
MetaTest/__unnamed_task__/MaxReturn                -10.6568
MetaTest/__unnamed_task__/MinReturn                -44.0586
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.75984
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.216e+06
__unnamed_task__/AverageDiscountedReturn           -15.2182
__unnamed_task__/AverageReturn                     -28.6811
__unnamed_task__/Iteration                         287
__unnamed_task__/MaxReturn                           9.37092
__unnamed_task__/MinReturn                         -57.7594
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.59552
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:04:40 | [maml_trainer] epoch #288 | Sampling for adapation and meta-testing...
2025-04-04 04:06:06 | [maml_trainer] epoch #288 | Finished meta-testing...
2025-04-04 04:06:06 | [maml_trainer] epoch #288 | Saving snapshot...
2025-04-04 04:06:29 | [maml_trainer] epoch #288 | Saved
2025-04-04 04:06:29 | [maml_trainer] epoch #288 | Time 137611.17 s
2025-04-04 04:06:29 | [maml_trainer] epoch #288 | EpochTime 450.78 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4786
Average/AverageReturn                              -28.854
Average/Iteration                                  288
Average/MaxReturn                                   21.9789
Average/MinReturn                                  -57.5887
Average/NumEpisodes                                 80
Average/StdReturn                                   11.0519
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82853
GaussianMLPPolicy/KLAfter                            0.00356446
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          2.7938e-05
GaussianMLPPolicy/LossBefore                         4.14252e-09
GaussianMLPPolicy/dLoss                             -2.79338e-05
Iteration                                          288
MetaTest/Average/AverageDiscountedReturn           -30.7842
MetaTest/Average/AverageReturn                     -30.7842
MetaTest/Average/Iteration                         288
MetaTest/Average/MaxReturn                         -11.0571
MetaTest/Average/MinReturn                         -43.8004
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.96351
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.7842
MetaTest/__unnamed_task__/AverageReturn            -30.7842
MetaTest/__unnamed_task__/Iteration                288
MetaTest/__unnamed_task__/MaxReturn                -11.0571
MetaTest/__unnamed_task__/MinReturn                -43.8004
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.96351
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.248e+06
__unnamed_task__/AverageDiscountedReturn           -15.4786
__unnamed_task__/AverageReturn                     -28.854
__unnamed_task__/Iteration                         288
__unnamed_task__/MaxReturn                          21.9789
__unnamed_task__/MinReturn                         -57.5887
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.0519
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:12:11 | [maml_trainer] epoch #289 | Sampling for adapation and meta-testing...
2025-04-04 04:13:38 | [maml_trainer] epoch #289 | Finished meta-testing...
2025-04-04 04:13:38 | [maml_trainer] epoch #289 | Saving snapshot...
2025-04-04 04:14:00 | [maml_trainer] epoch #289 | Saved
2025-04-04 04:14:00 | [maml_trainer] epoch #289 | Time 138062.03 s
2025-04-04 04:14:00 | [maml_trainer] epoch #289 | EpochTime 450.86 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.1776
Average/AverageReturn                              -29.4566
Average/Iteration                                  289
Average/MaxReturn                                    5.6211
Average/MinReturn                                  -51.8253
Average/NumEpisodes                                 80
Average/StdReturn                                    9.43052
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82829
GaussianMLPPolicy/KLAfter                            0.00207213
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -3.84434e-05
GaussianMLPPolicy/LossBefore                         2.86102e-09
GaussianMLPPolicy/dLoss                              3.84462e-05
Iteration                                          289
MetaTest/Average/AverageDiscountedReturn           -29.684
MetaTest/Average/AverageReturn                     -29.684
MetaTest/Average/Iteration                         289
MetaTest/Average/MaxReturn                         -16.8085
MetaTest/Average/MinReturn                         -44.3896
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.81489
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.684
MetaTest/__unnamed_task__/AverageReturn            -29.684
MetaTest/__unnamed_task__/Iteration                289
MetaTest/__unnamed_task__/MaxReturn                -16.8085
MetaTest/__unnamed_task__/MinReturn                -44.3896
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.81489
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.28e+06
__unnamed_task__/AverageDiscountedReturn           -15.1776
__unnamed_task__/AverageReturn                     -29.4566
__unnamed_task__/Iteration                         289
__unnamed_task__/MaxReturn                           5.6211
__unnamed_task__/MinReturn                         -51.8253
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           9.43052
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:19:42 | [maml_trainer] epoch #290 | Sampling for adapation and meta-testing...
2025-04-04 04:21:07 | [maml_trainer] epoch #290 | Finished meta-testing...
2025-04-04 04:21:07 | [maml_trainer] epoch #290 | Saving snapshot...
2025-04-04 04:21:31 | [maml_trainer] epoch #290 | Saved
2025-04-04 04:21:31 | [maml_trainer] epoch #290 | Time 138513.49 s
2025-04-04 04:21:31 | [maml_trainer] epoch #290 | EpochTime 451.45 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.4492
Average/AverageReturn                              -29.7401
Average/Iteration                                  290
Average/MaxReturn                                   36.5495
Average/MinReturn                                  -58.2966
Average/NumEpisodes                                 80
Average/StdReturn                                   11.0365
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82765
GaussianMLPPolicy/KLAfter                            0.00220515
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -7.92155e-05
GaussianMLPPolicy/LossBefore                         1.90437e-08
GaussianMLPPolicy/dLoss                              7.92346e-05
Iteration                                          290
MetaTest/Average/AverageDiscountedReturn           -28.5457
MetaTest/Average/AverageReturn                     -28.5457
MetaTest/Average/Iteration                         290
MetaTest/Average/MaxReturn                          -1.5771
MetaTest/Average/MinReturn                         -46.2672
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.3177
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.5457
MetaTest/__unnamed_task__/AverageReturn            -28.5457
MetaTest/__unnamed_task__/Iteration                290
MetaTest/__unnamed_task__/MaxReturn                 -1.5771
MetaTest/__unnamed_task__/MinReturn                -46.2672
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.3177
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.312e+06
__unnamed_task__/AverageDiscountedReturn           -15.4492
__unnamed_task__/AverageReturn                     -29.7401
__unnamed_task__/Iteration                         290
__unnamed_task__/MaxReturn                          36.5495
__unnamed_task__/MinReturn                         -58.2966
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          11.0365
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:27:15 | [maml_trainer] epoch #291 | Sampling for adapation and meta-testing...
2025-04-04 04:28:42 | [maml_trainer] epoch #291 | Finished meta-testing...
2025-04-04 04:28:42 | [maml_trainer] epoch #291 | Saving snapshot...
2025-04-04 04:29:05 | [maml_trainer] epoch #291 | Saved
2025-04-04 04:29:05 | [maml_trainer] epoch #291 | Time 138967.23 s
2025-04-04 04:29:05 | [maml_trainer] epoch #291 | EpochTime 453.74 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.7021
Average/AverageReturn                              -28.4563
Average/Iteration                                  291
Average/MaxReturn                                   19.7575
Average/MinReturn                                  -55.3864
Average/NumEpisodes                                 80
Average/StdReturn                                   10.8282
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82585
GaussianMLPPolicy/KLAfter                            0.00206384
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.11254e-05
GaussianMLPPolicy/LossBefore                        -1.03116e-08
GaussianMLPPolicy/dLoss                              2.11151e-05
Iteration                                          291
MetaTest/Average/AverageDiscountedReturn           -29.1093
MetaTest/Average/AverageReturn                     -29.1093
MetaTest/Average/Iteration                         291
MetaTest/Average/MaxReturn                         -10.6101
MetaTest/Average/MinReturn                         -39.5562
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           6.96817
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.1093
MetaTest/__unnamed_task__/AverageReturn            -29.1093
MetaTest/__unnamed_task__/Iteration                291
MetaTest/__unnamed_task__/MaxReturn                -10.6101
MetaTest/__unnamed_task__/MinReturn                -39.5562
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  6.96817
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.344e+06
__unnamed_task__/AverageDiscountedReturn           -14.7021
__unnamed_task__/AverageReturn                     -28.4563
__unnamed_task__/Iteration                         291
__unnamed_task__/MaxReturn                          19.7575
__unnamed_task__/MinReturn                         -55.3864
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.8282
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:34:53 | [maml_trainer] epoch #292 | Sampling for adapation and meta-testing...
2025-04-04 04:36:18 | [maml_trainer] epoch #292 | Finished meta-testing...
2025-04-04 04:36:18 | [maml_trainer] epoch #292 | Saving snapshot...
2025-04-04 04:36:40 | [maml_trainer] epoch #292 | Saved
2025-04-04 04:36:40 | [maml_trainer] epoch #292 | Time 139422.11 s
2025-04-04 04:36:40 | [maml_trainer] epoch #292 | EpochTime 454.87 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.5367
Average/AverageReturn                              -27.5979
Average/Iteration                                  292
Average/MaxReturn                                    0.197223
Average/MinReturn                                  -50.3118
Average/NumEpisodes                                 80
Average/StdReturn                                    8.48651
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82441
GaussianMLPPolicy/KLAfter                            0.00048006
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          5.55609e-05
GaussianMLPPolicy/LossBefore                        -2.53916e-08
GaussianMLPPolicy/dLoss                             -5.55863e-05
Iteration                                          292
MetaTest/Average/AverageDiscountedReturn           -28.1798
MetaTest/Average/AverageReturn                     -28.1798
MetaTest/Average/Iteration                         292
MetaTest/Average/MaxReturn                         -13.9901
MetaTest/Average/MinReturn                         -41.5498
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.03125
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.1798
MetaTest/__unnamed_task__/AverageReturn            -28.1798
MetaTest/__unnamed_task__/Iteration                292
MetaTest/__unnamed_task__/MaxReturn                -13.9901
MetaTest/__unnamed_task__/MinReturn                -41.5498
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.03125
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.376e+06
__unnamed_task__/AverageDiscountedReturn           -14.5367
__unnamed_task__/AverageReturn                     -27.5979
__unnamed_task__/Iteration                         292
__unnamed_task__/MaxReturn                           0.197223
__unnamed_task__/MinReturn                         -50.3118
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.48651
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:42:18 | [maml_trainer] epoch #293 | Sampling for adapation and meta-testing...
2025-04-04 04:43:46 | [maml_trainer] epoch #293 | Finished meta-testing...
2025-04-04 04:43:46 | [maml_trainer] epoch #293 | Saving snapshot...
2025-04-04 04:44:09 | [maml_trainer] epoch #293 | Saved
2025-04-04 04:44:09 | [maml_trainer] epoch #293 | Time 139871.42 s
2025-04-04 04:44:09 | [maml_trainer] epoch #293 | EpochTime 449.31 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.6252
Average/AverageReturn                              -29.3756
Average/Iteration                                  293
Average/MaxReturn                                   -2.24804
Average/MinReturn                                  -46.988
Average/NumEpisodes                                 80
Average/StdReturn                                    8.80481
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.82224
GaussianMLPPolicy/KLAfter                            0.00137899
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -8.87531e-05
GaussianMLPPolicy/LossBefore                        -6.02007e-09
GaussianMLPPolicy/dLoss                              8.87471e-05
Iteration                                          293
MetaTest/Average/AverageDiscountedReturn           -29.3145
MetaTest/Average/AverageReturn                     -29.3145
MetaTest/Average/Iteration                         293
MetaTest/Average/MaxReturn                          -9.18963
MetaTest/Average/MinReturn                         -47.3361
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           7.96361
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.3145
MetaTest/__unnamed_task__/AverageReturn            -29.3145
MetaTest/__unnamed_task__/Iteration                293
MetaTest/__unnamed_task__/MaxReturn                 -9.18963
MetaTest/__unnamed_task__/MinReturn                -47.3361
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  7.96361
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.408e+06
__unnamed_task__/AverageDiscountedReturn           -15.6252
__unnamed_task__/AverageReturn                     -29.3756
__unnamed_task__/Iteration                         293
__unnamed_task__/MaxReturn                          -2.24804
__unnamed_task__/MinReturn                         -46.988
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.80481
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:49:50 | [maml_trainer] epoch #294 | Sampling for adapation and meta-testing...
2025-04-04 04:51:17 | [maml_trainer] epoch #294 | Finished meta-testing...
2025-04-04 04:51:17 | [maml_trainer] epoch #294 | Saving snapshot...
2025-04-04 04:51:39 | [maml_trainer] epoch #294 | Saved
2025-04-04 04:51:39 | [maml_trainer] epoch #294 | Time 140321.82 s
2025-04-04 04:51:39 | [maml_trainer] epoch #294 | EpochTime 450.40 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.1731
Average/AverageReturn                              -29.4943
Average/Iteration                                  294
Average/MaxReturn                                    3.78434
Average/MinReturn                                  -45.9221
Average/NumEpisodes                                 80
Average/StdReturn                                    7.87367
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.81965
GaussianMLPPolicy/KLAfter                            0.00195311
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000273751
GaussianMLPPolicy/LossBefore                        -1.72853e-08
GaussianMLPPolicy/dLoss                             -0.000273768
Iteration                                          294
MetaTest/Average/AverageDiscountedReturn           -30.834
MetaTest/Average/AverageReturn                     -30.834
MetaTest/Average/Iteration                         294
MetaTest/Average/MaxReturn                          -4.49831
MetaTest/Average/MinReturn                         -52.0834
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          10.3311
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -30.834
MetaTest/__unnamed_task__/AverageReturn            -30.834
MetaTest/__unnamed_task__/Iteration                294
MetaTest/__unnamed_task__/MaxReturn                 -4.49831
MetaTest/__unnamed_task__/MinReturn                -52.0834
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 10.3311
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.44e+06
__unnamed_task__/AverageDiscountedReturn           -15.1731
__unnamed_task__/AverageReturn                     -29.4943
__unnamed_task__/Iteration                         294
__unnamed_task__/MaxReturn                           3.78434
__unnamed_task__/MinReturn                         -45.9221
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.87367
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 04:57:21 | [maml_trainer] epoch #295 | Sampling for adapation and meta-testing...
2025-04-04 04:58:47 | [maml_trainer] epoch #295 | Finished meta-testing...
2025-04-04 04:58:47 | [maml_trainer] epoch #295 | Saving snapshot...
2025-04-04 04:59:08 | [maml_trainer] epoch #295 | Saved
2025-04-04 04:59:08 | [maml_trainer] epoch #295 | Time 140770.83 s
2025-04-04 04:59:08 | [maml_trainer] epoch #295 | EpochTime 449.01 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.3871
Average/AverageReturn                              -29.3465
Average/Iteration                                  295
Average/MaxReturn                                   31.0527
Average/MinReturn                                  -64.2736
Average/NumEpisodes                                 80
Average/StdReturn                                   10.1466
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.81673
GaussianMLPPolicy/KLAfter                            0.00296157
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -2.14454e-05
GaussianMLPPolicy/LossBefore                         5.33462e-09
GaussianMLPPolicy/dLoss                              2.14507e-05
Iteration                                          295
MetaTest/Average/AverageDiscountedReturn           -26.8348
MetaTest/Average/AverageReturn                     -26.8348
MetaTest/Average/Iteration                         295
MetaTest/Average/MaxReturn                           5.36312
MetaTest/Average/MinReturn                         -48.8608
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.1516
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -26.8348
MetaTest/__unnamed_task__/AverageReturn            -26.8348
MetaTest/__unnamed_task__/Iteration                295
MetaTest/__unnamed_task__/MaxReturn                  5.36312
MetaTest/__unnamed_task__/MinReturn                -48.8608
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.1516
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.472e+06
__unnamed_task__/AverageDiscountedReturn           -15.3871
__unnamed_task__/AverageReturn                     -29.3465
__unnamed_task__/Iteration                         295
__unnamed_task__/MaxReturn                          31.0527
__unnamed_task__/MinReturn                         -64.2736
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                          10.1466
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 05:04:47 | [maml_trainer] epoch #296 | Sampling for adapation and meta-testing...
2025-04-04 05:06:11 | [maml_trainer] epoch #296 | Finished meta-testing...
2025-04-04 05:06:11 | [maml_trainer] epoch #296 | Saving snapshot...
2025-04-04 05:06:34 | [maml_trainer] epoch #296 | Saved
2025-04-04 05:06:34 | [maml_trainer] epoch #296 | Time 141216.89 s
2025-04-04 05:06:34 | [maml_trainer] epoch #296 | EpochTime 446.05 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.808
Average/AverageReturn                              -28.1426
Average/Iteration                                  296
Average/MaxReturn                                    1.03945
Average/MinReturn                                  -49.7819
Average/NumEpisodes                                 80
Average/StdReturn                                    8.85452
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.81571
GaussianMLPPolicy/KLAfter                            0.00412172
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000164574
GaussianMLPPolicy/LossBefore                         2.08616e-08
GaussianMLPPolicy/dLoss                              0.000164595
Iteration                                          296
MetaTest/Average/AverageDiscountedReturn           -28.5564
MetaTest/Average/AverageReturn                     -28.5564
MetaTest/Average/Iteration                         296
MetaTest/Average/MaxReturn                         -21.4458
MetaTest/Average/MinReturn                         -39.0175
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           4.60842
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -28.5564
MetaTest/__unnamed_task__/AverageReturn            -28.5564
MetaTest/__unnamed_task__/Iteration                296
MetaTest/__unnamed_task__/MaxReturn                -21.4458
MetaTest/__unnamed_task__/MinReturn                -39.0175
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  4.60842
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.504e+06
__unnamed_task__/AverageDiscountedReturn           -14.808
__unnamed_task__/AverageReturn                     -28.1426
__unnamed_task__/Iteration                         296
__unnamed_task__/MaxReturn                           1.03945
__unnamed_task__/MinReturn                         -49.7819
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.85452
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 05:12:13 | [maml_trainer] epoch #297 | Sampling for adapation and meta-testing...
2025-04-04 05:13:37 | [maml_trainer] epoch #297 | Finished meta-testing...
2025-04-04 05:13:37 | [maml_trainer] epoch #297 | Saving snapshot...
2025-04-04 05:13:59 | [maml_trainer] epoch #297 | Saved
2025-04-04 05:13:59 | [maml_trainer] epoch #297 | Time 141661.46 s
2025-04-04 05:13:59 | [maml_trainer] epoch #297 | EpochTime 444.57 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -15.0911
Average/AverageReturn                              -28.9775
Average/Iteration                                  297
Average/MaxReturn                                   -5.81223
Average/MinReturn                                  -44.075
Average/NumEpisodes                                 80
Average/StdReturn                                    6.71785
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.81503
GaussianMLPPolicy/KLAfter                            0.00221584
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -5.48019e-05
GaussianMLPPolicy/LossBefore                         2.96235e-08
GaussianMLPPolicy/dLoss                              5.48316e-05
Iteration                                          297
MetaTest/Average/AverageDiscountedReturn           -32.6012
MetaTest/Average/AverageReturn                     -32.6012
MetaTest/Average/Iteration                         297
MetaTest/Average/MaxReturn                         -22.5053
MetaTest/Average/MinReturn                         -47.8494
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           5.87239
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -32.6012
MetaTest/__unnamed_task__/AverageReturn            -32.6012
MetaTest/__unnamed_task__/Iteration                297
MetaTest/__unnamed_task__/MaxReturn                -22.5053
MetaTest/__unnamed_task__/MinReturn                -47.8494
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  5.87239
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.536e+06
__unnamed_task__/AverageDiscountedReturn           -15.0911
__unnamed_task__/AverageReturn                     -28.9775
__unnamed_task__/Iteration                         297
__unnamed_task__/MaxReturn                          -5.81223
__unnamed_task__/MinReturn                         -44.075
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           6.71785
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 05:19:40 | [maml_trainer] epoch #298 | Sampling for adapation and meta-testing...
2025-04-04 05:21:05 | [maml_trainer] epoch #298 | Finished meta-testing...
2025-04-04 05:21:05 | [maml_trainer] epoch #298 | Saving snapshot...
2025-04-04 05:21:27 | [maml_trainer] epoch #298 | Saved
2025-04-04 05:21:27 | [maml_trainer] epoch #298 | Time 142109.31 s
2025-04-04 05:21:27 | [maml_trainer] epoch #298 | EpochTime 447.85 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.7757
Average/AverageReturn                              -28.4348
Average/Iteration                                  298
Average/MaxReturn                                    3.06664
Average/MinReturn                                  -46.4034
Average/NumEpisodes                                 80
Average/StdReturn                                    8.35218
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.81308
GaussianMLPPolicy/KLAfter                            0.00182217
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                          0.000173897
GaussianMLPPolicy/LossBefore                        -1.055e-08
GaussianMLPPolicy/dLoss                             -0.000173908
Iteration                                          298
MetaTest/Average/AverageDiscountedReturn           -27.4229
MetaTest/Average/AverageReturn                     -27.4229
MetaTest/Average/Iteration                         298
MetaTest/Average/MaxReturn                          -7.15364
MetaTest/Average/MinReturn                         -37.9788
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                           8.18082
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -27.4229
MetaTest/__unnamed_task__/AverageReturn            -27.4229
MetaTest/__unnamed_task__/Iteration                298
MetaTest/__unnamed_task__/MaxReturn                 -7.15364
MetaTest/__unnamed_task__/MinReturn                -37.9788
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                  8.18082
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.568e+06
__unnamed_task__/AverageDiscountedReturn           -14.7757
__unnamed_task__/AverageReturn                     -28.4348
__unnamed_task__/Iteration                         298
__unnamed_task__/MaxReturn                           3.06664
__unnamed_task__/MinReturn                         -46.4034
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           8.35218
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------
2025-04-04 05:27:13 | [maml_trainer] epoch #299 | Sampling for adapation and meta-testing...
2025-04-04 05:28:38 | [maml_trainer] epoch #299 | Finished meta-testing...
2025-04-04 05:28:38 | [maml_trainer] epoch #299 | Saving snapshot...
2025-04-04 05:29:00 | [maml_trainer] epoch #299 | Saved
2025-04-04 05:29:00 | [maml_trainer] epoch #299 | Time 142562.75 s
2025-04-04 05:29:00 | [maml_trainer] epoch #299 | EpochTime 453.44 s
-------------------------------------------------  -------------
Average/AverageDiscountedReturn                    -14.5894
Average/AverageReturn                              -29.3589
Average/Iteration                                  299
Average/MaxReturn                                   -1.38713
Average/MinReturn                                  -42.4645
Average/NumEpisodes                                 80
Average/StdReturn                                    7.47066
Average/TerminationRate                              0
GaussianMLPPolicy/Entropy                            9.80979
GaussianMLPPolicy/KLAfter                            0.00144226
GaussianMLPPolicy/KLBefore                           0
GaussianMLPPolicy/LossAfter                         -0.000109842
GaussianMLPPolicy/LossBefore                        -8.40426e-09
GaussianMLPPolicy/dLoss                              0.000109834
Iteration                                          299
MetaTest/Average/AverageDiscountedReturn           -29.1141
MetaTest/Average/AverageReturn                     -29.1141
MetaTest/Average/Iteration                         299
MetaTest/Average/MaxReturn                          -1.47222
MetaTest/Average/MinReturn                         -46.9089
MetaTest/Average/NumEpisodes                        20
MetaTest/Average/StdReturn                          11.4936
MetaTest/Average/TerminationRate                     0
MetaTest/__unnamed_task__/AverageDiscountedReturn  -29.1141
MetaTest/__unnamed_task__/AverageReturn            -29.1141
MetaTest/__unnamed_task__/Iteration                299
MetaTest/__unnamed_task__/MaxReturn                 -1.47222
MetaTest/__unnamed_task__/MinReturn                -46.9089
MetaTest/__unnamed_task__/NumEpisodes               20
MetaTest/__unnamed_task__/StdReturn                 11.4936
MetaTest/__unnamed_task__/TerminationRate            0
TotalEnvSteps                                        9.6e+06
__unnamed_task__/AverageDiscountedReturn           -14.5894
__unnamed_task__/AverageReturn                     -29.3589
__unnamed_task__/Iteration                         299
__unnamed_task__/MaxReturn                          -1.38713
__unnamed_task__/MinReturn                         -42.4645
__unnamed_task__/NumEpisodes                        80
__unnamed_task__/StdReturn                           7.47066
__unnamed_task__/TerminationRate                     0
-------------------------------------------------  -------------