diff --git a/.gitattributes b/.gitattributes
index a6344aac8c09253b3b630fb776ae94478aa0275b..51a1f442e2c67eb9c811830738ef579daa7263bf 100644
--- a/.gitattributes
+++ b/.gitattributes
@@ -33,3 +33,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+samples/1763254717481__000002250_2.jpg filter=lfs diff=lfs merge=lfs -text
+samples/1763255798300__000002500_2.jpg filter=lfs diff=lfs merge=lfs -text
+samples/1763256921963__000002750_2.jpg filter=lfs diff=lfs merge=lfs -text
+samples/1763258006174__000003000_2.jpg filter=lfs diff=lfs merge=lfs -text
diff --git a/.job_config.json b/.job_config.json
new file mode 100644
index 0000000000000000000000000000000000000000..e235ee8dda7b0a8d95de227c9ba189d200365cbf
--- /dev/null
+++ b/.job_config.json
@@ -0,0 +1,135 @@
+{
+  "job": "extension",
+  "config": {
+    "name": "hash_cache_v1",
+    "process": [
+      {
+        "type": "diffusion_trainer",
+        "training_folder": "/app/ai-toolkit/output",
+        "sqlite_db_path": "/app/ai-toolkit/aitk_db.db",
+        "device": "cuda",
+        "trigger_word": null,
+        "performance_log_every": 10,
+        "network": {
+          "type": "lora",
+          "linear": 32,
+          "linear_alpha": 32,
+          "conv": 16,
+          "conv_alpha": 16,
+          "lokr_full_rank": true,
+          "lokr_factor": -1,
+          "network_kwargs": {
+            "ignore_if_contains": []
+          }
+        },
+        "save": {
+          "dtype": "bf16",
+          "save_every": 250,
+          "max_step_saves_to_keep": 4,
+          "save_format": "diffusers",
+          "push_to_hub": false
+        },
+        "datasets": [
+          {
+            "folder_path": "/app/ai-toolkit/datasets/hash_cache",
+            "mask_path": null,
+            "mask_min_value": 0.1,
+            "default_caption": "",
+            "caption_ext": "txt",
+            "caption_dropout_rate": 0.05,
+            "cache_latents_to_disk": false,
+            "is_reg": false,
+            "network_weight": 1,
+            "resolution": [
+              512,
+              768,
+              1024
+            ],
+            "controls": [],
+            "shrink_video_to_frames": true,
+            "num_frames": 1,
+            "do_i2v": true,
+            "flip_x": false,
+            "flip_y": false
+          }
+        ],
+        "train": {
+          "batch_size": 1,
+          "bypass_guidance_embedding": false,
+          "steps": 3000,
+          "gradient_accumulation": 1,
+          "train_unet": true,
+          "train_text_encoder": false,
+          "gradient_checkpointing": true,
+          "noise_scheduler": "flowmatch",
+          "optimizer": "adamw8bit",
+          "timestep_type": "weighted",
+          "content_or_style": "balanced",
+          "optimizer_params": {
+            "weight_decay": 0.0001
+          },
+          "unload_text_encoder": false,
+          "cache_text_embeddings": false,
+          "lr": 0.0001,
+          "ema_config": {
+            "use_ema": false,
+            "ema_decay": 0.99
+          },
+          "skip_first_sample": false,
+          "force_first_sample": false,
+          "disable_sampling": false,
+          "dtype": "bf16",
+          "diff_output_preservation": false,
+          "diff_output_preservation_multiplier": 1,
+          "diff_output_preservation_class": "person",
+          "switch_boundary_every": 1,
+          "loss_type": "mse"
+        },
+        "model": {
+          "name_or_path": "Qwen/Qwen-Image",
+          "quantize": true,
+          "qtype": "qfloat8",
+          "quantize_te": true,
+          "qtype_te": "qfloat8",
+          "arch": "qwen_image",
+          "low_vram": true,
+          "model_kwargs": {},
+          "layer_offloading": false,
+          "layer_offloading_text_encoder_percent": 1,
+          "layer_offloading_transformer_percent": 1
+        },
+        "sample": {
+          "sampler": "flowmatch",
+          "sample_every": 250,
+          "width": 1024,
+          "height": 1024,
+          "samples": [
+            {
+              "prompt": "Two adult people sitting side-by-side on a couch in a simple room, full bodies fully visible in frame. Neutral lighting, no stylization, no dramatic poses. Both figures look forward calmly with relaxed posture, hands resting naturally. The background is minimal and uncluttered, with a plain wall, soft shadows and a low-table in front. No neon, no props — just clean, natural photographic realism."
+            },
+            {
+              "prompt": "Two adults slightly slouched on a couch, clearly drunk but not cartoonish: relaxed posture, unfocused expressions, leaning into each other casually. Full bodies visible. The room is dim but neutral in tone, with soft warm lighting, subtle background blur and no dramatic color effects. A few bottles or cans on a table in front for context, but environment remains minimal and clean."
+            },
+            {
+              "prompt": "A clean black-and-white line-art drawing of two people sitting on a couch, full bodies visible, simple outlines with minimal shading. Smooth, consistent linework, no stylization like anime or comic — neutral sketchbook quality. Background lightly suggested with simple lines for the couch and wall. No color, no text, no shadows — pure structural line drawing."
+            },
+            {
+              "prompt": "Two human silhouettes sitting on a couch, shown as solid matte shapes with no internal details. Full bodies visible, clean side-by-side posture. The couch is a simple silhouette shape as well. Background is blank white. No shading, no texture — pure flat graphical silhouette intended only for pose and composition reference."
+            }
+          ],
+          "neg": "",
+          "seed": 42,
+          "walk_seed": true,
+          "guidance_scale": 4,
+          "sample_steps": 25,
+          "num_frames": 1,
+          "fps": 1
+        }
+      }
+    ]
+  },
+  "meta": {
+    "name": "[name]",
+    "version": "1.0"
+  }
+}
\ No newline at end of file
diff --git a/config.yaml b/config.yaml
new file mode 100644
index 0000000000000000000000000000000000000000..5847b00b2b6428133151bfc4a0456985024f7fe2
--- /dev/null
+++ b/config.yaml
@@ -0,0 +1,126 @@
+job: extension
+config:
+  name: hash_cache_v1
+  process:
+  - type: diffusion_trainer
+    training_folder: /app/ai-toolkit/output
+    sqlite_db_path: /app/ai-toolkit/aitk_db.db
+    device: cuda
+    trigger_word: null
+    performance_log_every: 10
+    network:
+      type: lora
+      linear: 32
+      linear_alpha: 32
+      conv: 16
+      conv_alpha: 16
+      lokr_full_rank: true
+      lokr_factor: -1
+      network_kwargs:
+        ignore_if_contains: []
+    save:
+      dtype: bf16
+      save_every: 250
+      max_step_saves_to_keep: 4
+      save_format: diffusers
+      push_to_hub: false
+    datasets:
+    - folder_path: /app/ai-toolkit/datasets/hash_cache
+      mask_path: null
+      mask_min_value: 0.1
+      default_caption: ''
+      caption_ext: txt
+      caption_dropout_rate: 0.05
+      cache_latents_to_disk: false
+      is_reg: false
+      network_weight: 1
+      resolution:
+      - 512
+      - 768
+      - 1024
+      controls: []
+      shrink_video_to_frames: true
+      num_frames: 1
+      do_i2v: true
+      flip_x: false
+      flip_y: false
+    train:
+      batch_size: 1
+      bypass_guidance_embedding: false
+      steps: 3000
+      gradient_accumulation: 1
+      train_unet: true
+      train_text_encoder: false
+      gradient_checkpointing: true
+      noise_scheduler: flowmatch
+      optimizer: adamw8bit
+      timestep_type: weighted
+      content_or_style: balanced
+      optimizer_params:
+        weight_decay: 0.0001
+      unload_text_encoder: false
+      cache_text_embeddings: false
+      lr: 0.0001
+      ema_config:
+        use_ema: false
+        ema_decay: 0.99
+      skip_first_sample: false
+      force_first_sample: false
+      disable_sampling: false
+      dtype: bf16
+      diff_output_preservation: false
+      diff_output_preservation_multiplier: 1
+      diff_output_preservation_class: person
+      switch_boundary_every: 1
+      loss_type: mse
+    model:
+      name_or_path: Qwen/Qwen-Image
+      quantize: true
+      qtype: qfloat8
+      quantize_te: true
+      qtype_te: qfloat8
+      arch: qwen_image
+      low_vram: true
+      model_kwargs: {}
+      layer_offloading: false
+      layer_offloading_text_encoder_percent: 1
+      layer_offloading_transformer_percent: 1
+    sample:
+      sampler: flowmatch
+      sample_every: 250
+      width: 1024
+      height: 1024
+      samples:
+      - prompt: "Two adult people sitting side-by-side on a couch in a simple room,\
+          \ full bodies fully visible in frame. Neutral lighting, no stylization,\
+          \ no dramatic poses. Both figures look forward calmly with relaxed posture,\
+          \ hands resting naturally. The background is minimal and uncluttered, with\
+          \ a plain wall, soft shadows and a low-table in front. No neon, no props\
+          \ \u2014 just clean, natural photographic realism."
+      - prompt: 'Two adults slightly slouched on a couch, clearly drunk but not cartoonish:
+          relaxed posture, unfocused expressions, leaning into each other casually.
+          Full bodies visible. The room is dim but neutral in tone, with soft warm
+          lighting, subtle background blur and no dramatic color effects. A few bottles
+          or cans on a table in front for context, but environment remains minimal
+          and clean.'
+      - prompt: "A clean black-and-white line-art drawing of two people sitting on\
+          \ a couch, full bodies visible, simple outlines with minimal shading. Smooth,\
+          \ consistent linework, no stylization like anime or comic \u2014 neutral\
+          \ sketchbook quality. Background lightly suggested with simple lines for\
+          \ the couch and wall. No color, no text, no shadows \u2014 pure structural\
+          \ line drawing."
+      - prompt: "Two human silhouettes sitting on a couch, shown as solid matte shapes\
+          \ with no internal details. Full bodies visible, clean side-by-side posture.\
+          \ The couch is a simple silhouette shape as well. Background is blank white.\
+          \ No shading, no texture \u2014 pure flat graphical silhouette intended\
+          \ only for pose and composition reference."
+      neg: ''
+      seed: 42
+      walk_seed: true
+      guidance_scale: 4
+      sample_steps: 25
+      num_frames: 1
+      fps: 1
+meta:
+  name: hash_cache_v1
+  version: '1.0'
diff --git a/hash_cache_v1.safetensors b/hash_cache_v1.safetensors
new file mode 100644
index 0000000000000000000000000000000000000000..1358c1915651852f295fff8d5d96c4e85d4af5ab
--- /dev/null
+++ b/hash_cache_v1.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:fcdab1bbb2b305363d034d30f885bca6d3f67b3685706475ae5b974c2b04fe1d
+size 590058824
diff --git a/hash_cache_v1_000002000.safetensors b/hash_cache_v1_000002000.safetensors
new file mode 100644
index 0000000000000000000000000000000000000000..2793b4736aa54398e8836fd306d2379cfd952b77
--- /dev/null
+++ b/hash_cache_v1_000002000.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:cdff1eca1644da954b2c5c379e3f6299159bcb0596d7183d00eae51ee9454686
+size 590058824
diff --git a/hash_cache_v1_000002250.safetensors b/hash_cache_v1_000002250.safetensors
new file mode 100644
index 0000000000000000000000000000000000000000..0457f0ecde87e0a862b3959bc526eb0529744a53
--- /dev/null
+++ b/hash_cache_v1_000002250.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:1858da18ebec668624a740d2379e6eca19aafcff049df96538a11a52ea71f7bb
+size 590058824
diff --git a/hash_cache_v1_000002500.safetensors b/hash_cache_v1_000002500.safetensors
new file mode 100644
index 0000000000000000000000000000000000000000..103b5d71defcb6634e11044c794b74d1466f00ee
--- /dev/null
+++ b/hash_cache_v1_000002500.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:377cc623a5abbfb75d6372091f464440633a651d75c62f27ea0ac56851ea2aab
+size 590058824
diff --git a/hash_cache_v1_000002750.safetensors b/hash_cache_v1_000002750.safetensors
new file mode 100644
index 0000000000000000000000000000000000000000..235629044bfc075dd29672f89b895bb6f805f3e0
--- /dev/null
+++ b/hash_cache_v1_000002750.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:3516f980a2c016976faed96bf9f8c21e9f4dace8e6e1849839bac2edd8db6e2b
+size 590058824
diff --git a/log.txt b/log.txt
new file mode 100644
index 0000000000000000000000000000000000000000..61e6bf1bcbe967205fc8f1dfa961908865ccc0a3
--- /dev/null
+++ b/log.txt
@@ -0,0 +1,422 @@
+Running 1 job
+{
+    "type": "diffusion_trainer",
+    "training_folder": "/app/ai-toolkit/output",
+    "sqlite_db_path": "/app/ai-toolkit/aitk_db.db",
+    "device": "cuda",
+    "trigger_word": null,
+    "performance_log_every": 10,
+    "network": {
+        "type": "lora",
+        "linear": 32,
+        "linear_alpha": 32,
+        "conv": 16,
+        "conv_alpha": 16,
+        "lokr_full_rank": true,
+        "lokr_factor": -1,
+        "network_kwargs": {
+            "ignore_if_contains": []
+        }
+    },
+    "save": {
+        "dtype": "bf16",
+        "save_every": 250,
+        "max_step_saves_to_keep": 4,
+        "save_format": "diffusers",
+        "push_to_hub": false
+    },
+    "datasets": [
+        {
+            "folder_path": "/app/ai-toolkit/datasets/hash_cache",
+            "mask_path": null,
+            "mask_min_value": 0.1,
+            "default_caption": "",
+            "caption_ext": "txt",
+            "caption_dropout_rate": 0.05,
+            "cache_latents_to_disk": false,
+            "is_reg": false,
+            "network_weight": 1,
+            "resolution": [
+                512,
+                768,
+                1024
+            ],
+            "controls": [],
+            "shrink_video_to_frames": true,
+            "num_frames": 1,
+            "do_i2v": true,
+            "flip_x": false,
+            "flip_y": false
+        }
+    ],
+    "train": {
+        "batch_size": 1,
+        "bypass_guidance_embedding": false,
+        "steps": 3000,
+        "gradient_accumulation": 1,
+        "train_unet": true,
+        "train_text_encoder": false,
+        "gradient_checkpointing": true,
+        "noise_scheduler": "flowmatch",
+        "optimizer": "adamw8bit",
+        "timestep_type": "weighted",
+        "content_or_style": "balanced",
+        "optimizer_params": {
+            "weight_decay": 0.0001
+        },
+        "unload_text_encoder": false,
+        "cache_text_embeddings": false,
+        "lr": 0.0001,
+        "ema_config": {
+            "use_ema": false,
+            "ema_decay": 0.99
+        },
+        "skip_first_sample": false,
+        "force_first_sample": false,
+        "disable_sampling": false,
+        "dtype": "bf16",
+        "diff_output_preservation": false,
+        "diff_output_preservation_multiplier": 1,
+        "diff_output_preservation_class": "person",
+        "switch_boundary_every": 1,
+        "loss_type": "mse"
+    },
+    "model": {
+        "name_or_path": "Qwen/Qwen-Image",
+        "quantize": true,
+        "qtype": "qfloat8",
+        "quantize_te": true,
+        "qtype_te": "qfloat8",
+        "arch": "qwen_image",
+        "low_vram": true,
+        "model_kwargs": {},
+        "layer_offloading": false,
+        "layer_offloading_text_encoder_percent": 1,
+        "layer_offloading_transformer_percent": 1
+    },
+    "sample": {
+        "sampler": "flowmatch",
+        "sample_every": 250,
+        "width": 1024,
+        "height": 1024,
+        "samples": [
+            {
+                "prompt": "Two adult people sitting side-by-side on a couch in a simple room, full bodies fully visible in frame. Neutral lighting, no stylization, no dramatic poses. Both figures look forward calmly with relaxed posture, hands resting naturally. The background is minimal and uncluttered, with a plain wall, soft shadows and a low-table in front. No neon, no props \u2014 just clean, natural photographic realism."
+            },
+            {
+                "prompt": "Two adults slightly slouched on a couch, clearly drunk but not cartoonish: relaxed posture, unfocused expressions, leaning into each other casually. Full bodies visible. The room is dim but neutral in tone, with soft warm lighting, subtle background blur and no dramatic color effects. A few bottles or cans on a table in front for context, but environment remains minimal and clean."
+            },
+            {
+                "prompt": "A clean black-and-white line-art drawing of two people sitting on a couch, full bodies visible, simple outlines with minimal shading. Smooth, consistent linework, no stylization like anime or comic \u2014 neutral sketchbook quality. Background lightly suggested with simple lines for the couch and wall. No color, no text, no shadows \u2014 pure structural line drawing."
+            },
+            {
+                "prompt": "Two human silhouettes sitting on a couch, shown as solid matte shapes with no internal details. Full bodies visible, clean side-by-side posture. The couch is a simple silhouette shape as well. Background is blank white. No shading, no texture \u2014 pure flat graphical silhouette intended only for pose and composition reference."
+            }
+        ],
+        "neg": "",
+        "seed": 42,
+        "walk_seed": true,
+        "guidance_scale": 4,
+        "sample_steps": 25,
+        "num_frames": 1,
+        "fps": 1
+    }
+}
+Using SQLite database at /app/ai-toolkit/aitk_db.db
+Job ID: "7b55bfcb-4d82-4010-be23-0edca2a72f19"
+
+#############################################
+# Running job: hash_cache_v1
+#############################################
+
+
+Running  1 process
+Loading Qwen Image model
+Loading transformer
+config.json:   0%|          | 0.00/371 [00:00<?, ?B/s]config.json:   0%|          | 0.00/371 [00:00<?, ?B/s]config.json: 100%|##########| 371/371 [00:00<00:00, 2.05MB/s]config.json: 100%|##########| 371/371 [00:00<00:00, 2.05MB/s]
+
+(…)ion_pytorch_model.safetensors.index.json: 0.00B [00:00, ?B/s](…)ion_pytorch_model.safetensors.index.json: 0.00B [00:00, ?B/s](…)ion_pytorch_model.safetensors.index.json: 199kB [00:00, 170MB/s](…)ion_pytorch_model.safetensors.index.json: 199kB [00:00, 170MB/s]
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 780k/4.99G [00:01<2:16:37, 609kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 780k/4.99G [00:01<2:16:37, 609kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.99G [00:01<1:01:36, 1.35MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.99G [00:01<1:01:36, 1.35MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 4.64M/4.99G [00:03<49:52, 1.67MB/s]  transformer/diffusion_pytorch_model-0000(…):   0%|          | 4.64M/4.99G [00:03<49:52, 1.67MB/s]  transformer/diffusion_pytorch_model-0000(…):   1%|1         | 71.7M/4.99G [00:04<03:48, 21.5MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 71.7M/4.99G [00:04<03:48, 21.5MB/s]transformer/diffusion_pytorch_model-0000(…):   3%|2         | 139M/4.99G [00:05<01:58, 41.0MB/s] transformer/diffusion_pytorch_model-0000(…):   3%|2         | 139M/4.99G [00:05<01:58, 41.0MB/s] transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 675M/4.99G [00:05<00:14, 296MB/s] transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 675M/4.99G [00:05<00:14, 296MB/s] transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 876M/4.99G [00:05<00:10, 380MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 876M/4.99G [00:05<00:10, 380MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.99G [00:06<00:14, 271MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.99G [00:06<00:14, 271MB/s]transformer/diffusion_pytorch_model-0000(…):  24%|##4       | 1.21G/4.99G [00:07<00:13, 279MB/s]transformer/diffusion_pytorch_model-0000(…):  24%|##4       | 1.21G/4.99G [00:07<00:13, 279MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##6       | 1.35G/4.99G [00:07<00:10, 338MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##6       | 1.35G/4.99G [00:07<00:10, 338MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.99G [00:08<00:11, 296MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.99G [00:08<00:11, 296MB/s]transformer/diffusion_pytorch_model-0000(…):  32%|###2      | 1.62G/4.99G [00:08<00:13, 242MB/s]transformer/diffusion_pytorch_model-0000(…):  32%|###2      | 1.62G/4.99G [00:08<00:13, 242MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###3      | 1.68G/4.99G [00:08<00:12, 269MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###3      | 1.68G/4.99G [00:08<00:12, 269MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.99G [00:09<00:10, 295MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.99G [00:09<00:10, 295MB/s]transformer/diffusion_pytorch_model-0000(…):  36%|###6      | 1.82G/4.99G [00:09<00:10, 291MB/s]transformer/diffusion_pytorch_model-0000(…):  36%|###6      | 1.82G/4.99G [00:09<00:10, 291MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.89G/4.99G [00:09<00:10, 291MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.89G/4.99G [00:09<00:10, 291MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.99G [00:09<00:10, 296MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.99G [00:09<00:10, 296MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####1     | 2.09G/4.99G [00:09<00:06, 417MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####1     | 2.09G/4.99G [00:09<00:06, 417MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.99G [00:10<00:10, 275MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.99G [00:10<00:10, 275MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####8     | 2.42G/4.99G [00:10<00:04, 531MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####8     | 2.42G/4.99G [00:10<00:04, 531MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####1    | 2.55G/4.99G [00:10<00:04, 597MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####1    | 2.55G/4.99G [00:10<00:04, 597MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####6    | 2.82G/4.99G [00:11<00:04, 535MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####6    | 2.82G/4.99G [00:11<00:04, 535MB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######    | 3.02G/4.99G [00:11<00:02, 690MB/s]transformer/diffusion_pytorch_model-0000(…):  61%|######    | 3.02G/4.99G [00:11<00:02, 690MB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######4   | 3.22G/4.99G [00:11<00:02, 794MB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######4   | 3.22G/4.99G [00:11<00:02, 794MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.36G/4.99G [00:11<00:02, 659MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.36G/4.99G [00:11<00:02, 659MB/s]transformer/diffusion_pytorch_model-0000(…):  70%|#######   | 3.49G/4.99G [00:12<00:02, 714MB/s]transformer/diffusion_pytorch_model-0000(…):  70%|#######   | 3.49G/4.99G [00:12<00:02, 714MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######2  | 3.62G/4.99G [00:12<00:02, 621MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######2  | 3.62G/4.99G [00:12<00:02, 621MB/s]transformer/diffusion_pytorch_model-0000(…):  76%|#######5  | 3.78G/4.99G [00:12<00:01, 670MB/s]transformer/diffusion_pytorch_model-0000(…):  76%|#######5  | 3.78G/4.99G [00:12<00:01, 670MB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.05G/4.99G [00:12<00:01, 707MB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.05G/4.99G [00:12<00:01, 707MB/s]transformer/diffusion_pytorch_model-0000(…):  84%|########3 | 4.19G/4.99G [00:13<00:01, 792MB/s]transformer/diffusion_pytorch_model-0000(…):  84%|########3 | 4.19G/4.99G [00:13<00:01, 792MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.46G/4.99G [00:13<00:00, 965MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.46G/4.99G [00:13<00:00, 965MB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.59G/4.99G [00:13<00:00, 970MB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.59G/4.99G [00:13<00:00, 970MB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.99G [00:13<00:00, 925MB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.99G [00:13<00:00, 925MB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.86G/4.99G [00:13<00:00, 937MB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.86G/4.99G [00:13<00:00, 937MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 620MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 620MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 355MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 355MB/s]
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 553k/4.98G [00:00<1:51:06, 748kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 553k/4.98G [00:00<1:51:06, 748kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.79M/4.98G [00:01<47:59, 1.73MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.79M/4.98G [00:01<47:59, 1.73MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 3.84M/4.98G [00:01<35:24, 2.34MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 3.84M/4.98G [00:01<35:24, 2.34MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 70.9M/4.98G [00:03<02:44, 29.9MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 70.9M/4.98G [00:03<02:44, 29.9MB/s]transformer/diffusion_pytorch_model-0000(…):   3%|2         | 138M/4.98G [00:03<01:37, 49.8MB/s] transformer/diffusion_pytorch_model-0000(…):   3%|2         | 138M/4.98G [00:03<01:37, 49.8MB/s] transformer/diffusion_pytorch_model-0000(…):   5%|5         | 272M/4.98G [00:04<00:41, 113MB/s] transformer/diffusion_pytorch_model-0000(…):   5%|5         | 272M/4.98G [00:04<00:41, 113MB/s] transformer/diffusion_pytorch_model-0000(…):   7%|6         | 339M/4.98G [00:04<00:31, 147MB/s]transformer/diffusion_pytorch_model-0000(…):   7%|6         | 339M/4.98G [00:04<00:31, 147MB/s]transformer/diffusion_pytorch_model-0000(…):   8%|8         | 409M/4.98G [00:04<00:33, 135MB/s]transformer/diffusion_pytorch_model-0000(…):   8%|8         | 409M/4.98G [00:04<00:33, 135MB/s]transformer/diffusion_pytorch_model-0000(…):  10%|9         | 476M/4.98G [00:05<00:26, 169MB/s]transformer/diffusion_pytorch_model-0000(…):  10%|9         | 476M/4.98G [00:05<00:26, 169MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 544M/4.98G [00:05<00:23, 189MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 544M/4.98G [00:05<00:23, 189MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 678M/4.98G [00:05<00:17, 251MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 678M/4.98G [00:05<00:17, 251MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 879M/4.98G [00:05<00:10, 405MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 879M/4.98G [00:05<00:10, 405MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:06<00:08, 448MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:06<00:08, 448MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.98G [00:06<00:09, 409MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.98G [00:06<00:09, 409MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:06<00:07, 515MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:06<00:07, 515MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:07<00:07, 493MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:07<00:07, 493MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.98G [00:07<00:09, 367MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.98G [00:07<00:09, 367MB/s]transformer/diffusion_pytorch_model-0000(…):  32%|###2      | 1.62G/4.98G [00:07<00:08, 388MB/s]transformer/diffusion_pytorch_model-0000(…):  32%|###2      | 1.62G/4.98G [00:07<00:08, 388MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###3      | 1.68G/4.98G [00:08<00:14, 235MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###3      | 1.68G/4.98G [00:08<00:14, 235MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:08<00:14, 225MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:08<00:14, 225MB/s]transformer/diffusion_pytorch_model-0000(…):  36%|###6      | 1.82G/4.98G [00:08<00:14, 223MB/s]transformer/diffusion_pytorch_model-0000(…):  36%|###6      | 1.82G/4.98G [00:08<00:14, 223MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.88G/4.98G [00:09<00:14, 217MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.88G/4.98G [00:09<00:14, 217MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####1     | 2.09G/4.98G [00:09<00:09, 312MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####1     | 2.09G/4.98G [00:09<00:09, 312MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.98G [00:09<00:07, 365MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.98G [00:09<00:07, 365MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:10<00:07, 360MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:10<00:07, 360MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.38G/4.98G [00:10<00:07, 333MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.38G/4.98G [00:10<00:07, 333MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.51G/4.98G [00:10<00:05, 452MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.51G/4.98G [00:10<00:05, 452MB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####3    | 2.64G/4.98G [00:10<00:04, 546MB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####3    | 2.64G/4.98G [00:10<00:04, 546MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.84G/4.98G [00:10<00:03, 705MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.84G/4.98G [00:10<00:03, 705MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.98G/4.98G [00:11<00:03, 594MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.98G/4.98G [00:11<00:03, 594MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.11G/4.98G [00:11<00:02, 701MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.11G/4.98G [00:11<00:02, 701MB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.25G/4.98G [00:11<00:02, 721MB/s]transformer/diffusion_pytorch_model-0000(…):  65%|######5   | 3.25G/4.98G [00:11<00:02, 721MB/s]transformer/diffusion_pytorch_model-0000(…):  68%|######7   | 3.38G/4.98G [00:11<00:02, 715MB/s]transformer/diffusion_pytorch_model-0000(…):  68%|######7   | 3.38G/4.98G [00:11<00:02, 715MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.71G/4.98G [00:11<00:01, 1.04GB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.71G/4.98G [00:11<00:01, 1.04GB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.85G/4.98G [00:12<00:01, 912MB/s] transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.85G/4.98G [00:12<00:01, 912MB/s] transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.05G/4.98G [00:12<00:01, 779MB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.05G/4.98G [00:12<00:01, 779MB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:12<00:00, 994MB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.32G/4.98G [00:12<00:00, 994MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.45G/4.98G [00:12<00:00, 829MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.45G/4.98G [00:12<00:00, 829MB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.98G [00:12<00:00, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.98G [00:12<00:00, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.85G/4.98G [00:13<00:00, 1.01GB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.85G/4.98G [00:13<00:00, 1.01GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 741MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 741MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 370MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 370MB/s]
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 657k/4.95G [00:01<2:43:14, 505kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 657k/4.95G [00:01<2:43:14, 505kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.13M/4.95G [00:02<1:16:53, 1.07MB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.13M/4.95G [00:02<1:16:53, 1.07MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.2M/4.95G [00:03<03:20, 24.3MB/s]  transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.2M/4.95G [00:03<03:20, 24.3MB/s]  transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.95G [00:04<01:20, 58.8MB/s] transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.95G [00:04<01:20, 58.8MB/s] transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 675M/4.95G [00:05<00:18, 226MB/s] transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 675M/4.95G [00:05<00:18, 226MB/s] transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 809M/4.95G [00:05<00:15, 270MB/s]transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 809M/4.95G [00:05<00:15, 270MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.95G [00:06<00:14, 272MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.95G [00:06<00:14, 272MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.95G [00:06<00:13, 299MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.95G [00:06<00:13, 299MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.95G [00:06<00:11, 327MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.95G [00:06<00:11, 327MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.95G [00:06<00:11, 333MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.95G [00:06<00:11, 333MB/s]transformer/diffusion_pytorch_model-0000(…):  25%|##4       | 1.21G/4.95G [00:06<00:14, 258MB/s]transformer/diffusion_pytorch_model-0000(…):  25%|##4       | 1.21G/4.95G [00:06<00:14, 258MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:07<00:16, 222MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:07<00:16, 222MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.95G [00:07<00:16, 212MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.95G [00:07<00:16, 212MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.95G [00:08<00:14, 240MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.95G [00:08<00:14, 240MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:08<00:06, 469MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:08<00:06, 469MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.89G/4.95G [00:08<00:06, 471MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.89G/4.95G [00:08<00:06, 471MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.95G [00:08<00:06, 447MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.95G [00:08<00:06, 447MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.09G/4.95G [00:09<00:06, 449MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.09G/4.95G [00:09<00:06, 449MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####3     | 2.15G/4.95G [00:09<00:07, 369MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####3     | 2.15G/4.95G [00:09<00:07, 369MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####6     | 2.29G/4.95G [00:09<00:07, 339MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####6     | 2.29G/4.95G [00:09<00:07, 339MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:09<00:07, 369MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:09<00:07, 369MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.95G [00:10<00:08, 313MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.95G [00:10<00:08, 313MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 2.56G/4.95G [00:10<00:05, 446MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 2.56G/4.95G [00:10<00:05, 446MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####5    | 2.76G/4.95G [00:10<00:03, 619MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####5    | 2.76G/4.95G [00:10<00:03, 619MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.89G/4.95G [00:11<00:04, 438MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.89G/4.95G [00:11<00:04, 438MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.96G/4.95G [00:11<00:04, 453MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.96G/4.95G [00:11<00:04, 453MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.08G/4.95G [00:11<00:03, 534MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.08G/4.95G [00:11<00:03, 534MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.27G/4.95G [00:11<00:02, 654MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.27G/4.95G [00:11<00:02, 654MB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######8   | 3.41G/4.95G [00:11<00:02, 730MB/s]transformer/diffusion_pytorch_model-0000(…):  69%|######8   | 3.41G/4.95G [00:11<00:02, 730MB/s]transformer/diffusion_pytorch_model-0000(…):  72%|#######1  | 3.54G/4.95G [00:11<00:02, 617MB/s]transformer/diffusion_pytorch_model-0000(…):  72%|#######1  | 3.54G/4.95G [00:11<00:02, 617MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.68G/4.95G [00:12<00:02, 521MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.68G/4.95G [00:12<00:02, 521MB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.81G/4.95G [00:12<00:01, 570MB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 3.81G/4.95G [00:12<00:01, 570MB/s]transformer/diffusion_pytorch_model-0000(…):  80%|#######9  | 3.94G/4.95G [00:12<00:02, 486MB/s]transformer/diffusion_pytorch_model-0000(…):  80%|#######9  | 3.94G/4.95G [00:12<00:02, 486MB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########5 | 4.21G/4.95G [00:12<00:00, 772MB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########5 | 4.21G/4.95G [00:12<00:00, 772MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.41G/4.95G [00:13<00:00, 959MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.41G/4.95G [00:13<00:00, 959MB/s]transformer/diffusion_pytorch_model-0000(…):  93%|#########3| 4.61G/4.95G [00:13<00:00, 1.13GB/s]transformer/diffusion_pytorch_model-0000(…):  93%|#########3| 4.61G/4.95G [00:13<00:00, 1.13GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 1.51GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 1.51GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 372MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 372MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 603k/4.98G [00:01<3:29:00, 397kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 603k/4.98G [00:01<3:29:00, 397kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.69M/4.98G [00:02<1:58:58, 698kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.69M/4.98G [00:02<1:58:58, 698kB/s]transformer/diffusion_pytorch_model-0000(…):   3%|2         | 136M/4.98G [00:02<00:59, 82.1MB/s]  transformer/diffusion_pytorch_model-0000(…):   3%|2         | 136M/4.98G [00:02<00:59, 82.1MB/s]  transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.98G [00:04<01:24, 56.4MB/s]transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.98G [00:04<01:24, 56.4MB/s]transformer/diffusion_pytorch_model-0000(…):   8%|8         | 406M/4.98G [00:04<00:31, 146MB/s] transformer/diffusion_pytorch_model-0000(…):   8%|8         | 406M/4.98G [00:04<00:31, 146MB/s] transformer/diffusion_pytorch_model-0000(…):   9%|9         | 473M/4.98G [00:04<00:25, 174MB/s]transformer/diffusion_pytorch_model-0000(…):   9%|9         | 473M/4.98G [00:04<00:25, 174MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 540M/4.98G [00:04<00:22, 194MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 540M/4.98G [00:04<00:22, 194MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 607M/4.98G [00:05<00:24, 181MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 607M/4.98G [00:05<00:24, 181MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#4        | 742M/4.98G [00:05<00:16, 261MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#4        | 742M/4.98G [00:05<00:16, 261MB/s]transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 809M/4.98G [00:05<00:16, 247MB/s]transformer/diffusion_pytorch_model-0000(…):  16%|#6        | 809M/4.98G [00:05<00:16, 247MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#8        | 943M/4.98G [00:06<00:13, 296MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#8        | 943M/4.98G [00:06<00:13, 296MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:06<00:12, 327MB/s]transformer/diffusion_pytorch_model-0000(…):  20%|##        | 1.01G/4.98G [00:06<00:12, 327MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.98G [00:06<00:10, 371MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.98G [00:06<00:10, 371MB/s]transformer/diffusion_pytorch_model-0000(…):  24%|##4       | 1.21G/4.98G [00:06<00:07, 498MB/s]transformer/diffusion_pytorch_model-0000(…):  24%|##4       | 1.21G/4.98G [00:06<00:07, 498MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:07<00:10, 341MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:07<00:10, 341MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##6       | 1.35G/4.98G [00:07<00:17, 210MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##6       | 1.35G/4.98G [00:07<00:17, 210MB/s]transformer/diffusion_pytorch_model-0000(…):  28%|##8       | 1.41G/4.98G [00:07<00:15, 230MB/s]transformer/diffusion_pytorch_model-0000(…):  28%|##8       | 1.41G/4.98G [00:07<00:15, 230MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:08<00:16, 212MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:08<00:16, 212MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.98G [00:08<00:20, 168MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.98G [00:08<00:20, 168MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:09<00:09, 336MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:09<00:09, 336MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.88G/4.98G [00:09<00:07, 406MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.88G/4.98G [00:09<00:07, 406MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.98G [00:09<00:05, 522MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.98G [00:09<00:05, 522MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.98G [00:09<00:05, 505MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.98G [00:09<00:05, 505MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:09<00:04, 556MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:09<00:04, 556MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.98G [00:09<00:04, 635MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.98G [00:09<00:04, 635MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####1    | 2.56G/4.98G [00:10<00:03, 619MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####1    | 2.56G/4.98G [00:10<00:03, 619MB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####3    | 2.64G/4.98G [00:10<00:05, 432MB/s]transformer/diffusion_pytorch_model-0000(…):  53%|#####3    | 2.64G/4.98G [00:10<00:05, 432MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.85G/4.98G [00:10<00:03, 541MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.85G/4.98G [00:10<00:03, 541MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.91G/4.98G [00:11<00:03, 526MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.91G/4.98G [00:11<00:03, 526MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.98G/4.98G [00:11<00:03, 521MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.98G/4.98G [00:11<00:03, 521MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.11G/4.98G [00:11<00:03, 553MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.11G/4.98G [00:11<00:03, 553MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.31G/4.98G [00:11<00:02, 801MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.31G/4.98G [00:11<00:02, 801MB/s]transformer/diffusion_pytorch_model-0000(…):  70%|#######   | 3.51G/4.98G [00:11<00:02, 648MB/s]transformer/diffusion_pytorch_model-0000(…):  70%|#######   | 3.51G/4.98G [00:11<00:02, 648MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.65G/4.98G [00:12<00:03, 418MB/s]transformer/diffusion_pytorch_model-0000(…):  73%|#######3  | 3.65G/4.98G [00:12<00:03, 418MB/s]transformer/diffusion_pytorch_model-0000(…):  76%|#######5  | 3.78G/4.98G [00:12<00:02, 480MB/s]transformer/diffusion_pytorch_model-0000(…):  76%|#######5  | 3.78G/4.98G [00:12<00:02, 480MB/s]transformer/diffusion_pytorch_model-0000(…):  78%|#######8  | 3.91G/4.98G [00:12<00:01, 555MB/s]transformer/diffusion_pytorch_model-0000(…):  78%|#######8  | 3.91G/4.98G [00:12<00:01, 555MB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.31G/4.98G [00:12<00:00, 1.03GB/s]transformer/diffusion_pytorch_model-0000(…):  87%|########6 | 4.31G/4.98G [00:12<00:00, 1.03GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.51G/4.98G [00:13<00:00, 999MB/s] transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.51G/4.98G [00:13<00:00, 999MB/s] transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.78G/4.98G [00:13<00:00, 1.23GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.78G/4.98G [00:13<00:00, 1.23GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 851MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 851MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 363MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 363MB/s]
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 834k/4.95G [00:01<2:30:03, 549kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 834k/4.95G [00:01<2:30:03, 549kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.95G [00:03<1:43:50, 794kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.38M/4.95G [00:03<1:43:50, 794kB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.4M/4.95G [00:03<02:33, 31.9MB/s] transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.4M/4.95G [00:03<02:33, 31.9MB/s] transformer/diffusion_pytorch_model-0000(…):   4%|4         | 204M/4.95G [00:05<01:38, 48.4MB/s] transformer/diffusion_pytorch_model-0000(…):   4%|4         | 204M/4.95G [00:05<01:38, 48.4MB/s] transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.95G [00:05<00:12, 310MB/s] transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.95G [00:05<00:12, 310MB/s] transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.95G [00:06<00:13, 283MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##3       | 1.15G/4.95G [00:06<00:13, 283MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:06<00:11, 321MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:06<00:11, 321MB/s]transformer/diffusion_pytorch_model-0000(…):  29%|##8       | 1.42G/4.95G [00:07<00:09, 367MB/s]transformer/diffusion_pytorch_model-0000(…):  29%|##8       | 1.42G/4.95G [00:07<00:09, 367MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.95G [00:08<00:13, 246MB/s]transformer/diffusion_pytorch_model-0000(…):  31%|###1      | 1.55G/4.95G [00:08<00:13, 246MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:08<00:09, 342MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:08<00:09, 342MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.95G [00:09<00:10, 290MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.95G [00:09<00:10, 290MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.95G [00:09<00:11, 263MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.95G [00:09<00:11, 263MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.09G/4.95G [00:09<00:10, 265MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.09G/4.95G [00:09<00:10, 265MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####6     | 2.28G/4.95G [00:10<00:06, 392MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####6     | 2.28G/4.95G [00:10<00:06, 392MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.95G [00:10<00:08, 288MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####8     | 2.42G/4.95G [00:10<00:08, 288MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.49G/4.95G [00:11<00:09, 257MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.49G/4.95G [00:11<00:09, 257MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 2.55G/4.95G [00:11<00:08, 278MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 2.55G/4.95G [00:11<00:08, 278MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####5    | 2.75G/4.95G [00:11<00:05, 434MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####5    | 2.75G/4.95G [00:11<00:05, 434MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.89G/4.95G [00:11<00:03, 540MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.89G/4.95G [00:11<00:03, 540MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.07G/4.95G [00:11<00:02, 637MB/s]transformer/diffusion_pytorch_model-0000(…):  62%|######2   | 3.07G/4.95G [00:11<00:02, 637MB/s]transformer/diffusion_pytorch_model-0000(…):  68%|######7   | 3.34G/4.95G [00:11<00:01, 937MB/s]transformer/diffusion_pytorch_model-0000(…):  68%|######7   | 3.34G/4.95G [00:11<00:01, 937MB/s]transformer/diffusion_pytorch_model-0000(…):  72%|#######1  | 3.54G/4.95G [00:12<00:01, 994MB/s]transformer/diffusion_pytorch_model-0000(…):  72%|#######1  | 3.54G/4.95G [00:12<00:01, 994MB/s]transformer/diffusion_pytorch_model-0000(…):  76%|#######5  | 3.74G/4.95G [00:12<00:01, 1.07GB/s]transformer/diffusion_pytorch_model-0000(…):  76%|#######5  | 3.74G/4.95G [00:12<00:01, 1.07GB/s]transformer/diffusion_pytorch_model-0000(…):  78%|#######8  | 3.87G/4.95G [00:12<00:01, 995MB/s] transformer/diffusion_pytorch_model-0000(…):  78%|#######8  | 3.87G/4.95G [00:12<00:01, 995MB/s] transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.07G/4.95G [00:12<00:00, 938MB/s]transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.07G/4.95G [00:12<00:00, 938MB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########5 | 4.21G/4.95G [00:12<00:00, 914MB/s]transformer/diffusion_pytorch_model-0000(…):  85%|########5 | 4.21G/4.95G [00:12<00:00, 914MB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.48G/4.95G [00:13<00:00, 1.09GB/s]transformer/diffusion_pytorch_model-0000(…):  91%|######### | 4.48G/4.95G [00:13<00:00, 1.09GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.68G/4.95G [00:13<00:00, 1.21GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.68G/4.95G [00:13<00:00, 1.21GB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.81G/4.95G [00:13<00:00, 1.17GB/s]transformer/diffusion_pytorch_model-0000(…):  97%|#########7| 4.81G/4.95G [00:13<00:00, 1.17GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 371MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 371MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.95G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 897k/4.95G [00:01<2:54:12, 473kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 897k/4.95G [00:01<2:54:12, 473kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.33M/4.95G [00:02<1:23:51, 983kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 2.33M/4.95G [00:02<1:23:51, 983kB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.4M/4.95G [00:03<02:35, 31.3MB/s] transformer/diffusion_pytorch_model-0000(…):   1%|1         | 69.4M/4.95G [00:03<02:35, 31.3MB/s] transformer/diffusion_pytorch_model-0000(…):   3%|2         | 136M/4.95G [00:03<01:09, 69.4MB/s] transformer/diffusion_pytorch_model-0000(…):   3%|2         | 136M/4.95G [00:03<01:09, 69.4MB/s] transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.95G [00:04<01:22, 57.3MB/s]transformer/diffusion_pytorch_model-0000(…):   4%|4         | 203M/4.95G [00:04<01:22, 57.3MB/s]transformer/diffusion_pytorch_model-0000(…):   8%|8         | 407M/4.95G [00:05<00:32, 141MB/s] transformer/diffusion_pytorch_model-0000(…):   8%|8         | 407M/4.95G [00:05<00:32, 141MB/s] transformer/diffusion_pytorch_model-0000(…):  11%|#         | 541M/4.95G [00:05<00:22, 195MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 541M/4.95G [00:05<00:22, 195MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.95G [00:05<00:20, 208MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.95G [00:05<00:20, 208MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#5        | 742M/4.95G [00:05<00:14, 297MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#5        | 742M/4.95G [00:05<00:14, 297MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 876M/4.95G [00:06<00:11, 345MB/s]transformer/diffusion_pytorch_model-0000(…):  18%|#7        | 876M/4.95G [00:06<00:11, 345MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.95G [00:06<00:11, 340MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.95G [00:06<00:11, 340MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.95G [00:06<00:08, 456MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.95G [00:06<00:08, 456MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:06<00:06, 559MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.95G [00:06<00:06, 559MB/s]transformer/diffusion_pytorch_model-0000(…):  29%|##8       | 1.42G/4.95G [00:07<00:10, 348MB/s]transformer/diffusion_pytorch_model-0000(…):  29%|##8       | 1.42G/4.95G [00:07<00:10, 348MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.95G [00:08<00:12, 267MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.95G [00:08<00:12, 267MB/s]transformer/diffusion_pytorch_model-0000(…):  33%|###2      | 1.62G/4.95G [00:08<00:10, 314MB/s]transformer/diffusion_pytorch_model-0000(…):  33%|###2      | 1.62G/4.95G [00:08<00:10, 314MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###4      | 1.68G/4.95G [00:08<00:10, 326MB/s]transformer/diffusion_pytorch_model-0000(…):  34%|###4      | 1.68G/4.95G [00:08<00:10, 326MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:08<00:08, 356MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.95G [00:08<00:08, 356MB/s]transformer/diffusion_pytorch_model-0000(…):  37%|###6      | 1.82G/4.95G [00:08<00:08, 352MB/s]transformer/diffusion_pytorch_model-0000(…):  37%|###6      | 1.82G/4.95G [00:08<00:08, 352MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.95G [00:09<00:11, 260MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.95G [00:09<00:11, 260MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.95G [00:10<00:17, 167MB/s]transformer/diffusion_pytorch_model-0000(…):  39%|###9      | 1.95G/4.95G [00:10<00:17, 167MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.09G/4.95G [00:10<00:11, 247MB/s]transformer/diffusion_pytorch_model-0000(…):  42%|####2     | 2.09G/4.95G [00:10<00:11, 247MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####3     | 2.15G/4.95G [00:10<00:12, 230MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####3     | 2.15G/4.95G [00:10<00:12, 230MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:10<00:06, 405MB/s]transformer/diffusion_pytorch_model-0000(…):  48%|####7     | 2.35G/4.95G [00:10<00:06, 405MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.49G/4.95G [00:11<00:05, 421MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.49G/4.95G [00:11<00:05, 421MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 2.55G/4.95G [00:11<00:06, 376MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 2.55G/4.95G [00:11<00:06, 376MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####4    | 2.69G/4.95G [00:11<00:04, 465MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####4    | 2.69G/4.95G [00:11<00:04, 465MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.82G/4.95G [00:11<00:03, 544MB/s]transformer/diffusion_pytorch_model-0000(…):  57%|#####7    | 2.82G/4.95G [00:11<00:03, 544MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.95G/4.95G [00:11<00:03, 516MB/s]transformer/diffusion_pytorch_model-0000(…):  60%|#####9    | 2.95G/4.95G [00:11<00:03, 516MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.27G/4.95G [00:12<00:01, 840MB/s]transformer/diffusion_pytorch_model-0000(…):  66%|######6   | 3.27G/4.95G [00:12<00:01, 840MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.67G/4.95G [00:12<00:00, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.67G/4.95G [00:12<00:00, 1.37GB/s]transformer/diffusion_pytorch_model-0000(…):  78%|#######8  | 3.87G/4.95G [00:12<00:00, 1.34GB/s]transformer/diffusion_pytorch_model-0000(…):  78%|#######8  | 3.87G/4.95G [00:12<00:00, 1.34GB/s]transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.08G/4.95G [00:12<00:01, 801MB/s] transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.08G/4.95G [00:12<00:01, 801MB/s] transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.34G/4.95G [00:13<00:00, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.34G/4.95G [00:13<00:00, 1.02GB/s]transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.54G/4.95G [00:13<00:00, 982MB/s] transformer/diffusion_pytorch_model-0000(…):  92%|#########1| 4.54G/4.95G [00:13<00:00, 982MB/s] transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.75G/4.95G [00:13<00:00, 1.00GB/s]transformer/diffusion_pytorch_model-0000(…):  96%|#########5| 4.75G/4.95G [00:13<00:00, 1.00GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.88G/4.95G [00:13<00:00, 1.01GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.88G/4.95G [00:13<00:00, 1.01GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 363MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.95G/4.95G [00:13<00:00, 363MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.91G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.91G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 717k/4.91G [00:01<2:27:26, 555kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 717k/4.91G [00:01<2:27:26, 555kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.97M/4.91G [00:02<1:31:32, 893kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 1.97M/4.91G [00:02<1:31:32, 893kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 4.03M/4.91G [00:02<46:08, 1.77MB/s] transformer/diffusion_pytorch_model-0000(…):   0%|          | 4.03M/4.91G [00:02<46:08, 1.77MB/s] transformer/diffusion_pytorch_model-0000(…):   1%|1         | 71.1M/4.91G [00:03<02:28, 32.6MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 71.1M/4.91G [00:03<02:28, 32.6MB/s]transformer/diffusion_pytorch_model-0000(…):   3%|2         | 138M/4.91G [00:04<01:46, 44.6MB/s] transformer/diffusion_pytorch_model-0000(…):   3%|2         | 138M/4.91G [00:04<01:46, 44.6MB/s] transformer/diffusion_pytorch_model-0000(…):  11%|#1        | 541M/4.91G [00:05<00:18, 231MB/s] transformer/diffusion_pytorch_model-0000(…):  11%|#1        | 541M/4.91G [00:05<00:18, 231MB/s] transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.91G [00:05<00:17, 247MB/s]transformer/diffusion_pytorch_model-0000(…):  12%|#2        | 608M/4.91G [00:05<00:17, 247MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 675M/4.91G [00:05<00:19, 218MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 675M/4.91G [00:05<00:19, 218MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#5        | 742M/4.91G [00:06<00:20, 206MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#5        | 742M/4.91G [00:06<00:20, 206MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.91G [00:06<00:10, 361MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#9        | 943M/4.91G [00:06<00:10, 361MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.91G [00:06<00:10, 374MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.91G [00:06<00:10, 374MB/s]transformer/diffusion_pytorch_model-0000(…):  25%|##4       | 1.21G/4.91G [00:06<00:10, 347MB/s]transformer/diffusion_pytorch_model-0000(…):  25%|##4       | 1.21G/4.91G [00:06<00:10, 347MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.91G [00:07<00:08, 433MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.91G [00:07<00:08, 433MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|###       | 1.48G/4.91G [00:07<00:12, 277MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|###       | 1.48G/4.91G [00:07<00:12, 277MB/s]transformer/diffusion_pytorch_model-0000(…):  36%|###5      | 1.75G/4.91G [00:08<00:06, 458MB/s]transformer/diffusion_pytorch_model-0000(…):  36%|###5      | 1.75G/4.91G [00:08<00:06, 458MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.91G [00:08<00:09, 331MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###8      | 1.88G/4.91G [00:08<00:09, 331MB/s]transformer/diffusion_pytorch_model-0000(…):  40%|###9      | 1.96G/4.91G [00:09<00:09, 302MB/s]transformer/diffusion_pytorch_model-0000(…):  40%|###9      | 1.96G/4.91G [00:09<00:09, 302MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####2     | 2.10G/4.91G [00:09<00:07, 355MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####2     | 2.10G/4.91G [00:09<00:07, 355MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####4     | 2.16G/4.91G [00:09<00:08, 308MB/s]transformer/diffusion_pytorch_model-0000(…):  44%|####4     | 2.16G/4.91G [00:09<00:08, 308MB/s]transformer/diffusion_pytorch_model-0000(…):  47%|####6     | 2.30G/4.91G [00:10<00:07, 362MB/s]transformer/diffusion_pytorch_model-0000(…):  47%|####6     | 2.30G/4.91G [00:10<00:07, 362MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|####9     | 2.43G/4.91G [00:10<00:06, 397MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|####9     | 2.43G/4.91G [00:10<00:06, 397MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####     | 2.50G/4.91G [00:10<00:07, 306MB/s]transformer/diffusion_pytorch_model-0000(…):  51%|#####     | 2.50G/4.91G [00:10<00:07, 306MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.63G/4.91G [00:10<00:06, 363MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####3    | 2.63G/4.91G [00:10<00:06, 363MB/s]transformer/diffusion_pytorch_model-0000(…):  55%|#####5    | 2.70G/4.91G [00:11<00:06, 364MB/s]transformer/diffusion_pytorch_model-0000(…):  55%|#####5    | 2.70G/4.91G [00:11<00:06, 364MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####6    | 2.77G/4.91G [00:11<00:05, 390MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####6    | 2.77G/4.91G [00:11<00:05, 390MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####7    | 2.84G/4.91G [00:11<00:05, 383MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####7    | 2.84G/4.91G [00:11<00:05, 383MB/s]transformer/diffusion_pytorch_model-0000(…):  59%|#####9    | 2.90G/4.91G [00:11<00:05, 397MB/s]transformer/diffusion_pytorch_model-0000(…):  59%|#####9    | 2.90G/4.91G [00:11<00:05, 397MB/s]transformer/diffusion_pytorch_model-0000(…):  63%|######3   | 3.10G/4.91G [00:11<00:02, 669MB/s]transformer/diffusion_pytorch_model-0000(…):  63%|######3   | 3.10G/4.91G [00:11<00:02, 669MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.30G/4.91G [00:11<00:02, 790MB/s]transformer/diffusion_pytorch_model-0000(…):  67%|######7   | 3.30G/4.91G [00:11<00:02, 790MB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######1  | 3.50G/4.91G [00:12<00:01, 894MB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######1  | 3.50G/4.91G [00:12<00:01, 894MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.64G/4.91G [00:12<00:01, 721MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.64G/4.91G [00:12<00:01, 721MB/s]transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.04G/4.91G [00:12<00:00, 1.14GB/s]transformer/diffusion_pytorch_model-0000(…):  82%|########2 | 4.04G/4.91G [00:12<00:00, 1.14GB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.37G/4.91G [00:12<00:00, 1.32GB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########9 | 4.37G/4.91G [00:12<00:00, 1.32GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.64G/4.91G [00:12<00:00, 1.32GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.64G/4.91G [00:12<00:00, 1.32GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.91G/4.91G [00:13<00:00, 1.33GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.91G/4.91G [00:13<00:00, 1.33GB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.91G/4.91G [00:13<00:00, 372MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.91G/4.91G [00:13<00:00, 372MB/s] 
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/4.98G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 856k/4.98G [00:01<2:21:18, 588kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 856k/4.98G [00:01<2:21:18, 588kB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 67.9M/4.98G [00:03<03:08, 26.1MB/s]transformer/diffusion_pytorch_model-0000(…):   1%|1         | 67.9M/4.98G [00:03<03:08, 26.1MB/s]transformer/diffusion_pytorch_model-0000(…):   4%|4         | 205M/4.98G [00:04<01:12, 65.9MB/s] transformer/diffusion_pytorch_model-0000(…):   4%|4         | 205M/4.98G [00:04<01:12, 65.9MB/s] transformer/diffusion_pytorch_model-0000(…):   8%|8         | 407M/4.98G [00:04<00:32, 141MB/s] transformer/diffusion_pytorch_model-0000(…):   8%|8         | 407M/4.98G [00:04<00:32, 141MB/s] transformer/diffusion_pytorch_model-0000(…):  10%|9         | 475M/4.98G [00:05<00:37, 120MB/s]transformer/diffusion_pytorch_model-0000(…):  10%|9         | 475M/4.98G [00:05<00:37, 120MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 542M/4.98G [00:05<00:31, 141MB/s]transformer/diffusion_pytorch_model-0000(…):  11%|#         | 542M/4.98G [00:05<00:31, 141MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 676M/4.98G [00:05<00:19, 218MB/s]transformer/diffusion_pytorch_model-0000(…):  14%|#3        | 676M/4.98G [00:05<00:19, 218MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#4        | 743M/4.98G [00:05<00:17, 239MB/s]transformer/diffusion_pytorch_model-0000(…):  15%|#4        | 743M/4.98G [00:05<00:17, 239MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#8        | 944M/4.98G [00:06<00:12, 333MB/s]transformer/diffusion_pytorch_model-0000(…):  19%|#8        | 944M/4.98G [00:06<00:12, 333MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.98G [00:06<00:10, 378MB/s]transformer/diffusion_pytorch_model-0000(…):  22%|##1       | 1.08G/4.98G [00:06<00:10, 378MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##2       | 1.15G/4.98G [00:06<00:09, 408MB/s]transformer/diffusion_pytorch_model-0000(…):  23%|##2       | 1.15G/4.98G [00:06<00:09, 408MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:06<00:07, 520MB/s]transformer/diffusion_pytorch_model-0000(…):  26%|##5       | 1.28G/4.98G [00:06<00:07, 520MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.98G [00:07<00:11, 321MB/s]transformer/diffusion_pytorch_model-0000(…):  27%|##7       | 1.35G/4.98G [00:07<00:11, 321MB/s]transformer/diffusion_pytorch_model-0000(…):  28%|##8       | 1.42G/4.98G [00:07<00:12, 288MB/s]transformer/diffusion_pytorch_model-0000(…):  28%|##8       | 1.42G/4.98G [00:07<00:12, 288MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:08<00:18, 186MB/s]transformer/diffusion_pytorch_model-0000(…):  30%|##9       | 1.48G/4.98G [00:08<00:18, 186MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:08<00:08, 401MB/s]transformer/diffusion_pytorch_model-0000(…):  35%|###5      | 1.75G/4.98G [00:08<00:08, 401MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.89G/4.98G [00:09<00:10, 293MB/s]transformer/diffusion_pytorch_model-0000(…):  38%|###7      | 1.89G/4.98G [00:09<00:10, 293MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.98G [00:09<00:08, 359MB/s]transformer/diffusion_pytorch_model-0000(…):  41%|####      | 2.02G/4.98G [00:09<00:08, 359MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.98G [00:09<00:07, 365MB/s]transformer/diffusion_pytorch_model-0000(…):  43%|####3     | 2.15G/4.98G [00:09<00:07, 365MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.98G [00:09<00:07, 380MB/s]transformer/diffusion_pytorch_model-0000(…):  45%|####4     | 2.22G/4.98G [00:09<00:07, 380MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:09<00:06, 389MB/s]transformer/diffusion_pytorch_model-0000(…):  46%|####5     | 2.29G/4.98G [00:09<00:06, 389MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####9     | 2.44G/4.98G [00:10<00:05, 436MB/s]transformer/diffusion_pytorch_model-0000(…):  49%|####9     | 2.44G/4.98G [00:10<00:05, 436MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.51G/4.98G [00:10<00:06, 395MB/s]transformer/diffusion_pytorch_model-0000(…):  50%|#####     | 2.51G/4.98G [00:10<00:06, 395MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####4    | 2.71G/4.98G [00:10<00:04, 546MB/s]transformer/diffusion_pytorch_model-0000(…):  54%|#####4    | 2.71G/4.98G [00:10<00:04, 546MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####5    | 2.78G/4.98G [00:10<00:05, 428MB/s]transformer/diffusion_pytorch_model-0000(…):  56%|#####5    | 2.78G/4.98G [00:10<00:05, 428MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.91G/4.98G [00:11<00:03, 543MB/s]transformer/diffusion_pytorch_model-0000(…):  58%|#####8    | 2.91G/4.98G [00:11<00:03, 543MB/s]transformer/diffusion_pytorch_model-0000(…):  64%|######3   | 3.18G/4.98G [00:11<00:02, 754MB/s]transformer/diffusion_pytorch_model-0000(…):  64%|######3   | 3.18G/4.98G [00:11<00:02, 754MB/s]transformer/diffusion_pytorch_model-0000(…):  68%|######7   | 3.38G/4.98G [00:11<00:02, 751MB/s]transformer/diffusion_pytorch_model-0000(…):  68%|######7   | 3.38G/4.98G [00:11<00:02, 751MB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.51G/4.98G [00:11<00:01, 784MB/s]transformer/diffusion_pytorch_model-0000(…):  71%|#######   | 3.51G/4.98G [00:11<00:01, 784MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.71G/4.98G [00:12<00:01, 750MB/s]transformer/diffusion_pytorch_model-0000(…):  74%|#######4  | 3.71G/4.98G [00:12<00:01, 750MB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.91G/4.98G [00:12<00:01, 888MB/s]transformer/diffusion_pytorch_model-0000(…):  79%|#######8  | 3.91G/4.98G [00:12<00:01, 888MB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.05G/4.98G [00:12<00:01, 808MB/s]transformer/diffusion_pytorch_model-0000(…):  81%|########1 | 4.05G/4.98G [00:12<00:01, 808MB/s]transformer/diffusion_pytorch_model-0000(…):  84%|########3 | 4.18G/4.98G [00:12<00:01, 639MB/s]transformer/diffusion_pytorch_model-0000(…):  84%|########3 | 4.18G/4.98G [00:12<00:01, 639MB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.38G/4.98G [00:12<00:00, 675MB/s]transformer/diffusion_pytorch_model-0000(…):  88%|########7 | 4.38G/4.98G [00:12<00:00, 675MB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.98G [00:13<00:00, 1.05GB/s]transformer/diffusion_pytorch_model-0000(…):  95%|#########4| 4.72G/4.98G [00:13<00:00, 1.05GB/s]transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.92G/4.98G [00:13<00:00, 903MB/s] transformer/diffusion_pytorch_model-0000(…):  99%|#########8| 4.92G/4.98G [00:13<00:00, 903MB/s] transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 363MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 4.98G/4.98G [00:13<00:00, 363MB/s]
+
+transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/1.17G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 0.00/1.17G [00:00<?, ?B/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 581k/1.17G [00:01<40:48, 478kB/s]transformer/diffusion_pytorch_model-0000(…):   0%|          | 581k/1.17G [00:01<40:48, 478kB/s]transformer/diffusion_pytorch_model-0000(…):   6%|5         | 67.6M/1.17G [00:03<00:44, 24.8MB/s]transformer/diffusion_pytorch_model-0000(…):   6%|5         | 67.6M/1.17G [00:03<00:44, 24.8MB/s]transformer/diffusion_pytorch_model-0000(…):  17%|#7        | 202M/1.17G [00:03<00:10, 89.0MB/s] transformer/diffusion_pytorch_model-0000(…):  17%|#7        | 202M/1.17G [00:03<00:10, 89.0MB/s] transformer/diffusion_pytorch_model-0000(…):  40%|####      | 470M/1.17G [00:03<00:02, 255MB/s] transformer/diffusion_pytorch_model-0000(…):  40%|####      | 470M/1.17G [00:03<00:02, 255MB/s] transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 604M/1.17G [00:03<00:01, 288MB/s]transformer/diffusion_pytorch_model-0000(…):  52%|#####1    | 604M/1.17G [00:03<00:01, 288MB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 903M/1.17G [00:03<00:00, 489MB/s]transformer/diffusion_pytorch_model-0000(…):  77%|#######7  | 903M/1.17G [00:03<00:00, 489MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########8 | 1.04G/1.17G [00:04<00:00, 562MB/s]transformer/diffusion_pytorch_model-0000(…):  89%|########8 | 1.04G/1.17G [00:04<00:00, 562MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 1.17G/1.17G [00:04<00:00, 287MB/s]transformer/diffusion_pytorch_model-0000(…): 100%|##########| 1.17G/1.17G [00:04<00:00, 287MB/s]
+
+Loading checkpoint shards:   0%|          | 0/9 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/9 [00:00<?, ?it/s]Loading checkpoint shards:  44%|####4     | 4/9 [00:00<00:00, 38.28it/s]Loading checkpoint shards:  44%|####4     | 4/9 [00:00<00:00, 38.28it/s]Loading checkpoint shards:  89%|########8 | 8/9 [00:00<00:00, 38.60it/s]Loading checkpoint shards:  89%|########8 | 8/9 [00:00<00:00, 38.60it/s]Loading checkpoint shards: 100%|##########| 9/9 [00:00<00:00, 41.05it/s]Loading checkpoint shards: 100%|##########| 9/9 [00:00<00:00, 41.05it/s]
+
+Quantizing Transformer
+ - quantizing 60 transformer blocks
+  0%|          | 0/60 [00:00<?, ?it/s]  0%|          | 0/60 [00:00<?, ?it/s]  2%|1         | 1/60 [00:00<00:46,  1.26it/s]  2%|1         | 1/60 [00:00<00:46,  1.26it/s]  3%|3         | 2/60 [00:01<00:37,  1.56it/s]  3%|3         | 2/60 [00:01<00:37,  1.56it/s]  5%|5         | 3/60 [00:01<00:33,  1.69it/s]  5%|5         | 3/60 [00:01<00:33,  1.69it/s]  7%|6         | 4/60 [00:02<00:31,  1.77it/s]  7%|6         | 4/60 [00:02<00:31,  1.77it/s]  8%|8         | 5/60 [00:02<00:30,  1.82it/s]  8%|8         | 5/60 [00:02<00:30,  1.82it/s] 10%|#         | 6/60 [00:03<00:29,  1.84it/s] 10%|#         | 6/60 [00:03<00:29,  1.84it/s] 12%|#1        | 7/60 [00:03<00:28,  1.87it/s] 12%|#1        | 7/60 [00:03<00:28,  1.87it/s] 13%|#3        | 8/60 [00:04<00:27,  1.88it/s] 13%|#3        | 8/60 [00:04<00:27,  1.88it/s] 15%|#5        | 9/60 [00:05<00:26,  1.89it/s] 15%|#5        | 9/60 [00:05<00:26,  1.89it/s] 17%|#6        | 10/60 [00:05<00:26,  1.90it/s] 17%|#6        | 10/60 [00:05<00:26,  1.90it/s] 18%|#8        | 11/60 [00:06<00:25,  1.91it/s] 18%|#8        | 11/60 [00:06<00:25,  1.91it/s] 20%|##        | 12/60 [00:06<00:25,  1.92it/s] 20%|##        | 12/60 [00:06<00:25,  1.92it/s] 22%|##1       | 13/60 [00:07<00:24,  1.92it/s] 22%|##1       | 13/60 [00:07<00:24,  1.92it/s] 23%|##3       | 14/60 [00:07<00:23,  1.92it/s] 23%|##3       | 14/60 [00:07<00:23,  1.92it/s] 25%|##5       | 15/60 [00:08<00:26,  1.70it/s] 25%|##5       | 15/60 [00:08<00:26,  1.70it/s] 27%|##6       | 16/60 [00:08<00:25,  1.76it/s] 27%|##6       | 16/60 [00:08<00:25,  1.76it/s] 28%|##8       | 17/60 [00:09<00:23,  1.81it/s] 28%|##8       | 17/60 [00:09<00:23,  1.81it/s] 30%|###       | 18/60 [00:09<00:22,  1.84it/s] 30%|###       | 18/60 [00:09<00:22,  1.84it/s] 32%|###1      | 19/60 [00:10<00:21,  1.86it/s] 32%|###1      | 19/60 [00:10<00:21,  1.86it/s] 33%|###3      | 20/60 [00:10<00:21,  1.88it/s] 33%|###3      | 20/60 [00:10<00:21,  1.88it/s] 35%|###5      | 21/60 [00:11<00:20,  1.90it/s] 35%|###5      | 21/60 [00:11<00:20,  1.90it/s] 37%|###6      | 22/60 [00:12<00:22,  1.68it/s] 37%|###6      | 22/60 [00:12<00:22,  1.68it/s] 38%|###8      | 23/60 [00:12<00:21,  1.75it/s] 38%|###8      | 23/60 [00:12<00:21,  1.75it/s] 40%|####      | 24/60 [00:13<00:20,  1.80it/s] 40%|####      | 24/60 [00:13<00:20,  1.80it/s] 42%|####1     | 25/60 [00:13<00:19,  1.83it/s] 42%|####1     | 25/60 [00:13<00:19,  1.83it/s] 43%|####3     | 26/60 [00:14<00:18,  1.86it/s] 43%|####3     | 26/60 [00:14<00:18,  1.86it/s] 45%|####5     | 27/60 [00:14<00:17,  1.88it/s] 45%|####5     | 27/60 [00:14<00:17,  1.88it/s] 47%|####6     | 28/60 [00:15<00:16,  1.89it/s] 47%|####6     | 28/60 [00:15<00:16,  1.89it/s] 48%|####8     | 29/60 [00:15<00:16,  1.90it/s] 48%|####8     | 29/60 [00:15<00:16,  1.90it/s] 50%|#####     | 30/60 [00:16<00:17,  1.67it/s] 50%|#####     | 30/60 [00:16<00:17,  1.67it/s] 52%|#####1    | 31/60 [00:17<00:16,  1.74it/s] 52%|#####1    | 31/60 [00:17<00:16,  1.74it/s] 53%|#####3    | 32/60 [00:17<00:15,  1.78it/s] 53%|#####3    | 32/60 [00:17<00:15,  1.78it/s] 55%|#####5    | 33/60 [00:18<00:14,  1.82it/s] 55%|#####5    | 33/60 [00:18<00:14,  1.82it/s] 57%|#####6    | 34/60 [00:18<00:14,  1.83it/s] 57%|#####6    | 34/60 [00:18<00:14,  1.83it/s] 58%|#####8    | 35/60 [00:19<00:13,  1.86it/s] 58%|#####8    | 35/60 [00:19<00:13,  1.86it/s] 60%|######    | 36/60 [00:19<00:12,  1.87it/s] 60%|######    | 36/60 [00:19<00:12,  1.87it/s] 62%|######1   | 37/60 [00:20<00:13,  1.67it/s] 62%|######1   | 37/60 [00:20<00:13,  1.67it/s] 63%|######3   | 38/60 [00:21<00:12,  1.74it/s] 63%|######3   | 38/60 [00:21<00:12,  1.74it/s] 65%|######5   | 39/60 [00:21<00:11,  1.79it/s] 65%|######5   | 39/60 [00:21<00:11,  1.79it/s] 67%|######6   | 40/60 [00:22<00:10,  1.83it/s] 67%|######6   | 40/60 [00:22<00:10,  1.83it/s] 68%|######8   | 41/60 [00:22<00:10,  1.86it/s] 68%|######8   | 41/60 [00:22<00:10,  1.86it/s] 70%|#######   | 42/60 [00:23<00:09,  1.88it/s] 70%|#######   | 42/60 [00:23<00:09,  1.88it/s] 72%|#######1  | 43/60 [00:23<00:08,  1.89it/s] 72%|#######1  | 43/60 [00:23<00:08,  1.89it/s] 73%|#######3  | 44/60 [00:24<00:09,  1.68it/s] 73%|#######3  | 44/60 [00:24<00:09,  1.68it/s] 75%|#######5  | 45/60 [00:24<00:08,  1.75it/s] 75%|#######5  | 45/60 [00:24<00:08,  1.75it/s] 77%|#######6  | 46/60 [00:25<00:07,  1.80it/s] 77%|#######6  | 46/60 [00:25<00:07,  1.80it/s] 78%|#######8  | 47/60 [00:25<00:07,  1.84it/s] 78%|#######8  | 47/60 [00:25<00:07,  1.84it/s] 80%|########  | 48/60 [00:26<00:06,  1.86it/s] 80%|########  | 48/60 [00:26<00:06,  1.86it/s] 82%|########1 | 49/60 [00:26<00:05,  1.88it/s] 82%|########1 | 49/60 [00:26<00:05,  1.88it/s] 83%|########3 | 50/60 [00:27<00:05,  1.89it/s] 83%|########3 | 50/60 [00:27<00:05,  1.89it/s] 85%|########5 | 51/60 [00:28<00:05,  1.69it/s] 85%|########5 | 51/60 [00:28<00:05,  1.69it/s] 87%|########6 | 52/60 [00:28<00:04,  1.75it/s] 87%|########6 | 52/60 [00:28<00:04,  1.75it/s] 88%|########8 | 53/60 [00:29<00:03,  1.80it/s] 88%|########8 | 53/60 [00:29<00:03,  1.80it/s] 90%|######### | 54/60 [00:29<00:03,  1.84it/s] 90%|######### | 54/60 [00:29<00:03,  1.84it/s] 92%|#########1| 55/60 [00:30<00:02,  1.86it/s] 92%|#########1| 55/60 [00:30<00:02,  1.86it/s] 93%|#########3| 56/60 [00:30<00:02,  1.88it/s] 93%|#########3| 56/60 [00:30<00:02,  1.88it/s] 95%|#########5| 57/60 [00:31<00:01,  1.89it/s] 95%|#########5| 57/60 [00:31<00:01,  1.89it/s] 97%|#########6| 58/60 [00:31<00:01,  1.90it/s] 97%|#########6| 58/60 [00:31<00:01,  1.90it/s] 98%|#########8| 59/60 [00:32<00:00,  1.69it/s] 98%|#########8| 59/60 [00:32<00:00,  1.69it/s]100%|##########| 60/60 [00:33<00:00,  1.75it/s]100%|##########| 60/60 [00:33<00:00,  1.75it/s]100%|##########| 60/60 [00:33<00:00,  1.81it/s]100%|##########| 60/60 [00:33<00:00,  1.81it/s]
+
+ - quantizing extras
+Moving transformer to CPU
+Text Encoder
+tokenizer_config.json: 0.00B [00:00, ?B/s]tokenizer_config.json: 0.00B [00:00, ?B/s]tokenizer_config.json: 4.69kB [00:00, 19.1MB/s]tokenizer_config.json: 4.69kB [00:00, 19.1MB/s]
+
+vocab.json: 0.00B [00:00, ?B/s]vocab.json: 0.00B [00:00, ?B/s]vocab.json: 3.38MB [00:00, 74.4MB/s]vocab.json: 3.38MB [00:00, 74.4MB/s]
+
+merges.txt: 0.00B [00:00, ?B/s]merges.txt: 0.00B [00:00, ?B/s]merges.txt: 1.67MB [00:00, 75.2MB/s]merges.txt: 1.67MB [00:00, 75.2MB/s]
+
+added_tokens.json:   0%|          | 0.00/605 [00:00<?, ?B/s]added_tokens.json:   0%|          | 0.00/605 [00:00<?, ?B/s]added_tokens.json: 100%|##########| 605/605 [00:00<00:00, 3.77MB/s]added_tokens.json: 100%|##########| 605/605 [00:00<00:00, 3.77MB/s]
+
+special_tokens_map.json:   0%|          | 0.00/613 [00:00<?, ?B/s]special_tokens_map.json:   0%|          | 0.00/613 [00:00<?, ?B/s]special_tokens_map.json: 100%|##########| 613/613 [00:00<00:00, 2.96MB/s]special_tokens_map.json: 100%|##########| 613/613 [00:00<00:00, 2.96MB/s]
+
+chat_template.jinja: 0.00B [00:00, ?B/s]chat_template.jinja: 0.00B [00:00, ?B/s]chat_template.jinja: 2.43kB [00:00, 10.4MB/s]chat_template.jinja: 2.43kB [00:00, 10.4MB/s]
+
+config.json: 0.00B [00:00, ?B/s]config.json: 0.00B [00:00, ?B/s]config.json: 3.22kB [00:00, 23.0MB/s]config.json: 3.22kB [00:00, 23.0MB/s]
+
+model.safetensors.index.json: 0.00B [00:00, ?B/s]model.safetensors.index.json: 0.00B [00:00, ?B/s]model.safetensors.index.json: 57.7kB [00:00, 28.7MB/s]model.safetensors.index.json: 57.7kB [00:00, 28.7MB/s]
+
+text_encoder/model-00001-of-00004.safete(…):   0%|          | 0.00/4.97G [00:00<?, ?B/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 0.00/4.97G [00:00<?, ?B/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 667k/4.97G [00:02<4:20:50, 317kB/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 667k/4.97G [00:02<4:20:50, 317kB/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 2.00M/4.97G [00:03<2:12:39, 624kB/s]text_encoder/model-00001-of-00004.safete(…):   0%|          | 2.00M/4.97G [00:03<2:12:39, 624kB/s]text_encoder/model-00001-of-00004.safete(…):   1%|1         | 69.1M/4.97G [00:03<02:48, 29.1MB/s] text_encoder/model-00001-of-00004.safete(…):   1%|1         | 69.1M/4.97G [00:03<02:48, 29.1MB/s] text_encoder/model-00001-of-00004.safete(…):   4%|4         | 203M/4.97G [00:04<01:08, 69.8MB/s] text_encoder/model-00001-of-00004.safete(…):   4%|4         | 203M/4.97G [00:04<01:08, 69.8MB/s] text_encoder/model-00001-of-00004.safete(…):  18%|#7        | 876M/4.97G [00:05<00:10, 382MB/s] text_encoder/model-00001-of-00004.safete(…):  18%|#7        | 876M/4.97G [00:05<00:10, 382MB/s] text_encoder/model-00001-of-00004.safete(…):  20%|##        | 1.01G/4.97G [00:06<00:15, 255MB/s]text_encoder/model-00001-of-00004.safete(…):  20%|##        | 1.01G/4.97G [00:06<00:15, 255MB/s]text_encoder/model-00001-of-00004.safete(…):  23%|##3       | 1.15G/4.97G [00:06<00:15, 252MB/s]text_encoder/model-00001-of-00004.safete(…):  23%|##3       | 1.15G/4.97G [00:06<00:15, 252MB/s]text_encoder/model-00001-of-00004.safete(…):  27%|##7       | 1.35G/4.97G [00:07<00:15, 239MB/s]text_encoder/model-00001-of-00004.safete(…):  27%|##7       | 1.35G/4.97G [00:07<00:15, 239MB/s]text_encoder/model-00001-of-00004.safete(…):  28%|##8       | 1.41G/4.97G [00:08<00:16, 217MB/s]text_encoder/model-00001-of-00004.safete(…):  28%|##8       | 1.41G/4.97G [00:08<00:16, 217MB/s]text_encoder/model-00001-of-00004.safete(…):  30%|##9       | 1.48G/4.97G [00:09<00:19, 180MB/s]text_encoder/model-00001-of-00004.safete(…):  30%|##9       | 1.48G/4.97G [00:09<00:19, 180MB/s]text_encoder/model-00001-of-00004.safete(…):  34%|###3      | 1.68G/4.97G [00:09<00:12, 263MB/s]text_encoder/model-00001-of-00004.safete(…):  34%|###3      | 1.68G/4.97G [00:09<00:12, 263MB/s]text_encoder/model-00001-of-00004.safete(…):  35%|###5      | 1.75G/4.97G [00:09<00:12, 258MB/s]text_encoder/model-00001-of-00004.safete(…):  35%|###5      | 1.75G/4.97G [00:09<00:12, 258MB/s]text_encoder/model-00001-of-00004.safete(…):  38%|###7      | 1.88G/4.97G [00:09<00:09, 323MB/s]text_encoder/model-00001-of-00004.safete(…):  38%|###7      | 1.88G/4.97G [00:09<00:09, 323MB/s]text_encoder/model-00001-of-00004.safete(…):  43%|####3     | 2.15G/4.97G [00:09<00:05, 488MB/s]text_encoder/model-00001-of-00004.safete(…):  43%|####3     | 2.15G/4.97G [00:09<00:05, 488MB/s]text_encoder/model-00001-of-00004.safete(…):  45%|####4     | 2.22G/4.97G [00:10<00:05, 505MB/s]text_encoder/model-00001-of-00004.safete(…):  45%|####4     | 2.22G/4.97G [00:10<00:05, 505MB/s]text_encoder/model-00001-of-00004.safete(…):  47%|####7     | 2.36G/4.97G [00:10<00:04, 576MB/s]text_encoder/model-00001-of-00004.safete(…):  47%|####7     | 2.36G/4.97G [00:10<00:04, 576MB/s]text_encoder/model-00001-of-00004.safete(…):  50%|#####     | 2.49G/4.97G [00:10<00:05, 461MB/s]text_encoder/model-00001-of-00004.safete(…):  50%|#####     | 2.49G/4.97G [00:10<00:05, 461MB/s]text_encoder/model-00001-of-00004.safete(…):  53%|#####2    | 2.63G/4.97G [00:10<00:04, 549MB/s]text_encoder/model-00001-of-00004.safete(…):  53%|#####2    | 2.63G/4.97G [00:10<00:04, 549MB/s]text_encoder/model-00001-of-00004.safete(…):  56%|#####5    | 2.76G/4.97G [00:11<00:05, 411MB/s]text_encoder/model-00001-of-00004.safete(…):  56%|#####5    | 2.76G/4.97G [00:11<00:05, 411MB/s]text_encoder/model-00001-of-00004.safete(…):  60%|#####9    | 2.96G/4.97G [00:11<00:03, 568MB/s]text_encoder/model-00001-of-00004.safete(…):  60%|#####9    | 2.96G/4.97G [00:11<00:03, 568MB/s]text_encoder/model-00001-of-00004.safete(…):  62%|######2   | 3.09G/4.97G [00:11<00:04, 434MB/s]text_encoder/model-00001-of-00004.safete(…):  62%|######2   | 3.09G/4.97G [00:11<00:04, 434MB/s]text_encoder/model-00001-of-00004.safete(…):  64%|######3   | 3.16G/4.97G [00:12<00:04, 440MB/s]text_encoder/model-00001-of-00004.safete(…):  64%|######3   | 3.16G/4.97G [00:12<00:04, 440MB/s]text_encoder/model-00001-of-00004.safete(…):  65%|######4   | 3.23G/4.97G [00:12<00:03, 466MB/s]text_encoder/model-00001-of-00004.safete(…):  65%|######4   | 3.23G/4.97G [00:12<00:03, 466MB/s]text_encoder/model-00001-of-00004.safete(…):  69%|######9   | 3.43G/4.97G [00:12<00:02, 650MB/s]text_encoder/model-00001-of-00004.safete(…):  69%|######9   | 3.43G/4.97G [00:12<00:02, 650MB/s]text_encoder/model-00001-of-00004.safete(…):  72%|#######1  | 3.56G/4.97G [00:12<00:02, 582MB/s]text_encoder/model-00001-of-00004.safete(…):  72%|#######1  | 3.56G/4.97G [00:12<00:02, 582MB/s]text_encoder/model-00001-of-00004.safete(…):  74%|#######4  | 3.69G/4.97G [00:12<00:01, 672MB/s]text_encoder/model-00001-of-00004.safete(…):  74%|#######4  | 3.69G/4.97G [00:12<00:01, 672MB/s]text_encoder/model-00001-of-00004.safete(…):  78%|#######8  | 3.90G/4.97G [00:12<00:01, 897MB/s]text_encoder/model-00001-of-00004.safete(…):  78%|#######8  | 3.90G/4.97G [00:12<00:01, 897MB/s]text_encoder/model-00001-of-00004.safete(…):  81%|########1 | 4.03G/4.97G [00:13<00:00, 969MB/s]text_encoder/model-00001-of-00004.safete(…):  81%|########1 | 4.03G/4.97G [00:13<00:00, 969MB/s]text_encoder/model-00001-of-00004.safete(…):  89%|########9 | 4.43G/4.97G [00:13<00:00, 1.46GB/s]text_encoder/model-00001-of-00004.safete(…):  89%|########9 | 4.43G/4.97G [00:13<00:00, 1.46GB/s]text_encoder/model-00001-of-00004.safete(…):  93%|#########3| 4.63G/4.97G [00:13<00:00, 1.57GB/s]text_encoder/model-00001-of-00004.safete(…):  93%|#########3| 4.63G/4.97G [00:13<00:00, 1.57GB/s]text_encoder/model-00001-of-00004.safete(…):  97%|#########7| 4.83G/4.97G [00:13<00:00, 1.29GB/s]text_encoder/model-00001-of-00004.safete(…):  97%|#########7| 4.83G/4.97G [00:13<00:00, 1.29GB/s]text_encoder/model-00001-of-00004.safete(…): 100%|##########| 4.97G/4.97G [00:13<00:00, 364MB/s] text_encoder/model-00001-of-00004.safete(…): 100%|##########| 4.97G/4.97G [00:13<00:00, 364MB/s] 
+
+text_encoder/model-00002-of-00004.safete(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 0.00/4.99G [00:00<?, ?B/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 681k/4.99G [00:01<4:01:30, 344kB/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 681k/4.99G [00:01<4:01:30, 344kB/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 2.14M/4.99G [00:03<2:10:49, 636kB/s]text_encoder/model-00002-of-00004.safete(…):   0%|          | 2.14M/4.99G [00:03<2:10:49, 636kB/s]text_encoder/model-00002-of-00004.safete(…):   5%|5         | 270M/4.99G [00:04<01:01, 77.2MB/s]  text_encoder/model-00002-of-00004.safete(…):   5%|5         | 270M/4.99G [00:04<01:01, 77.2MB/s]  text_encoder/model-00002-of-00004.safete(…):  12%|#2        | 608M/4.99G [00:05<00:21, 204MB/s] text_encoder/model-00002-of-00004.safete(…):  12%|#2        | 608M/4.99G [00:05<00:21, 204MB/s] text_encoder/model-00002-of-00004.safete(…):  15%|#4        | 742M/4.99G [00:05<00:21, 200MB/s]text_encoder/model-00002-of-00004.safete(…):  15%|#4        | 742M/4.99G [00:05<00:21, 200MB/s]text_encoder/model-00002-of-00004.safete(…):  18%|#7        | 875M/4.99G [00:06<00:16, 244MB/s]text_encoder/model-00002-of-00004.safete(…):  18%|#7        | 875M/4.99G [00:06<00:16, 244MB/s]text_encoder/model-00002-of-00004.safete(…):  20%|##        | 1.01G/4.99G [00:06<00:15, 252MB/s]text_encoder/model-00002-of-00004.safete(…):  20%|##        | 1.01G/4.99G [00:06<00:15, 252MB/s]text_encoder/model-00002-of-00004.safete(…):  22%|##1       | 1.08G/4.99G [00:07<00:18, 214MB/s]text_encoder/model-00002-of-00004.safete(…):  22%|##1       | 1.08G/4.99G [00:07<00:18, 214MB/s]text_encoder/model-00002-of-00004.safete(…):  23%|##2       | 1.14G/4.99G [00:07<00:17, 220MB/s]text_encoder/model-00002-of-00004.safete(…):  23%|##2       | 1.14G/4.99G [00:07<00:17, 220MB/s]text_encoder/model-00002-of-00004.safete(…):  24%|##4       | 1.21G/4.99G [00:07<00:15, 252MB/s]text_encoder/model-00002-of-00004.safete(…):  24%|##4       | 1.21G/4.99G [00:07<00:15, 252MB/s]text_encoder/model-00002-of-00004.safete(…):  27%|##6       | 1.34G/4.99G [00:07<00:10, 345MB/s]text_encoder/model-00002-of-00004.safete(…):  27%|##6       | 1.34G/4.99G [00:07<00:10, 345MB/s]text_encoder/model-00002-of-00004.safete(…):  28%|##8       | 1.41G/4.99G [00:07<00:10, 336MB/s]text_encoder/model-00002-of-00004.safete(…):  28%|##8       | 1.41G/4.99G [00:07<00:10, 336MB/s]text_encoder/model-00002-of-00004.safete(…):  30%|##9       | 1.48G/4.99G [00:08<00:15, 226MB/s]text_encoder/model-00002-of-00004.safete(…):  30%|##9       | 1.48G/4.99G [00:08<00:15, 226MB/s]text_encoder/model-00002-of-00004.safete(…):  31%|###1      | 1.55G/4.99G [00:09<00:17, 193MB/s]text_encoder/model-00002-of-00004.safete(…):  31%|###1      | 1.55G/4.99G [00:09<00:17, 193MB/s]text_encoder/model-00002-of-00004.safete(…):  35%|###5      | 1.75G/4.99G [00:09<00:11, 277MB/s]text_encoder/model-00002-of-00004.safete(…):  35%|###5      | 1.75G/4.99G [00:09<00:11, 277MB/s]text_encoder/model-00002-of-00004.safete(…):  38%|###7      | 1.88G/4.99G [00:09<00:08, 360MB/s]text_encoder/model-00002-of-00004.safete(…):  38%|###7      | 1.88G/4.99G [00:09<00:08, 360MB/s]text_encoder/model-00002-of-00004.safete(…):  42%|####1     | 2.09G/4.99G [00:09<00:07, 415MB/s]text_encoder/model-00002-of-00004.safete(…):  42%|####1     | 2.09G/4.99G [00:09<00:07, 415MB/s]text_encoder/model-00002-of-00004.safete(…):  43%|####3     | 2.15G/4.99G [00:10<00:07, 391MB/s]text_encoder/model-00002-of-00004.safete(…):  43%|####3     | 2.15G/4.99G [00:10<00:07, 391MB/s]text_encoder/model-00002-of-00004.safete(…):  44%|####4     | 2.22G/4.99G [00:10<00:07, 372MB/s]text_encoder/model-00002-of-00004.safete(…):  44%|####4     | 2.22G/4.99G [00:10<00:07, 372MB/s]text_encoder/model-00002-of-00004.safete(…):  47%|####7     | 2.35G/4.99G [00:10<00:05, 488MB/s]text_encoder/model-00002-of-00004.safete(…):  47%|####7     | 2.35G/4.99G [00:10<00:05, 488MB/s]text_encoder/model-00002-of-00004.safete(…):  48%|####8     | 2.42G/4.99G [00:10<00:06, 423MB/s]text_encoder/model-00002-of-00004.safete(…):  48%|####8     | 2.42G/4.99G [00:10<00:06, 423MB/s]text_encoder/model-00002-of-00004.safete(…):  53%|#####2    | 2.62G/4.99G [00:10<00:03, 632MB/s]text_encoder/model-00002-of-00004.safete(…):  53%|#####2    | 2.62G/4.99G [00:10<00:03, 632MB/s]text_encoder/model-00002-of-00004.safete(…):  54%|#####4    | 2.72G/4.99G [00:11<00:03, 574MB/s]text_encoder/model-00002-of-00004.safete(…):  54%|#####4    | 2.72G/4.99G [00:11<00:03, 574MB/s]text_encoder/model-00002-of-00004.safete(…):  58%|#####8    | 2.92G/4.99G [00:11<00:04, 491MB/s]text_encoder/model-00002-of-00004.safete(…):  58%|#####8    | 2.92G/4.99G [00:11<00:04, 491MB/s]text_encoder/model-00002-of-00004.safete(…):  60%|#####9    | 2.99G/4.99G [00:11<00:04, 482MB/s]text_encoder/model-00002-of-00004.safete(…):  60%|#####9    | 2.99G/4.99G [00:11<00:04, 482MB/s]text_encoder/model-00002-of-00004.safete(…):  63%|######2   | 3.12G/4.99G [00:11<00:03, 587MB/s]text_encoder/model-00002-of-00004.safete(…):  63%|######2   | 3.12G/4.99G [00:11<00:03, 587MB/s]text_encoder/model-00002-of-00004.safete(…):  65%|######5   | 3.25G/4.99G [00:12<00:02, 647MB/s]text_encoder/model-00002-of-00004.safete(…):  65%|######5   | 3.25G/4.99G [00:12<00:02, 647MB/s]text_encoder/model-00002-of-00004.safete(…):  71%|#######   | 3.52G/4.99G [00:12<00:01, 1.00GB/s]text_encoder/model-00002-of-00004.safete(…):  71%|#######   | 3.52G/4.99G [00:12<00:01, 1.00GB/s]text_encoder/model-00002-of-00004.safete(…):  76%|#######5  | 3.78G/4.99G [00:12<00:00, 1.23GB/s]text_encoder/model-00002-of-00004.safete(…):  76%|#######5  | 3.78G/4.99G [00:12<00:00, 1.23GB/s]text_encoder/model-00002-of-00004.safete(…):  80%|#######9  | 3.99G/4.99G [00:12<00:00, 1.36GB/s]text_encoder/model-00002-of-00004.safete(…):  80%|#######9  | 3.99G/4.99G [00:12<00:00, 1.36GB/s]text_encoder/model-00002-of-00004.safete(…):  84%|########3 | 4.19G/4.99G [00:12<00:00, 1.37GB/s]text_encoder/model-00002-of-00004.safete(…):  84%|########3 | 4.19G/4.99G [00:12<00:00, 1.37GB/s]text_encoder/model-00002-of-00004.safete(…):  88%|########7 | 4.39G/4.99G [00:12<00:00, 892MB/s] text_encoder/model-00002-of-00004.safete(…):  88%|########7 | 4.39G/4.99G [00:12<00:00, 892MB/s] text_encoder/model-00002-of-00004.safete(…):  91%|######### | 4.52G/4.99G [00:13<00:00, 686MB/s]text_encoder/model-00002-of-00004.safete(…):  91%|######### | 4.52G/4.99G [00:13<00:00, 686MB/s]text_encoder/model-00002-of-00004.safete(…):  93%|#########3| 4.66G/4.99G [00:13<00:00, 710MB/s]text_encoder/model-00002-of-00004.safete(…):  93%|#########3| 4.66G/4.99G [00:13<00:00, 710MB/s]text_encoder/model-00002-of-00004.safete(…):  96%|#########5| 4.79G/4.99G [00:13<00:00, 554MB/s]text_encoder/model-00002-of-00004.safete(…):  96%|#########5| 4.79G/4.99G [00:13<00:00, 554MB/s]text_encoder/model-00002-of-00004.safete(…):  99%|#########8| 4.92G/4.99G [00:14<00:00, 390MB/s]text_encoder/model-00002-of-00004.safete(…):  99%|#########8| 4.92G/4.99G [00:14<00:00, 390MB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 363MB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 363MB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 339MB/s]text_encoder/model-00002-of-00004.safete(…): 100%|##########| 4.99G/4.99G [00:14<00:00, 339MB/s]
+
+text_encoder/model-00003-of-00004.safete(…):   0%|          | 0.00/4.93G [00:00<?, ?B/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 0.00/4.93G [00:00<?, ?B/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 911k/4.93G [00:01<1:50:24, 744kB/s]text_encoder/model-00003-of-00004.safete(…):   0%|          | 911k/4.93G [00:01<1:50:24, 744kB/s]text_encoder/model-00003-of-00004.safete(…):   1%|1         | 67.9M/4.93G [00:02<02:32, 32.0MB/s]text_encoder/model-00003-of-00004.safete(…):   1%|1         | 67.9M/4.93G [00:02<02:32, 32.0MB/s]text_encoder/model-00003-of-00004.safete(…):   1%|1         | 72.0M/4.93G [00:03<03:10, 25.5MB/s]text_encoder/model-00003-of-00004.safete(…):   1%|1         | 72.0M/4.93G [00:03<03:10, 25.5MB/s]text_encoder/model-00003-of-00004.safete(…):   3%|2         | 139M/4.93G [00:03<01:47, 44.5MB/s] text_encoder/model-00003-of-00004.safete(…):   3%|2         | 139M/4.93G [00:03<01:47, 44.5MB/s] text_encoder/model-00003-of-00004.safete(…):   6%|5         | 273M/4.93G [00:04<00:42, 109MB/s] text_encoder/model-00003-of-00004.safete(…):   6%|5         | 273M/4.93G [00:04<00:42, 109MB/s] text_encoder/model-00003-of-00004.safete(…):   7%|6         | 340M/4.93G [00:04<00:35, 130MB/s]text_encoder/model-00003-of-00004.safete(…):   7%|6         | 340M/4.93G [00:04<00:35, 130MB/s]text_encoder/model-00003-of-00004.safete(…):   8%|8         | 407M/4.93G [00:04<00:26, 172MB/s]text_encoder/model-00003-of-00004.safete(…):   8%|8         | 407M/4.93G [00:04<00:26, 172MB/s]text_encoder/model-00003-of-00004.safete(…):  10%|9         | 474M/4.93G [00:04<00:21, 212MB/s]text_encoder/model-00003-of-00004.safete(…):  10%|9         | 474M/4.93G [00:04<00:21, 212MB/s]text_encoder/model-00003-of-00004.safete(…):  12%|#2        | 612M/4.93G [00:05<00:16, 261MB/s]text_encoder/model-00003-of-00004.safete(…):  12%|#2        | 612M/4.93G [00:05<00:16, 261MB/s]text_encoder/model-00003-of-00004.safete(…):  14%|#3        | 679M/4.93G [00:05<00:15, 281MB/s]text_encoder/model-00003-of-00004.safete(…):  14%|#3        | 679M/4.93G [00:05<00:15, 281MB/s]text_encoder/model-00003-of-00004.safete(…):  15%|#5        | 746M/4.93G [00:05<00:14, 295MB/s]text_encoder/model-00003-of-00004.safete(…):  15%|#5        | 746M/4.93G [00:05<00:14, 295MB/s]text_encoder/model-00003-of-00004.safete(…):  16%|#6        | 813M/4.93G [00:05<00:14, 286MB/s]text_encoder/model-00003-of-00004.safete(…):  16%|#6        | 813M/4.93G [00:05<00:14, 286MB/s]text_encoder/model-00003-of-00004.safete(…):  19%|#9        | 947M/4.93G [00:06<00:17, 223MB/s]text_encoder/model-00003-of-00004.safete(…):  19%|#9        | 947M/4.93G [00:06<00:17, 223MB/s]text_encoder/model-00003-of-00004.safete(…):  21%|##        | 1.01G/4.93G [00:06<00:17, 230MB/s]text_encoder/model-00003-of-00004.safete(…):  21%|##        | 1.01G/4.93G [00:06<00:17, 230MB/s]text_encoder/model-00003-of-00004.safete(…):  23%|##3       | 1.15G/4.93G [00:07<00:17, 222MB/s]text_encoder/model-00003-of-00004.safete(…):  23%|##3       | 1.15G/4.93G [00:07<00:17, 222MB/s]text_encoder/model-00003-of-00004.safete(…):  26%|##5       | 1.28G/4.93G [00:07<00:15, 238MB/s]text_encoder/model-00003-of-00004.safete(…):  26%|##5       | 1.28G/4.93G [00:07<00:15, 238MB/s]text_encoder/model-00003-of-00004.safete(…):  27%|##7       | 1.35G/4.93G [00:08<00:13, 263MB/s]text_encoder/model-00003-of-00004.safete(…):  27%|##7       | 1.35G/4.93G [00:08<00:13, 263MB/s]text_encoder/model-00003-of-00004.safete(…):  30%|###       | 1.48G/4.93G [00:09<00:20, 168MB/s]text_encoder/model-00003-of-00004.safete(…):  30%|###       | 1.48G/4.93G [00:09<00:20, 168MB/s]text_encoder/model-00003-of-00004.safete(…):  40%|###9      | 1.95G/4.93G [00:09<00:06, 444MB/s]text_encoder/model-00003-of-00004.safete(…):  40%|###9      | 1.95G/4.93G [00:09<00:06, 444MB/s]text_encoder/model-00003-of-00004.safete(…):  46%|####6     | 2.29G/4.93G [00:09<00:04, 656MB/s]text_encoder/model-00003-of-00004.safete(…):  46%|####6     | 2.29G/4.93G [00:09<00:04, 656MB/s]text_encoder/model-00003-of-00004.safete(…):  50%|#####     | 2.49G/4.93G [00:10<00:03, 616MB/s]text_encoder/model-00003-of-00004.safete(…):  50%|#####     | 2.49G/4.93G [00:10<00:03, 616MB/s]text_encoder/model-00003-of-00004.safete(…):  53%|#####3    | 2.62G/4.93G [00:10<00:03, 583MB/s]text_encoder/model-00003-of-00004.safete(…):  53%|#####3    | 2.62G/4.93G [00:10<00:03, 583MB/s]text_encoder/model-00003-of-00004.safete(…):  56%|#####5    | 2.75G/4.93G [00:10<00:05, 415MB/s]text_encoder/model-00003-of-00004.safete(…):  56%|#####5    | 2.75G/4.93G [00:10<00:05, 415MB/s]text_encoder/model-00003-of-00004.safete(…):  59%|#####8    | 2.89G/4.93G [00:11<00:04, 490MB/s]text_encoder/model-00003-of-00004.safete(…):  59%|#####8    | 2.89G/4.93G [00:11<00:04, 490MB/s]text_encoder/model-00003-of-00004.safete(…):  61%|######1   | 3.02G/4.93G [00:11<00:03, 542MB/s]text_encoder/model-00003-of-00004.safete(…):  61%|######1   | 3.02G/4.93G [00:11<00:03, 542MB/s]text_encoder/model-00003-of-00004.safete(…):  63%|######3   | 3.13G/4.93G [00:11<00:03, 588MB/s]text_encoder/model-00003-of-00004.safete(…):  63%|######3   | 3.13G/4.93G [00:11<00:03, 588MB/s]text_encoder/model-00003-of-00004.safete(…):  66%|######6   | 3.26G/4.93G [00:11<00:03, 465MB/s]text_encoder/model-00003-of-00004.safete(…):  66%|######6   | 3.26G/4.93G [00:11<00:03, 465MB/s]text_encoder/model-00003-of-00004.safete(…):  72%|#######1  | 3.53G/4.93G [00:11<00:01, 739MB/s]text_encoder/model-00003-of-00004.safete(…):  72%|#######1  | 3.53G/4.93G [00:11<00:01, 739MB/s]text_encoder/model-00003-of-00004.safete(…):  77%|#######6  | 3.79G/4.93G [00:12<00:01, 903MB/s]text_encoder/model-00003-of-00004.safete(…):  77%|#######6  | 3.79G/4.93G [00:12<00:01, 903MB/s]text_encoder/model-00003-of-00004.safete(…):  80%|#######9  | 3.93G/4.93G [00:12<00:01, 889MB/s]text_encoder/model-00003-of-00004.safete(…):  80%|#######9  | 3.93G/4.93G [00:12<00:01, 889MB/s]text_encoder/model-00003-of-00004.safete(…):  82%|########2 | 4.06G/4.93G [00:12<00:01, 839MB/s]text_encoder/model-00003-of-00004.safete(…):  82%|########2 | 4.06G/4.93G [00:12<00:01, 839MB/s]text_encoder/model-00003-of-00004.safete(…):  85%|########5 | 4.20G/4.93G [00:12<00:00, 796MB/s]text_encoder/model-00003-of-00004.safete(…):  85%|########5 | 4.20G/4.93G [00:12<00:00, 796MB/s]text_encoder/model-00003-of-00004.safete(…):  90%|######### | 4.46G/4.93G [00:12<00:00, 1.07GB/s]text_encoder/model-00003-of-00004.safete(…):  90%|######### | 4.46G/4.93G [00:12<00:00, 1.07GB/s]text_encoder/model-00003-of-00004.safete(…):  93%|#########3| 4.60G/4.93G [00:12<00:00, 1.08GB/s]text_encoder/model-00003-of-00004.safete(…):  93%|#########3| 4.60G/4.93G [00:12<00:00, 1.08GB/s]text_encoder/model-00003-of-00004.safete(…):  97%|#########7| 4.80G/4.93G [00:13<00:00, 875MB/s] text_encoder/model-00003-of-00004.safete(…):  97%|#########7| 4.80G/4.93G [00:13<00:00, 875MB/s] text_encoder/model-00003-of-00004.safete(…): 100%|##########| 4.93G/4.93G [00:13<00:00, 542MB/s]text_encoder/model-00003-of-00004.safete(…): 100%|##########| 4.93G/4.93G [00:13<00:00, 542MB/s]text_encoder/model-00003-of-00004.safete(…): 100%|##########| 4.93G/4.93G [00:13<00:00, 359MB/s]text_encoder/model-00003-of-00004.safete(…): 100%|##########| 4.93G/4.93G [00:13<00:00, 359MB/s]
+
+text_encoder/model-00004-of-00004.safete(…):   0%|          | 0.00/1.69G [00:00<?, ?B/s]text_encoder/model-00004-of-00004.safete(…):   0%|          | 0.00/1.69G [00:00<?, ?B/s]text_encoder/model-00004-of-00004.safete(…):   0%|          | 651k/1.69G [00:01<51:38, 546kB/s]text_encoder/model-00004-of-00004.safete(…):   0%|          | 651k/1.69G [00:01<51:38, 546kB/s]text_encoder/model-00004-of-00004.safete(…):   1%|          | 15.9M/1.69G [00:02<03:00, 9.26MB/s]text_encoder/model-00004-of-00004.safete(…):   1%|          | 15.9M/1.69G [00:02<03:00, 9.26MB/s]text_encoder/model-00004-of-00004.safete(…):   5%|4         | 83.0M/1.69G [00:02<00:43, 36.9MB/s]text_encoder/model-00004-of-00004.safete(…):   5%|4         | 83.0M/1.69G [00:02<00:43, 36.9MB/s]text_encoder/model-00004-of-00004.safete(…):  13%|#2        | 217M/1.69G [00:03<00:14, 98.8MB/s] text_encoder/model-00004-of-00004.safete(…):  13%|#2        | 217M/1.69G [00:03<00:14, 98.8MB/s] text_encoder/model-00004-of-00004.safete(…):  25%|##4       | 418M/1.69G [00:03<00:05, 229MB/s] text_encoder/model-00004-of-00004.safete(…):  25%|##4       | 418M/1.69G [00:03<00:05, 229MB/s] text_encoder/model-00004-of-00004.safete(…):  33%|###2      | 553M/1.69G [00:04<00:04, 246MB/s]text_encoder/model-00004-of-00004.safete(…):  33%|###2      | 553M/1.69G [00:04<00:04, 246MB/s]text_encoder/model-00004-of-00004.safete(…):  41%|####      | 687M/1.69G [00:04<00:03, 331MB/s]text_encoder/model-00004-of-00004.safete(…):  41%|####      | 687M/1.69G [00:04<00:03, 331MB/s]text_encoder/model-00004-of-00004.safete(…):  49%|####8     | 821M/1.69G [00:04<00:02, 400MB/s]text_encoder/model-00004-of-00004.safete(…):  49%|####8     | 821M/1.69G [00:04<00:02, 400MB/s]text_encoder/model-00004-of-00004.safete(…):  64%|######4   | 1.09G/1.69G [00:04<00:00, 605MB/s]text_encoder/model-00004-of-00004.safete(…):  64%|######4   | 1.09G/1.69G [00:04<00:00, 605MB/s]text_encoder/model-00004-of-00004.safete(…):  80%|########  | 1.36G/1.69G [00:04<00:00, 857MB/s]text_encoder/model-00004-of-00004.safete(…):  80%|########  | 1.36G/1.69G [00:04<00:00, 857MB/s]text_encoder/model-00004-of-00004.safete(…):  88%|########8 | 1.49G/1.69G [00:04<00:00, 778MB/s]text_encoder/model-00004-of-00004.safete(…):  88%|########8 | 1.49G/1.69G [00:04<00:00, 778MB/s]text_encoder/model-00004-of-00004.safete(…):  96%|#########6| 1.62G/1.69G [00:05<00:00, 336MB/s]text_encoder/model-00004-of-00004.safete(…):  96%|#########6| 1.62G/1.69G [00:05<00:00, 336MB/s]text_encoder/model-00004-of-00004.safete(…): 100%|##########| 1.69G/1.69G [00:06<00:00, 243MB/s]text_encoder/model-00004-of-00004.safete(…): 100%|##########| 1.69G/1.69G [00:06<00:00, 243MB/s]
+
+Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]Loading checkpoint shards:  50%|#####     | 2/4 [00:00<00:00, 17.32it/s]Loading checkpoint shards:  50%|#####     | 2/4 [00:00<00:00, 17.32it/s]Loading checkpoint shards: 100%|##########| 4/4 [00:00<00:00, 29.56it/s]Loading checkpoint shards: 100%|##########| 4/4 [00:00<00:00, 29.56it/s]
+
+generation_config.json:   0%|          | 0.00/244 [00:00<?, ?B/s]generation_config.json:   0%|          | 0.00/244 [00:00<?, ?B/s]generation_config.json: 100%|##########| 244/244 [00:00<00:00, 2.29MB/s]generation_config.json: 100%|##########| 244/244 [00:00<00:00, 2.29MB/s]
+
+Quantizing Text Encoder
+Loading VAE
+config.json:   0%|          | 0.00/730 [00:00<?, ?B/s]config.json:   0%|          | 0.00/730 [00:00<?, ?B/s]config.json: 100%|##########| 730/730 [00:00<00:00, 8.62MB/s]config.json: 100%|##########| 730/730 [00:00<00:00, 8.62MB/s]
+
+vae/diffusion_pytorch_model.safetensors:   0%|          | 0.00/254M [00:00<?, ?B/s]vae/diffusion_pytorch_model.safetensors:   0%|          | 0.00/254M [00:00<?, ?B/s]vae/diffusion_pytorch_model.safetensors:  21%|##        | 52.5M/254M [00:01<00:04, 45.7MB/s]vae/diffusion_pytorch_model.safetensors:  21%|##        | 52.5M/254M [00:01<00:04, 45.7MB/s]vae/diffusion_pytorch_model.safetensors:  47%|####7     | 120M/254M [00:01<00:01, 112MB/s]  vae/diffusion_pytorch_model.safetensors:  47%|####7     | 120M/254M [00:01<00:01, 112MB/s]  vae/diffusion_pytorch_model.safetensors:  74%|#######3  | 187M/254M [00:02<00:01, 60.8MB/s]vae/diffusion_pytorch_model.safetensors:  74%|#######3  | 187M/254M [00:02<00:01, 60.8MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:03<00:00, 87.3MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:03<00:00, 87.3MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:03<00:00, 79.3MB/s]vae/diffusion_pytorch_model.safetensors: 100%|##########| 254M/254M [00:03<00:00, 79.3MB/s]
+
+Making pipe
+Preparing Model
+Model Loaded
+create LoRA network. base dim (rank): 32, alpha: 32
+neuron dropout: p=None, rank dropout: p=None, module dropout: p=None
+apply LoRA to Conv2d with kernel size (3,3). dim (rank): 16, alpha: 16
+create LoRA for Text Encoder: 0 modules.
+create LoRA for U-Net: 840 modules.
+enable LoRA for U-Net
+Dataset: /app/ai-toolkit/datasets/hash_cache
+  -  Preprocessing image dimensions
+  0%|          | 0/30 [00:00<?, ?it/s]  0%|          | 0/30 [00:00<?, ?it/s] 10%|#         | 3/30 [00:00<00:00, 29.72it/s] 10%|#         | 3/30 [00:00<00:00, 29.72it/s] 23%|##3       | 7/30 [00:00<00:00, 31.61it/s] 23%|##3       | 7/30 [00:00<00:00, 31.61it/s] 37%|###6      | 11/30 [00:00<00:00, 32.22it/s] 37%|###6      | 11/30 [00:00<00:00, 32.22it/s] 50%|#####     | 15/30 [00:00<00:00, 32.55it/s] 50%|#####     | 15/30 [00:00<00:00, 32.55it/s] 63%|######3   | 19/30 [00:00<00:00, 32.56it/s] 63%|######3   | 19/30 [00:00<00:00, 32.56it/s] 77%|#######6  | 23/30 [00:00<00:00, 32.81it/s] 77%|#######6  | 23/30 [00:00<00:00, 32.81it/s] 90%|######### | 27/30 [00:00<00:00, 32.82it/s] 90%|######### | 27/30 [00:00<00:00, 32.82it/s]100%|##########| 30/30 [00:00<00:00, 32.50it/s]100%|##########| 30/30 [00:00<00:00, 32.50it/s]
+
+  -  Found 30 images
+Bucket sizes for /app/ai-toolkit/datasets/hash_cache:
+672x384: 30 files
+1 buckets made
+Dataset: /app/ai-toolkit/datasets/hash_cache
+  -  Preprocessing image dimensions
+  0%|          | 0/30 [00:00<?, ?it/s]  0%|          | 0/30 [00:00<?, ?it/s]100%|##########| 30/30 [00:00<00:00, 34435.99it/s]100%|##########| 30/30 [00:00<00:00, 34435.99it/s]
+
+  -  Found 30 images
+Bucket sizes for /app/ai-toolkit/datasets/hash_cache:
+992x576: 30 files
+1 buckets made
+Dataset: /app/ai-toolkit/datasets/hash_cache
+  -  Preprocessing image dimensions
+  0%|          | 0/30 [00:00<?, ?it/s]  0%|          | 0/30 [00:00<?, ?it/s]100%|##########| 30/30 [00:00<00:00, 35365.13it/s]100%|##########| 30/30 [00:00<00:00, 35365.13it/s]
+
+  -  Found 30 images
+Bucket sizes for /app/ai-toolkit/datasets/hash_cache:
+1312x736: 30 files
+1 buckets made
+Generating baseline samples before training
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:  25%|##5       | 1/4 [01:08<03:26, 68.98s/it]Generating Images:  25%|##5       | 1/4 [01:08<03:26, 68.98s/it]Generating Images:  50%|#####     | 2/4 [02:19<02:19, 69.88s/it]Generating Images:  50%|#####     | 2/4 [02:19<02:19, 69.88s/it]Generating Images:  75%|#######5  | 3/4 [03:30<01:10, 70.18s/it]Generating Images:  75%|#######5  | 3/4 [03:30<01:10, 70.18s/it]Generating Images: 100%|##########| 4/4 [04:40<00:00, 70.49s/it]Generating Images: 100%|##########| 4/4 [04:40<00:00, 70.49s/it]                                                                                                                                hash_cache_v1:   0%|          | 0/3000 [00:00<?, ?it/s]hash_cache_v1:   0%|          | 0/3000 [00:00<?, ?it/s]hash_cache_v1:   0%|          | 0/3000 [00:04<?, ?it/s, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:   0%|          | 0/3000 [00:04<?, ?it/s, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:   0%|          | 0/3000 [00:04<?, ?it/s, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:   0%|          | 0/3000 [00:04<?, ?it/s, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:   0%|          | 0/3000 [00:09<?, ?it/s, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:   0%|          | 0/3000 [00:09<?, ?it/s, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:   0%|          | 1/3000 [00:09<3:35:09,  4.30s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:   0%|          | 1/3000 [00:09<3:35:09,  4.30s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:   0%|          | 1/3000 [00:11<3:35:09,  4.30s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:   0%|          | 1/3000 [00:11<3:35:09,  4.30s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:   0%|          | 2/3000 [00:11<2:52:59,  3.46s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:   0%|          | 2/3000 [00:11<2:52:59,  3.46s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:   0%|          | 2/3000 [00:14<2:52:59,  3.46s/it, lr: 1.0e-04 loss: 3.404e-01]hash_cache_v1:   0%|          | 2/3000 [00:14<2:52:59,  3.46s/it, lr: 1.0e-04 loss: 3.404e-01]hash_cache_v1:   0%|          | 3/3000 [00:14<2:22:04,  2.84s/it, lr: 1.0e-04 loss: 3.404e-01]hash_cache_v1:   0%|          | 3/3000 [00:14<2:22:04,  2.84s/it, lr: 1.0e-04 loss: 3.404e-01]hash_cache_v1:   0%|          | 3/3000 [00:16<2:22:04,  2.84s/it, lr: 1.0e-04 loss: 1.066e-01]hash_cache_v1:   0%|          | 3/3000 [00:16<2:22:04,  2.84s/it, lr: 1.0e-04 loss: 1.066e-01]hash_cache_v1:   0%|          | 4/3000 [00:16<2:12:22,  2.65s/it, lr: 1.0e-04 loss: 1.066e-01]hash_cache_v1:   0%|          | 4/3000 [00:16<2:12:22,  2.65s/it, lr: 1.0e-04 loss: 1.066e-01]hash_cache_v1:   0%|          | 4/3000 [00:19<2:12:22,  2.65s/it, lr: 1.0e-04 loss: 2.297e-01]hash_cache_v1:   0%|          | 4/3000 [00:19<2:12:22,  2.65s/it, lr: 1.0e-04 loss: 2.297e-01]hash_cache_v1:   0%|          | 5/3000 [00:19<2:16:11,  2.73s/it, lr: 1.0e-04 loss: 2.297e-01]hash_cache_v1:   0%|          | 5/3000 [00:19<2:16:11,  2.73s/it, lr: 1.0e-04 loss: 2.297e-01]hash_cache_v1:   0%|          | 5/3000 [00:22<2:16:11,  2.73s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:   0%|          | 5/3000 [00:22<2:16:11,  2.73s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:   0%|          | 6/3000 [00:22<2:18:26,  2.77s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:   0%|          | 6/3000 [00:22<2:18:26,  2.77s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:   0%|          | 6/3000 [00:25<2:18:26,  2.77s/it, lr: 1.0e-04 loss: 2.525e-01]hash_cache_v1:   0%|          | 6/3000 [00:25<2:18:26,  2.77s/it, lr: 1.0e-04 loss: 2.525e-01]hash_cache_v1:   0%|          | 7/3000 [00:25<2:22:39,  2.86s/it, lr: 1.0e-04 loss: 2.525e-01]hash_cache_v1:   0%|          | 7/3000 [00:25<2:22:39,  2.86s/it, lr: 1.0e-04 loss: 2.525e-01]hash_cache_v1:   0%|          | 7/3000 [00:27<2:22:39,  2.86s/it, lr: 1.0e-04 loss: 9.611e-02]hash_cache_v1:   0%|          | 7/3000 [00:27<2:22:39,  2.86s/it, lr: 1.0e-04 loss: 9.611e-02]hash_cache_v1:   0%|          | 8/3000 [00:27<2:22:32,  2.86s/it, lr: 1.0e-04 loss: 9.611e-02]hash_cache_v1:   0%|          | 8/3000 [00:27<2:22:32,  2.86s/it, lr: 1.0e-04 loss: 9.611e-02]hash_cache_v1:   0%|          | 8/3000 [00:32<2:22:32,  2.86s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   0%|          | 8/3000 [00:32<2:22:32,  2.86s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   0%|          | 9/3000 [00:32<2:45:50,  3.33s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   0%|          | 9/3000 [00:32<2:45:50,  3.33s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   0%|          | 9/3000 [00:35<2:45:50,  3.33s/it, lr: 1.0e-04 loss: 2.013e-01]hash_cache_v1:   0%|          | 9/3000 [00:35<2:45:50,  3.33s/it, lr: 1.0e-04 loss: 2.013e-01]hash_cache_v1:   0%|          | 10/3000 [00:38<2:45:47,  3.33s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:   0%|          | 10/3000 [00:38<2:45:47,  3.33s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:   0%|          | 11/3000 [00:38<2:03:27,  2.48s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:   0%|          | 11/3000 [00:38<2:03:27,  2.48s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:   0%|          | 11/3000 [00:42<2:03:27,  2.48s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:   0%|          | 11/3000 [00:42<2:03:27,  2.48s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:   0%|          | 12/3000 [00:42<2:26:13,  2.94s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:   0%|          | 12/3000 [00:42<2:26:13,  2.94s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:   0%|          | 12/3000 [00:46<2:26:13,  2.94s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   0%|          | 12/3000 [00:46<2:26:13,  2.94s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   0%|          | 13/3000 [00:46<2:43:47,  3.29s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   0%|          | 13/3000 [00:46<2:43:47,  3.29s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   0%|          | 13/3000 [00:49<2:43:47,  3.29s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:   0%|          | 13/3000 [00:49<2:43:47,  3.29s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:   0%|          | 14/3000 [00:49<2:31:27,  3.04s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:   0%|          | 14/3000 [00:49<2:31:27,  3.04s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:   0%|          | 14/3000 [00:53<2:31:27,  3.04s/it, lr: 1.0e-04 loss: 2.237e-01]hash_cache_v1:   0%|          | 14/3000 [00:53<2:31:27,  3.04s/it, lr: 1.0e-04 loss: 2.237e-01]hash_cache_v1:   0%|          | 15/3000 [00:53<2:49:32,  3.41s/it, lr: 1.0e-04 loss: 2.237e-01]hash_cache_v1:   0%|          | 15/3000 [00:53<2:49:32,  3.41s/it, lr: 1.0e-04 loss: 2.237e-01]hash_cache_v1:   0%|          | 15/3000 [00:57<2:49:32,  3.41s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:   0%|          | 15/3000 [00:57<2:49:32,  3.41s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:   1%|          | 16/3000 [00:57<3:02:29,  3.67s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:   1%|          | 16/3000 [00:57<3:02:29,  3.67s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:   1%|          | 16/3000 [01:00<3:02:29,  3.67s/it, lr: 1.0e-04 loss: 1.782e-01]hash_cache_v1:   1%|          | 16/3000 [01:00<3:02:29,  3.67s/it, lr: 1.0e-04 loss: 1.782e-01]hash_cache_v1:   1%|          | 17/3000 [01:00<2:51:08,  3.44s/it, lr: 1.0e-04 loss: 1.782e-01]hash_cache_v1:   1%|          | 17/3000 [01:00<2:51:08,  3.44s/it, lr: 1.0e-04 loss: 1.782e-01]hash_cache_v1:   1%|          | 17/3000 [01:05<2:51:08,  3.44s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:   1%|          | 17/3000 [01:05<2:51:08,  3.44s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:   1%|          | 18/3000 [01:05<3:06:27,  3.75s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:   1%|          | 18/3000 [01:05<3:06:27,  3.75s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:   1%|          | 18/3000 [01:09<3:06:27,  3.75s/it, lr: 1.0e-04 loss: 1.910e-01]hash_cache_v1:   1%|          | 18/3000 [01:09<3:06:27,  3.75s/it, lr: 1.0e-04 loss: 1.910e-01]hash_cache_v1:   1%|          | 19/3000 [01:09<3:14:36,  3.92s/it, lr: 1.0e-04 loss: 1.910e-01]hash_cache_v1:   1%|          | 19/3000 [01:09<3:14:36,  3.92s/it, lr: 1.0e-04 loss: 1.910e-01]hash_cache_v1:   1%|          | 19/3000 [01:12<3:14:36,  3.92s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:   1%|          | 19/3000 [01:12<3:14:36,  3.92s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:   1%|          | 20/3000 [01:14<3:14:32,  3.92s/it, lr: 1.0e-04 loss: 2.557e-01]hash_cache_v1:   1%|          | 20/3000 [01:14<3:14:32,  3.92s/it, lr: 1.0e-04 loss: 2.557e-01]hash_cache_v1:   1%|          | 21/3000 [01:14<2:12:20,  2.67s/it, lr: 1.0e-04 loss: 2.557e-01]hash_cache_v1:   1%|          | 21/3000 [01:14<2:12:20,  2.67s/it, lr: 1.0e-04 loss: 2.557e-01]hash_cache_v1:   1%|          | 21/3000 [01:19<2:12:20,  2.67s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   1%|          | 21/3000 [01:19<2:12:20,  2.67s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   1%|          | 22/3000 [01:19<2:32:39,  3.08s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   1%|          | 22/3000 [01:19<2:32:39,  3.08s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   1%|          | 22/3000 [01:21<2:32:39,  3.08s/it, lr: 1.0e-04 loss: 3.274e-01]hash_cache_v1:   1%|          | 22/3000 [01:21<2:32:39,  3.08s/it, lr: 1.0e-04 loss: 3.274e-01]hash_cache_v1:   1%|          | 23/3000 [01:21<2:19:55,  2.82s/it, lr: 1.0e-04 loss: 3.274e-01]hash_cache_v1:   1%|          | 23/3000 [01:21<2:19:55,  2.82s/it, lr: 1.0e-04 loss: 3.274e-01]hash_cache_v1:   1%|          | 23/3000 [01:23<2:19:55,  2.82s/it, lr: 1.0e-04 loss: 3.302e-01]hash_cache_v1:   1%|          | 23/3000 [01:23<2:19:55,  2.82s/it, lr: 1.0e-04 loss: 3.302e-01]hash_cache_v1:   1%|          | 24/3000 [01:23<2:10:02,  2.62s/it, lr: 1.0e-04 loss: 3.302e-01]hash_cache_v1:   1%|          | 24/3000 [01:23<2:10:02,  2.62s/it, lr: 1.0e-04 loss: 3.302e-01]hash_cache_v1:   1%|          | 24/3000 [01:27<2:10:02,  2.62s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:   1%|          | 24/3000 [01:27<2:10:02,  2.62s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:   1%|          | 25/3000 [01:27<2:36:08,  3.15s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:   1%|          | 25/3000 [01:27<2:36:08,  3.15s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:   1%|          | 25/3000 [01:32<2:36:08,  3.15s/it, lr: 1.0e-04 loss: 1.007e-01]hash_cache_v1:   1%|          | 25/3000 [01:32<2:36:08,  3.15s/it, lr: 1.0e-04 loss: 1.007e-01]hash_cache_v1:   1%|          | 26/3000 [01:32<2:52:59,  3.49s/it, lr: 1.0e-04 loss: 1.007e-01]hash_cache_v1:   1%|          | 26/3000 [01:32<2:52:59,  3.49s/it, lr: 1.0e-04 loss: 1.007e-01]hash_cache_v1:   1%|          | 26/3000 [01:34<2:52:59,  3.49s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:   1%|          | 26/3000 [01:34<2:52:59,  3.49s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:   1%|          | 27/3000 [01:34<2:44:33,  3.32s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:   1%|          | 27/3000 [01:34<2:44:33,  3.32s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:   1%|          | 27/3000 [01:39<2:44:33,  3.32s/it, lr: 1.0e-04 loss: 9.274e-02]hash_cache_v1:   1%|          | 27/3000 [01:39<2:44:33,  3.32s/it, lr: 1.0e-04 loss: 9.274e-02]hash_cache_v1:   1%|          | 28/3000 [01:39<2:59:56,  3.63s/it, lr: 1.0e-04 loss: 9.274e-02]hash_cache_v1:   1%|          | 28/3000 [01:39<2:59:56,  3.63s/it, lr: 1.0e-04 loss: 9.274e-02]hash_cache_v1:   1%|          | 28/3000 [01:43<2:59:56,  3.63s/it, lr: 1.0e-04 loss: 1.334e-01]hash_cache_v1:   1%|          | 28/3000 [01:43<2:59:56,  3.63s/it, lr: 1.0e-04 loss: 1.334e-01]hash_cache_v1:   1%|          | 29/3000 [01:43<3:09:23,  3.82s/it, lr: 1.0e-04 loss: 1.334e-01]hash_cache_v1:   1%|          | 29/3000 [01:43<3:09:23,  3.82s/it, lr: 1.0e-04 loss: 1.334e-01]hash_cache_v1:   1%|          | 29/3000 [01:46<3:09:23,  3.82s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:   1%|          | 29/3000 [01:46<3:09:23,  3.82s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:   1%|1         | 30/3000 [01:48<3:09:19,  3.82s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:   1%|1         | 30/3000 [01:48<3:09:19,  3.82s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:   1%|1         | 31/3000 [01:48<2:06:33,  2.56s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:   1%|1         | 31/3000 [01:48<2:06:33,  2.56s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:   1%|1         | 31/3000 [01:50<2:06:33,  2.56s/it, lr: 1.0e-04 loss: 2.056e-02]hash_cache_v1:   1%|1         | 31/3000 [01:50<2:06:33,  2.56s/it, lr: 1.0e-04 loss: 2.056e-02]hash_cache_v1:   1%|1         | 32/3000 [01:50<2:03:57,  2.51s/it, lr: 1.0e-04 loss: 2.056e-02]hash_cache_v1:   1%|1         | 32/3000 [01:50<2:03:57,  2.51s/it, lr: 1.0e-04 loss: 2.056e-02]hash_cache_v1:   1%|1         | 32/3000 [01:53<2:03:57,  2.51s/it, lr: 1.0e-04 loss: 1.757e-01]hash_cache_v1:   1%|1         | 32/3000 [01:53<2:03:57,  2.51s/it, lr: 1.0e-04 loss: 1.757e-01]hash_cache_v1:   1%|1         | 33/3000 [01:53<2:08:19,  2.60s/it, lr: 1.0e-04 loss: 1.757e-01]hash_cache_v1:   1%|1         | 33/3000 [01:53<2:08:19,  2.60s/it, lr: 1.0e-04 loss: 1.757e-01]hash_cache_v1:   1%|1         | 33/3000 [01:56<2:08:19,  2.60s/it, lr: 1.0e-04 loss: 1.614e-01]hash_cache_v1:   1%|1         | 33/3000 [01:56<2:08:19,  2.60s/it, lr: 1.0e-04 loss: 1.614e-01]hash_cache_v1:   1%|1         | 34/3000 [01:56<2:12:04,  2.67s/it, lr: 1.0e-04 loss: 1.614e-01]hash_cache_v1:   1%|1         | 34/3000 [01:56<2:12:04,  2.67s/it, lr: 1.0e-04 loss: 1.614e-01]hash_cache_v1:   1%|1         | 34/3000 [01:59<2:12:04,  2.67s/it, lr: 1.0e-04 loss: 2.611e-01]hash_cache_v1:   1%|1         | 34/3000 [01:59<2:12:04,  2.67s/it, lr: 1.0e-04 loss: 2.611e-01]hash_cache_v1:   1%|1         | 35/3000 [01:59<2:07:52,  2.59s/it, lr: 1.0e-04 loss: 2.611e-01]hash_cache_v1:   1%|1         | 35/3000 [01:59<2:07:52,  2.59s/it, lr: 1.0e-04 loss: 2.611e-01]hash_cache_v1:   1%|1         | 35/3000 [02:01<2:07:52,  2.59s/it, lr: 1.0e-04 loss: 3.429e-02]hash_cache_v1:   1%|1         | 35/3000 [02:01<2:07:52,  2.59s/it, lr: 1.0e-04 loss: 3.429e-02]hash_cache_v1:   1%|1         | 36/3000 [02:01<2:11:18,  2.66s/it, lr: 1.0e-04 loss: 3.429e-02]hash_cache_v1:   1%|1         | 36/3000 [02:01<2:11:18,  2.66s/it, lr: 1.0e-04 loss: 3.429e-02]hash_cache_v1:   1%|1         | 36/3000 [02:04<2:11:18,  2.66s/it, lr: 1.0e-04 loss: 1.176e-02]hash_cache_v1:   1%|1         | 36/3000 [02:04<2:11:18,  2.66s/it, lr: 1.0e-04 loss: 1.176e-02]hash_cache_v1:   1%|1         | 37/3000 [02:04<2:14:28,  2.72s/it, lr: 1.0e-04 loss: 1.176e-02]hash_cache_v1:   1%|1         | 37/3000 [02:04<2:14:28,  2.72s/it, lr: 1.0e-04 loss: 1.176e-02]hash_cache_v1:   1%|1         | 37/3000 [02:09<2:14:28,  2.72s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:   1%|1         | 37/3000 [02:09<2:14:28,  2.72s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:   1%|1         | 38/3000 [02:09<2:38:42,  3.22s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:   1%|1         | 38/3000 [02:09<2:38:42,  3.22s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:   1%|1         | 38/3000 [02:12<2:38:42,  3.22s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   1%|1         | 38/3000 [02:12<2:38:42,  3.22s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   1%|1         | 39/3000 [02:12<2:36:19,  3.17s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   1%|1         | 39/3000 [02:12<2:36:19,  3.17s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   1%|1         | 39/3000 [02:14<2:36:19,  3.17s/it, lr: 1.0e-04 loss: 3.136e-01]hash_cache_v1:   1%|1         | 39/3000 [02:14<2:36:19,  3.17s/it, lr: 1.0e-04 loss: 3.136e-01]hash_cache_v1:   1%|1         | 40/3000 [02:18<2:36:16,  3.17s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   1%|1         | 40/3000 [02:18<2:36:16,  3.17s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   1%|1         | 41/3000 [02:18<2:12:18,  2.68s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   1%|1         | 41/3000 [02:18<2:12:18,  2.68s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   1%|1         | 41/3000 [02:21<2:12:18,  2.68s/it, lr: 1.0e-04 loss: 2.021e-01]hash_cache_v1:   1%|1         | 41/3000 [02:21<2:12:18,  2.68s/it, lr: 1.0e-04 loss: 2.021e-01]hash_cache_v1:   1%|1         | 42/3000 [02:21<2:16:35,  2.77s/it, lr: 1.0e-04 loss: 2.021e-01]hash_cache_v1:   1%|1         | 42/3000 [02:21<2:16:35,  2.77s/it, lr: 1.0e-04 loss: 2.021e-01]hash_cache_v1:   1%|1         | 42/3000 [02:25<2:16:35,  2.77s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   1%|1         | 42/3000 [02:25<2:16:35,  2.77s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   1%|1         | 43/3000 [02:25<2:36:51,  3.18s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   1%|1         | 43/3000 [02:25<2:36:51,  3.18s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   1%|1         | 43/3000 [02:28<2:36:51,  3.18s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:   1%|1         | 43/3000 [02:28<2:36:51,  3.18s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:   1%|1         | 44/3000 [02:28<2:22:27,  2.89s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:   1%|1         | 44/3000 [02:28<2:22:27,  2.89s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:   1%|1         | 44/3000 [02:30<2:22:27,  2.89s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:   1%|1         | 44/3000 [02:30<2:22:27,  2.89s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:   2%|1         | 45/3000 [02:30<2:22:32,  2.89s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:   2%|1         | 45/3000 [02:30<2:22:32,  2.89s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:   2%|1         | 45/3000 [02:33<2:22:32,  2.89s/it, lr: 1.0e-04 loss: 2.885e-01]hash_cache_v1:   2%|1         | 45/3000 [02:33<2:22:32,  2.89s/it, lr: 1.0e-04 loss: 2.885e-01]hash_cache_v1:   2%|1         | 46/3000 [02:33<2:15:06,  2.74s/it, lr: 1.0e-04 loss: 2.885e-01]hash_cache_v1:   2%|1         | 46/3000 [02:33<2:15:06,  2.74s/it, lr: 1.0e-04 loss: 2.885e-01]hash_cache_v1:   2%|1         | 46/3000 [02:35<2:15:06,  2.74s/it, lr: 1.0e-04 loss: 6.409e-02]hash_cache_v1:   2%|1         | 46/3000 [02:35<2:15:06,  2.74s/it, lr: 1.0e-04 loss: 6.409e-02]hash_cache_v1:   2%|1         | 47/3000 [02:35<2:05:56,  2.56s/it, lr: 1.0e-04 loss: 6.409e-02]hash_cache_v1:   2%|1         | 47/3000 [02:35<2:05:56,  2.56s/it, lr: 1.0e-04 loss: 6.409e-02]hash_cache_v1:   2%|1         | 47/3000 [02:38<2:05:56,  2.56s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   2%|1         | 47/3000 [02:38<2:05:56,  2.56s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   2%|1         | 48/3000 [02:38<2:10:13,  2.65s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   2%|1         | 48/3000 [02:38<2:10:13,  2.65s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   2%|1         | 48/3000 [02:41<2:10:13,  2.65s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:   2%|1         | 48/3000 [02:41<2:10:13,  2.65s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:   2%|1         | 49/3000 [02:41<2:16:10,  2.77s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:   2%|1         | 49/3000 [02:41<2:16:10,  2.77s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:   2%|1         | 49/3000 [02:43<2:16:10,  2.77s/it, lr: 1.0e-04 loss: 3.195e-01]hash_cache_v1:   2%|1         | 49/3000 [02:43<2:16:10,  2.77s/it, lr: 1.0e-04 loss: 3.195e-01]hash_cache_v1:   2%|1         | 50/3000 [02:47<2:16:07,  2.77s/it, lr: 1.0e-04 loss: 1.409e-02]hash_cache_v1:   2%|1         | 50/3000 [02:47<2:16:07,  2.77s/it, lr: 1.0e-04 loss: 1.409e-02]hash_cache_v1:   2%|1         | 51/3000 [02:47<2:02:24,  2.49s/it, lr: 1.0e-04 loss: 1.409e-02]hash_cache_v1:   2%|1         | 51/3000 [02:47<2:02:24,  2.49s/it, lr: 1.0e-04 loss: 1.409e-02]hash_cache_v1:   2%|1         | 51/3000 [02:49<2:02:24,  2.49s/it, lr: 1.0e-04 loss: 3.586e-01]hash_cache_v1:   2%|1         | 51/3000 [02:49<2:02:24,  2.49s/it, lr: 1.0e-04 loss: 3.586e-01]hash_cache_v1:   2%|1         | 52/3000 [02:49<1:57:41,  2.40s/it, lr: 1.0e-04 loss: 3.586e-01]hash_cache_v1:   2%|1         | 52/3000 [02:49<1:57:41,  2.40s/it, lr: 1.0e-04 loss: 3.586e-01]hash_cache_v1:   2%|1         | 52/3000 [02:52<1:57:41,  2.40s/it, lr: 1.0e-04 loss: 2.327e-01]hash_cache_v1:   2%|1         | 52/3000 [02:52<1:57:41,  2.40s/it, lr: 1.0e-04 loss: 2.327e-01]hash_cache_v1:   2%|1         | 53/3000 [02:52<1:57:28,  2.39s/it, lr: 1.0e-04 loss: 2.327e-01]hash_cache_v1:   2%|1         | 53/3000 [02:52<1:57:28,  2.39s/it, lr: 1.0e-04 loss: 2.327e-01]hash_cache_v1:   2%|1         | 53/3000 [02:55<1:57:28,  2.39s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:   2%|1         | 53/3000 [02:55<1:57:28,  2.39s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:   2%|1         | 54/3000 [02:55<2:03:37,  2.52s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:   2%|1         | 54/3000 [02:55<2:03:37,  2.52s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:   2%|1         | 54/3000 [02:57<2:03:37,  2.52s/it, lr: 1.0e-04 loss: 4.211e-02]hash_cache_v1:   2%|1         | 54/3000 [02:57<2:03:37,  2.52s/it, lr: 1.0e-04 loss: 4.211e-02]hash_cache_v1:   2%|1         | 55/3000 [02:57<1:58:11,  2.41s/it, lr: 1.0e-04 loss: 4.211e-02]hash_cache_v1:   2%|1         | 55/3000 [02:57<1:58:11,  2.41s/it, lr: 1.0e-04 loss: 4.211e-02]hash_cache_v1:   2%|1         | 55/3000 [03:01<1:58:11,  2.41s/it, lr: 1.0e-04 loss: 1.045e-01]hash_cache_v1:   2%|1         | 55/3000 [03:01<1:58:11,  2.41s/it, lr: 1.0e-04 loss: 1.045e-01]hash_cache_v1:   2%|1         | 56/3000 [03:01<2:25:43,  2.97s/it, lr: 1.0e-04 loss: 1.045e-01]hash_cache_v1:   2%|1         | 56/3000 [03:01<2:25:43,  2.97s/it, lr: 1.0e-04 loss: 1.045e-01]hash_cache_v1:   2%|1         | 56/3000 [03:04<2:25:43,  2.97s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:   2%|1         | 56/3000 [03:04<2:25:43,  2.97s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:   2%|1         | 57/3000 [03:04<2:17:27,  2.80s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:   2%|1         | 57/3000 [03:04<2:17:27,  2.80s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:   2%|1         | 57/3000 [03:08<2:17:27,  2.80s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:   2%|1         | 57/3000 [03:08<2:17:27,  2.80s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:   2%|1         | 58/3000 [03:08<2:39:26,  3.25s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:   2%|1         | 58/3000 [03:08<2:39:26,  3.25s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:   2%|1         | 58/3000 [03:12<2:39:26,  3.25s/it, lr: 1.0e-04 loss: 1.842e-01]hash_cache_v1:   2%|1         | 58/3000 [03:12<2:39:26,  3.25s/it, lr: 1.0e-04 loss: 1.842e-01]hash_cache_v1:   2%|1         | 59/3000 [03:12<2:54:27,  3.56s/it, lr: 1.0e-04 loss: 1.842e-01]hash_cache_v1:   2%|1         | 59/3000 [03:12<2:54:27,  3.56s/it, lr: 1.0e-04 loss: 1.842e-01]hash_cache_v1:   2%|1         | 59/3000 [03:15<2:54:27,  3.56s/it, lr: 1.0e-04 loss: 2.340e-01]hash_cache_v1:   2%|1         | 59/3000 [03:15<2:54:27,  3.56s/it, lr: 1.0e-04 loss: 2.340e-01]hash_cache_v1:   2%|2         | 60/3000 [03:17<2:54:24,  3.56s/it, lr: 1.0e-04 loss: 3.990e-02]hash_cache_v1:   2%|2         | 60/3000 [03:17<2:54:24,  3.56s/it, lr: 1.0e-04 loss: 3.990e-02]hash_cache_v1:   2%|2         | 61/3000 [03:17<1:58:08,  2.41s/it, lr: 1.0e-04 loss: 3.990e-02]hash_cache_v1:   2%|2         | 61/3000 [03:17<1:58:08,  2.41s/it, lr: 1.0e-04 loss: 3.990e-02]hash_cache_v1:   2%|2         | 61/3000 [03:19<1:58:08,  2.41s/it, lr: 1.0e-04 loss: 2.714e-01]hash_cache_v1:   2%|2         | 61/3000 [03:19<1:58:08,  2.41s/it, lr: 1.0e-04 loss: 2.714e-01]hash_cache_v1:   2%|2         | 62/3000 [03:19<1:54:22,  2.34s/it, lr: 1.0e-04 loss: 2.714e-01]hash_cache_v1:   2%|2         | 62/3000 [03:19<1:54:22,  2.34s/it, lr: 1.0e-04 loss: 2.714e-01]hash_cache_v1:   2%|2         | 62/3000 [03:22<1:54:22,  2.34s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:   2%|2         | 62/3000 [03:22<1:54:22,  2.34s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:   2%|2         | 63/3000 [03:22<2:01:01,  2.47s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:   2%|2         | 63/3000 [03:22<2:01:01,  2.47s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:   2%|2         | 63/3000 [03:25<2:01:01,  2.47s/it, lr: 1.0e-04 loss: 2.955e-01]hash_cache_v1:   2%|2         | 63/3000 [03:25<2:01:01,  2.47s/it, lr: 1.0e-04 loss: 2.955e-01]hash_cache_v1:   2%|2         | 64/3000 [03:25<1:59:35,  2.44s/it, lr: 1.0e-04 loss: 2.955e-01]hash_cache_v1:   2%|2         | 64/3000 [03:25<1:59:35,  2.44s/it, lr: 1.0e-04 loss: 2.955e-01]hash_cache_v1:   2%|2         | 64/3000 [03:28<1:59:35,  2.44s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:   2%|2         | 64/3000 [03:28<1:59:35,  2.44s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:   2%|2         | 65/3000 [03:28<2:05:25,  2.56s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:   2%|2         | 65/3000 [03:28<2:05:25,  2.56s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:   2%|2         | 65/3000 [03:32<2:05:25,  2.56s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:   2%|2         | 65/3000 [03:32<2:05:25,  2.56s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:   2%|2         | 66/3000 [03:32<2:30:01,  3.07s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:   2%|2         | 66/3000 [03:32<2:30:01,  3.07s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:   2%|2         | 66/3000 [03:34<2:30:01,  3.07s/it, lr: 1.0e-04 loss: 9.134e-02]hash_cache_v1:   2%|2         | 66/3000 [03:34<2:30:01,  3.07s/it, lr: 1.0e-04 loss: 9.134e-02]hash_cache_v1:   2%|2         | 67/3000 [03:34<2:20:07,  2.87s/it, lr: 1.0e-04 loss: 9.134e-02]hash_cache_v1:   2%|2         | 67/3000 [03:34<2:20:07,  2.87s/it, lr: 1.0e-04 loss: 9.134e-02]hash_cache_v1:   2%|2         | 67/3000 [03:36<2:20:07,  2.87s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:   2%|2         | 67/3000 [03:36<2:20:07,  2.87s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:   2%|2         | 68/3000 [03:36<2:09:27,  2.65s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:   2%|2         | 68/3000 [03:36<2:09:27,  2.65s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:   2%|2         | 68/3000 [03:41<2:09:27,  2.65s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:   2%|2         | 68/3000 [03:41<2:09:27,  2.65s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:   2%|2         | 69/3000 [03:41<2:32:52,  3.13s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:   2%|2         | 69/3000 [03:41<2:32:52,  3.13s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:   2%|2         | 69/3000 [03:44<2:32:52,  3.13s/it, lr: 1.0e-04 loss: 7.912e-02]hash_cache_v1:   2%|2         | 69/3000 [03:44<2:32:52,  3.13s/it, lr: 1.0e-04 loss: 7.912e-02]hash_cache_v1:   2%|2         | 70/3000 [03:46<2:32:49,  3.13s/it, lr: 1.0e-04 loss: 3.660e-01]hash_cache_v1:   2%|2         | 70/3000 [03:46<2:32:49,  3.13s/it, lr: 1.0e-04 loss: 3.660e-01]hash_cache_v1:   2%|2         | 71/3000 [03:46<1:49:28,  2.24s/it, lr: 1.0e-04 loss: 3.660e-01]hash_cache_v1:   2%|2         | 71/3000 [03:46<1:49:28,  2.24s/it, lr: 1.0e-04 loss: 3.660e-01]hash_cache_v1:   2%|2         | 71/3000 [03:49<1:49:28,  2.24s/it, lr: 1.0e-04 loss: 5.106e-03]hash_cache_v1:   2%|2         | 71/3000 [03:49<1:49:28,  2.24s/it, lr: 1.0e-04 loss: 5.106e-03]hash_cache_v1:   2%|2         | 72/3000 [03:49<1:57:07,  2.40s/it, lr: 1.0e-04 loss: 5.106e-03]hash_cache_v1:   2%|2         | 72/3000 [03:49<1:57:07,  2.40s/it, lr: 1.0e-04 loss: 5.106e-03]hash_cache_v1:   2%|2         | 72/3000 [03:52<1:57:07,  2.40s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   2%|2         | 72/3000 [03:52<1:57:07,  2.40s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   2%|2         | 73/3000 [03:52<2:03:13,  2.53s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   2%|2         | 73/3000 [03:52<2:03:13,  2.53s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   2%|2         | 73/3000 [03:56<2:03:13,  2.53s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   2%|2         | 73/3000 [03:56<2:03:13,  2.53s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   2%|2         | 74/3000 [03:56<2:28:56,  3.05s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   2%|2         | 74/3000 [03:56<2:28:56,  3.05s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   2%|2         | 74/3000 [04:00<2:28:56,  3.05s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:   2%|2         | 74/3000 [04:00<2:28:56,  3.05s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:   2%|2         | 75/3000 [04:00<2:46:13,  3.41s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:   2%|2         | 75/3000 [04:00<2:46:13,  3.41s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:   2%|2         | 75/3000 [04:03<2:46:13,  3.41s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   2%|2         | 75/3000 [04:03<2:46:13,  3.41s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   3%|2         | 76/3000 [04:03<2:27:45,  3.03s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   3%|2         | 76/3000 [04:03<2:27:45,  3.03s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:   3%|2         | 76/3000 [04:07<2:27:45,  3.03s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:   3%|2         | 76/3000 [04:07<2:27:45,  3.03s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:   3%|2         | 77/3000 [04:07<2:45:24,  3.40s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:   3%|2         | 77/3000 [04:07<2:45:24,  3.40s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:   3%|2         | 77/3000 [04:11<2:45:24,  3.40s/it, lr: 1.0e-04 loss: 9.909e-02]hash_cache_v1:   3%|2         | 77/3000 [04:11<2:45:24,  3.40s/it, lr: 1.0e-04 loss: 9.909e-02]hash_cache_v1:   3%|2         | 78/3000 [04:11<3:01:01,  3.72s/it, lr: 1.0e-04 loss: 9.909e-02]hash_cache_v1:   3%|2         | 78/3000 [04:11<3:01:01,  3.72s/it, lr: 1.0e-04 loss: 9.909e-02]hash_cache_v1:   3%|2         | 78/3000 [04:16<3:01:01,  3.72s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:   3%|2         | 78/3000 [04:16<3:01:01,  3.72s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:   3%|2         | 79/3000 [04:16<3:09:44,  3.90s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:   3%|2         | 79/3000 [04:16<3:09:44,  3.90s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:   3%|2         | 79/3000 [04:20<3:09:44,  3.90s/it, lr: 1.0e-04 loss: 3.927e-02]hash_cache_v1:   3%|2         | 79/3000 [04:20<3:09:44,  3.90s/it, lr: 1.0e-04 loss: 3.927e-02]hash_cache_v1:   3%|2         | 80/3000 [04:23<3:09:40,  3.90s/it, lr: 1.0e-04 loss: 2.535e-01]hash_cache_v1:   3%|2         | 80/3000 [04:23<3:09:40,  3.90s/it, lr: 1.0e-04 loss: 2.535e-01]hash_cache_v1:   3%|2         | 81/3000 [04:23<2:15:50,  2.79s/it, lr: 1.0e-04 loss: 2.535e-01]hash_cache_v1:   3%|2         | 81/3000 [04:23<2:15:50,  2.79s/it, lr: 1.0e-04 loss: 2.535e-01]hash_cache_v1:   3%|2         | 81/3000 [04:27<2:15:50,  2.79s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:   3%|2         | 81/3000 [04:27<2:15:50,  2.79s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:   3%|2         | 82/3000 [04:27<2:34:17,  3.17s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:   3%|2         | 82/3000 [04:27<2:34:17,  3.17s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:   3%|2         | 82/3000 [04:29<2:34:17,  3.17s/it, lr: 1.0e-04 loss: 3.177e-01]hash_cache_v1:   3%|2         | 82/3000 [04:29<2:34:17,  3.17s/it, lr: 1.0e-04 loss: 3.177e-01]hash_cache_v1:   3%|2         | 83/3000 [04:29<2:20:39,  2.89s/it, lr: 1.0e-04 loss: 3.177e-01]hash_cache_v1:   3%|2         | 83/3000 [04:29<2:20:39,  2.89s/it, lr: 1.0e-04 loss: 3.177e-01]hash_cache_v1:   3%|2         | 83/3000 [04:32<2:20:39,  2.89s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:   3%|2         | 83/3000 [04:32<2:20:39,  2.89s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:   3%|2         | 84/3000 [04:32<2:20:18,  2.89s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:   3%|2         | 84/3000 [04:32<2:20:18,  2.89s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:   3%|2         | 84/3000 [04:35<2:20:18,  2.89s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:   3%|2         | 84/3000 [04:35<2:20:18,  2.89s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:   3%|2         | 85/3000 [04:35<2:12:33,  2.73s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:   3%|2         | 85/3000 [04:35<2:12:33,  2.73s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:   3%|2         | 85/3000 [04:37<2:12:33,  2.73s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:   3%|2         | 85/3000 [04:37<2:12:33,  2.73s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:   3%|2         | 86/3000 [04:37<2:03:38,  2.55s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:   3%|2         | 86/3000 [04:37<2:03:38,  2.55s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:   3%|2         | 86/3000 [04:39<2:03:38,  2.55s/it, lr: 1.0e-04 loss: 2.632e-01]hash_cache_v1:   3%|2         | 86/3000 [04:39<2:03:38,  2.55s/it, lr: 1.0e-04 loss: 2.632e-01]hash_cache_v1:   3%|2         | 87/3000 [04:39<1:57:03,  2.41s/it, lr: 1.0e-04 loss: 2.632e-01]hash_cache_v1:   3%|2         | 87/3000 [04:39<1:57:03,  2.41s/it, lr: 1.0e-04 loss: 2.632e-01]hash_cache_v1:   3%|2         | 87/3000 [04:41<1:57:03,  2.41s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:   3%|2         | 87/3000 [04:41<1:57:03,  2.41s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:   3%|2         | 88/3000 [04:41<1:56:23,  2.40s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:   3%|2         | 88/3000 [04:41<1:56:23,  2.40s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:   3%|2         | 88/3000 [04:44<1:56:23,  2.40s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:   3%|2         | 88/3000 [04:44<1:56:23,  2.40s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:   3%|2         | 89/3000 [04:44<2:02:37,  2.53s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:   3%|2         | 89/3000 [04:44<2:02:37,  2.53s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:   3%|2         | 89/3000 [04:46<2:02:37,  2.53s/it, lr: 1.0e-04 loss: 9.969e-02]hash_cache_v1:   3%|2         | 89/3000 [04:46<2:02:37,  2.53s/it, lr: 1.0e-04 loss: 9.969e-02]hash_cache_v1:   3%|3         | 90/3000 [04:48<2:02:34,  2.53s/it, lr: 1.0e-04 loss: 8.041e-02]hash_cache_v1:   3%|3         | 90/3000 [04:48<2:02:34,  2.53s/it, lr: 1.0e-04 loss: 8.041e-02]hash_cache_v1:   3%|3         | 91/3000 [04:48<1:29:39,  1.85s/it, lr: 1.0e-04 loss: 8.041e-02]hash_cache_v1:   3%|3         | 91/3000 [04:48<1:29:39,  1.85s/it, lr: 1.0e-04 loss: 8.041e-02]hash_cache_v1:   3%|3         | 91/3000 [04:53<1:29:39,  1.85s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:   3%|3         | 91/3000 [04:53<1:29:39,  1.85s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:   3%|3         | 92/3000 [04:53<2:02:56,  2.54s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:   3%|3         | 92/3000 [04:53<2:02:56,  2.54s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:   3%|3         | 92/3000 [04:56<2:02:56,  2.54s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:   3%|3         | 92/3000 [04:56<2:02:56,  2.54s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:   3%|3         | 93/3000 [04:56<2:06:58,  2.62s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:   3%|3         | 93/3000 [04:56<2:06:58,  2.62s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:   3%|3         | 93/3000 [04:59<2:06:58,  2.62s/it, lr: 1.0e-04 loss: 2.386e-01]hash_cache_v1:   3%|3         | 93/3000 [04:59<2:06:58,  2.62s/it, lr: 1.0e-04 loss: 2.386e-01]hash_cache_v1:   3%|3         | 94/3000 [04:59<2:10:22,  2.69s/it, lr: 1.0e-04 loss: 2.386e-01]hash_cache_v1:   3%|3         | 94/3000 [04:59<2:10:22,  2.69s/it, lr: 1.0e-04 loss: 2.386e-01]hash_cache_v1:   3%|3         | 94/3000 [05:02<2:10:22,  2.69s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:   3%|3         | 94/3000 [05:02<2:10:22,  2.69s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:   3%|3         | 95/3000 [05:02<2:14:38,  2.78s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:   3%|3         | 95/3000 [05:02<2:14:38,  2.78s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:   3%|3         | 95/3000 [05:04<2:14:38,  2.78s/it, lr: 1.0e-04 loss: 2.187e-01]hash_cache_v1:   3%|3         | 95/3000 [05:04<2:14:38,  2.78s/it, lr: 1.0e-04 loss: 2.187e-01]hash_cache_v1:   3%|3         | 96/3000 [05:04<2:04:55,  2.58s/it, lr: 1.0e-04 loss: 2.187e-01]hash_cache_v1:   3%|3         | 96/3000 [05:04<2:04:55,  2.58s/it, lr: 1.0e-04 loss: 2.187e-01]hash_cache_v1:   3%|3         | 96/3000 [05:08<2:04:55,  2.58s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:   3%|3         | 96/3000 [05:08<2:04:55,  2.58s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:   3%|3         | 97/3000 [05:08<2:29:03,  3.08s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:   3%|3         | 97/3000 [05:08<2:29:03,  3.08s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:   3%|3         | 97/3000 [05:13<2:29:03,  3.08s/it, lr: 1.0e-04 loss: 1.929e-01]hash_cache_v1:   3%|3         | 97/3000 [05:13<2:29:03,  3.08s/it, lr: 1.0e-04 loss: 1.929e-01]hash_cache_v1:   3%|3         | 98/3000 [05:13<2:46:36,  3.44s/it, lr: 1.0e-04 loss: 1.929e-01]hash_cache_v1:   3%|3         | 98/3000 [05:13<2:46:36,  3.44s/it, lr: 1.0e-04 loss: 1.929e-01]hash_cache_v1:   3%|3         | 98/3000 [05:17<2:46:36,  3.44s/it, lr: 1.0e-04 loss: 1.995e-01]hash_cache_v1:   3%|3         | 98/3000 [05:17<2:46:36,  3.44s/it, lr: 1.0e-04 loss: 1.995e-01]hash_cache_v1:   3%|3         | 99/3000 [05:17<3:01:39,  3.76s/it, lr: 1.0e-04 loss: 1.995e-01]hash_cache_v1:   3%|3         | 99/3000 [05:17<3:01:39,  3.76s/it, lr: 1.0e-04 loss: 1.995e-01]hash_cache_v1:   3%|3         | 99/3000 [05:20<3:01:39,  3.76s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   3%|3         | 99/3000 [05:20<3:01:39,  3.76s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:   3%|3         | 100/3000 [05:22<3:01:35,  3.76s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:   3%|3         | 100/3000 [05:22<3:01:35,  3.76s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:   3%|3         | 101/3000 [05:22<2:01:37,  2.52s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:   3%|3         | 101/3000 [05:22<2:01:37,  2.52s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:   3%|3         | 101/3000 [05:26<2:01:37,  2.52s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:   3%|3         | 101/3000 [05:26<2:01:37,  2.52s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:   3%|3         | 102/3000 [05:27<2:24:43,  3.00s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:   3%|3         | 102/3000 [05:27<2:24:43,  3.00s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:   3%|3         | 102/3000 [05:29<2:24:43,  3.00s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   3%|3         | 102/3000 [05:29<2:24:43,  3.00s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   3%|3         | 103/3000 [05:29<2:23:08,  2.96s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   3%|3         | 103/3000 [05:29<2:23:08,  2.96s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   3%|3         | 103/3000 [05:34<2:23:08,  2.96s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   3%|3         | 103/3000 [05:34<2:23:08,  2.96s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   3%|3         | 104/3000 [05:34<2:40:41,  3.33s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   3%|3         | 104/3000 [05:34<2:40:41,  3.33s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   3%|3         | 104/3000 [05:37<2:40:41,  3.33s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:   3%|3         | 104/3000 [05:37<2:40:41,  3.33s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:   4%|3         | 105/3000 [05:37<2:34:09,  3.20s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:   4%|3         | 105/3000 [05:37<2:34:09,  3.20s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:   4%|3         | 105/3000 [05:40<2:34:09,  3.20s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:   4%|3         | 105/3000 [05:40<2:34:09,  3.20s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:   4%|3         | 106/3000 [05:40<2:32:25,  3.16s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:   4%|3         | 106/3000 [05:40<2:32:25,  3.16s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:   4%|3         | 106/3000 [05:42<2:32:25,  3.16s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:   4%|3         | 106/3000 [05:42<2:32:25,  3.16s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:   4%|3         | 107/3000 [05:42<2:17:42,  2.86s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:   4%|3         | 107/3000 [05:42<2:17:42,  2.86s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:   4%|3         | 107/3000 [05:45<2:17:42,  2.86s/it, lr: 1.0e-04 loss: 2.259e-01]hash_cache_v1:   4%|3         | 107/3000 [05:45<2:17:42,  2.86s/it, lr: 1.0e-04 loss: 2.259e-01]hash_cache_v1:   4%|3         | 108/3000 [05:45<2:17:57,  2.86s/it, lr: 1.0e-04 loss: 2.259e-01]hash_cache_v1:   4%|3         | 108/3000 [05:45<2:17:57,  2.86s/it, lr: 1.0e-04 loss: 2.259e-01]hash_cache_v1:   4%|3         | 108/3000 [05:47<2:17:57,  2.86s/it, lr: 1.0e-04 loss: 2.856e-01]hash_cache_v1:   4%|3         | 108/3000 [05:47<2:17:57,  2.86s/it, lr: 1.0e-04 loss: 2.856e-01]hash_cache_v1:   4%|3         | 109/3000 [05:47<2:11:08,  2.72s/it, lr: 1.0e-04 loss: 2.856e-01]hash_cache_v1:   4%|3         | 109/3000 [05:47<2:11:08,  2.72s/it, lr: 1.0e-04 loss: 2.856e-01]hash_cache_v1:   4%|3         | 109/3000 [05:51<2:11:08,  2.72s/it, lr: 1.0e-04 loss: 1.892e-01]hash_cache_v1:   4%|3         | 109/3000 [05:51<2:11:08,  2.72s/it, lr: 1.0e-04 loss: 1.892e-01]hash_cache_v1:   4%|3         | 110/3000 [05:53<2:11:05,  2.72s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   4%|3         | 110/3000 [05:53<2:11:05,  2.72s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   4%|3         | 111/3000 [05:53<1:34:19,  1.96s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   4%|3         | 111/3000 [05:53<1:34:19,  1.96s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   4%|3         | 111/3000 [05:55<1:34:19,  1.96s/it, lr: 1.0e-04 loss: 5.406e-02]hash_cache_v1:   4%|3         | 111/3000 [05:55<1:34:19,  1.96s/it, lr: 1.0e-04 loss: 5.406e-02]hash_cache_v1:   4%|3         | 112/3000 [05:55<1:36:04,  2.00s/it, lr: 1.0e-04 loss: 5.406e-02]hash_cache_v1:   4%|3         | 112/3000 [05:55<1:36:04,  2.00s/it, lr: 1.0e-04 loss: 5.406e-02]hash_cache_v1:   4%|3         | 112/3000 [05:58<1:36:04,  2.00s/it, lr: 1.0e-04 loss: 3.248e-01]hash_cache_v1:   4%|3         | 112/3000 [05:58<1:36:04,  2.00s/it, lr: 1.0e-04 loss: 3.248e-01]hash_cache_v1:   4%|3         | 113/3000 [05:58<1:40:58,  2.10s/it, lr: 1.0e-04 loss: 3.248e-01]hash_cache_v1:   4%|3         | 113/3000 [05:58<1:40:58,  2.10s/it, lr: 1.0e-04 loss: 3.248e-01]hash_cache_v1:   4%|3         | 113/3000 [06:01<1:40:58,  2.10s/it, lr: 1.0e-04 loss: 7.988e-02]hash_cache_v1:   4%|3         | 113/3000 [06:01<1:40:58,  2.10s/it, lr: 1.0e-04 loss: 7.988e-02]hash_cache_v1:   4%|3         | 114/3000 [06:01<1:50:43,  2.30s/it, lr: 1.0e-04 loss: 7.988e-02]hash_cache_v1:   4%|3         | 114/3000 [06:01<1:50:43,  2.30s/it, lr: 1.0e-04 loss: 7.988e-02]hash_cache_v1:   4%|3         | 114/3000 [06:04<1:50:43,  2.30s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:   4%|3         | 114/3000 [06:04<1:50:43,  2.30s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:   4%|3         | 115/3000 [06:04<1:58:20,  2.46s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:   4%|3         | 115/3000 [06:04<1:58:20,  2.46s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:   4%|3         | 115/3000 [06:06<1:58:20,  2.46s/it, lr: 1.0e-04 loss: 2.463e-01]hash_cache_v1:   4%|3         | 115/3000 [06:06<1:58:20,  2.46s/it, lr: 1.0e-04 loss: 2.463e-01]hash_cache_v1:   4%|3         | 116/3000 [06:06<1:57:04,  2.44s/it, lr: 1.0e-04 loss: 2.463e-01]hash_cache_v1:   4%|3         | 116/3000 [06:06<1:57:04,  2.44s/it, lr: 1.0e-04 loss: 2.463e-01]hash_cache_v1:   4%|3         | 116/3000 [06:08<1:57:04,  2.44s/it, lr: 1.0e-04 loss: 2.864e-01]hash_cache_v1:   4%|3         | 116/3000 [06:08<1:57:04,  2.44s/it, lr: 1.0e-04 loss: 2.864e-01]hash_cache_v1:   4%|3         | 117/3000 [06:08<1:52:29,  2.34s/it, lr: 1.0e-04 loss: 2.864e-01]hash_cache_v1:   4%|3         | 117/3000 [06:08<1:52:29,  2.34s/it, lr: 1.0e-04 loss: 2.864e-01]hash_cache_v1:   4%|3         | 117/3000 [06:10<1:52:29,  2.34s/it, lr: 1.0e-04 loss: 1.941e-01]hash_cache_v1:   4%|3         | 117/3000 [06:10<1:52:29,  2.34s/it, lr: 1.0e-04 loss: 1.941e-01]hash_cache_v1:   4%|3         | 118/3000 [06:10<1:48:59,  2.27s/it, lr: 1.0e-04 loss: 1.941e-01]hash_cache_v1:   4%|3         | 118/3000 [06:10<1:48:59,  2.27s/it, lr: 1.0e-04 loss: 1.941e-01]hash_cache_v1:   4%|3         | 118/3000 [06:12<1:48:59,  2.27s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:   4%|3         | 118/3000 [06:12<1:48:59,  2.27s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:   4%|3         | 119/3000 [06:12<1:46:36,  2.22s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:   4%|3         | 119/3000 [06:12<1:46:36,  2.22s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:   4%|3         | 119/3000 [06:15<1:46:36,  2.22s/it, lr: 1.0e-04 loss: 2.182e-01]hash_cache_v1:   4%|3         | 119/3000 [06:15<1:46:36,  2.22s/it, lr: 1.0e-04 loss: 2.182e-01]hash_cache_v1:   4%|4         | 120/3000 [06:20<1:46:34,  2.22s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   4%|4         | 120/3000 [06:20<1:46:34,  2.22s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   4%|4         | 121/3000 [06:20<1:45:30,  2.20s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   4%|4         | 121/3000 [06:20<1:45:30,  2.20s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   4%|4         | 121/3000 [06:23<1:45:30,  2.20s/it, lr: 1.0e-04 loss: 2.265e-01]hash_cache_v1:   4%|4         | 121/3000 [06:23<1:45:30,  2.20s/it, lr: 1.0e-04 loss: 2.265e-01]hash_cache_v1:   4%|4         | 122/3000 [06:23<1:53:03,  2.36s/it, lr: 1.0e-04 loss: 2.265e-01]hash_cache_v1:   4%|4         | 122/3000 [06:23<1:53:03,  2.36s/it, lr: 1.0e-04 loss: 2.265e-01]hash_cache_v1:   4%|4         | 122/3000 [06:25<1:53:03,  2.36s/it, lr: 1.0e-04 loss: 3.289e-01]hash_cache_v1:   4%|4         | 122/3000 [06:25<1:53:03,  2.36s/it, lr: 1.0e-04 loss: 3.289e-01]hash_cache_v1:   4%|4         | 123/3000 [06:25<1:53:15,  2.36s/it, lr: 1.0e-04 loss: 3.289e-01]hash_cache_v1:   4%|4         | 123/3000 [06:25<1:53:15,  2.36s/it, lr: 1.0e-04 loss: 3.289e-01]hash_cache_v1:   4%|4         | 123/3000 [06:28<1:53:15,  2.36s/it, lr: 1.0e-04 loss: 2.354e-01]hash_cache_v1:   4%|4         | 123/3000 [06:28<1:53:15,  2.36s/it, lr: 1.0e-04 loss: 2.354e-01]hash_cache_v1:   4%|4         | 124/3000 [06:28<1:59:17,  2.49s/it, lr: 1.0e-04 loss: 2.354e-01]hash_cache_v1:   4%|4         | 124/3000 [06:28<1:59:17,  2.49s/it, lr: 1.0e-04 loss: 2.354e-01]hash_cache_v1:   4%|4         | 124/3000 [06:31<1:59:17,  2.49s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:   4%|4         | 124/3000 [06:31<1:59:17,  2.49s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:   4%|4         | 125/3000 [06:31<2:04:22,  2.60s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:   4%|4         | 125/3000 [06:31<2:04:22,  2.60s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:   4%|4         | 125/3000 [06:33<2:04:22,  2.60s/it, lr: 1.0e-04 loss: 1.327e-01]hash_cache_v1:   4%|4         | 125/3000 [06:33<2:04:22,  2.60s/it, lr: 1.0e-04 loss: 1.327e-01]hash_cache_v1:   4%|4         | 126/3000 [06:33<1:57:41,  2.46s/it, lr: 1.0e-04 loss: 1.327e-01]hash_cache_v1:   4%|4         | 126/3000 [06:33<1:57:41,  2.46s/it, lr: 1.0e-04 loss: 1.327e-01]hash_cache_v1:   4%|4         | 126/3000 [06:35<1:57:41,  2.46s/it, lr: 1.0e-04 loss: 2.922e-01]hash_cache_v1:   4%|4         | 126/3000 [06:35<1:57:41,  2.46s/it, lr: 1.0e-04 loss: 2.922e-01]hash_cache_v1:   4%|4         | 127/3000 [06:35<1:56:27,  2.43s/it, lr: 1.0e-04 loss: 2.922e-01]hash_cache_v1:   4%|4         | 127/3000 [06:35<1:56:27,  2.43s/it, lr: 1.0e-04 loss: 2.922e-01]hash_cache_v1:   4%|4         | 127/3000 [06:37<1:56:27,  2.43s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:   4%|4         | 127/3000 [06:37<1:56:27,  2.43s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:   4%|4         | 128/3000 [06:37<1:51:42,  2.33s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:   4%|4         | 128/3000 [06:37<1:51:42,  2.33s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:   4%|4         | 128/3000 [06:42<1:51:42,  2.33s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:   4%|4         | 128/3000 [06:42<1:51:42,  2.33s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:   4%|4         | 129/3000 [06:42<2:19:21,  2.91s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:   4%|4         | 129/3000 [06:42<2:19:21,  2.91s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:   4%|4         | 129/3000 [06:44<2:19:21,  2.91s/it, lr: 1.0e-04 loss: 2.404e-01]hash_cache_v1:   4%|4         | 129/3000 [06:44<2:19:21,  2.91s/it, lr: 1.0e-04 loss: 2.404e-01]hash_cache_v1:   4%|4         | 130/3000 [06:47<2:19:18,  2.91s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:   4%|4         | 130/3000 [06:47<2:19:18,  2.91s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:   4%|4         | 131/3000 [06:47<1:46:57,  2.24s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:   4%|4         | 131/3000 [06:47<1:46:57,  2.24s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:   4%|4         | 131/3000 [06:50<1:46:57,  2.24s/it, lr: 1.0e-04 loss: 2.402e-01]hash_cache_v1:   4%|4         | 131/3000 [06:50<1:46:57,  2.24s/it, lr: 1.0e-04 loss: 2.402e-01]hash_cache_v1:   4%|4         | 132/3000 [06:50<1:54:22,  2.39s/it, lr: 1.0e-04 loss: 2.402e-01]hash_cache_v1:   4%|4         | 132/3000 [06:50<1:54:22,  2.39s/it, lr: 1.0e-04 loss: 2.402e-01]hash_cache_v1:   4%|4         | 132/3000 [06:55<1:54:22,  2.39s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:   4%|4         | 132/3000 [06:55<1:54:22,  2.39s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:   4%|4         | 133/3000 [06:55<2:18:25,  2.90s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:   4%|4         | 133/3000 [06:55<2:18:25,  2.90s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:   4%|4         | 133/3000 [06:57<2:18:25,  2.90s/it, lr: 1.0e-04 loss: 2.685e-01]hash_cache_v1:   4%|4         | 133/3000 [06:57<2:18:25,  2.90s/it, lr: 1.0e-04 loss: 2.685e-01]hash_cache_v1:   4%|4         | 134/3000 [06:57<2:11:55,  2.76s/it, lr: 1.0e-04 loss: 2.685e-01]hash_cache_v1:   4%|4         | 134/3000 [06:57<2:11:55,  2.76s/it, lr: 1.0e-04 loss: 2.685e-01]hash_cache_v1:   4%|4         | 134/3000 [06:59<2:11:55,  2.76s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:   4%|4         | 134/3000 [06:59<2:11:55,  2.76s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:   4%|4         | 135/3000 [06:59<2:03:15,  2.58s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:   4%|4         | 135/3000 [06:59<2:03:15,  2.58s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:   4%|4         | 135/3000 [07:02<2:03:15,  2.58s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:   4%|4         | 135/3000 [07:02<2:03:15,  2.58s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:   5%|4         | 136/3000 [07:02<2:07:12,  2.67s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:   5%|4         | 136/3000 [07:02<2:07:12,  2.67s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:   5%|4         | 136/3000 [07:04<2:07:12,  2.67s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:   5%|4         | 136/3000 [07:04<2:07:12,  2.67s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:   5%|4         | 137/3000 [07:04<2:03:13,  2.58s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:   5%|4         | 137/3000 [07:04<2:03:13,  2.58s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:   5%|4         | 137/3000 [07:07<2:03:13,  2.58s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:   5%|4         | 137/3000 [07:07<2:03:13,  2.58s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:   5%|4         | 138/3000 [07:07<2:07:25,  2.67s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:   5%|4         | 138/3000 [07:07<2:07:25,  2.67s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:   5%|4         | 138/3000 [07:11<2:07:25,  2.67s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:   5%|4         | 138/3000 [07:11<2:07:25,  2.67s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:   5%|4         | 139/3000 [07:11<2:29:53,  3.14s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:   5%|4         | 139/3000 [07:11<2:29:53,  3.14s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:   5%|4         | 139/3000 [07:14<2:29:53,  3.14s/it, lr: 1.0e-04 loss: 2.249e-01]hash_cache_v1:   5%|4         | 139/3000 [07:14<2:29:53,  3.14s/it, lr: 1.0e-04 loss: 2.249e-01]hash_cache_v1:   5%|4         | 140/3000 [07:17<2:29:49,  3.14s/it, lr: 1.0e-04 loss: 7.086e-02]hash_cache_v1:   5%|4         | 140/3000 [07:17<2:29:49,  3.14s/it, lr: 1.0e-04 loss: 7.086e-02]hash_cache_v1:   5%|4         | 141/3000 [07:17<1:54:49,  2.41s/it, lr: 1.0e-04 loss: 7.086e-02]hash_cache_v1:   5%|4         | 141/3000 [07:17<1:54:49,  2.41s/it, lr: 1.0e-04 loss: 7.086e-02]hash_cache_v1:   5%|4         | 141/3000 [07:22<1:54:49,  2.41s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   5%|4         | 141/3000 [07:22<1:54:49,  2.41s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   5%|4         | 142/3000 [07:22<2:16:45,  2.87s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   5%|4         | 142/3000 [07:22<2:16:45,  2.87s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:   5%|4         | 142/3000 [07:25<2:16:45,  2.87s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   5%|4         | 142/3000 [07:25<2:16:45,  2.87s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   5%|4         | 143/3000 [07:25<2:16:40,  2.87s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   5%|4         | 143/3000 [07:25<2:16:40,  2.87s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:   5%|4         | 143/3000 [07:29<2:16:40,  2.87s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:   5%|4         | 143/3000 [07:29<2:16:40,  2.87s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:   5%|4         | 144/3000 [07:29<2:37:38,  3.31s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:   5%|4         | 144/3000 [07:29<2:37:38,  3.31s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:   5%|4         | 144/3000 [07:31<2:37:38,  3.31s/it, lr: 1.0e-04 loss: 2.679e-01]hash_cache_v1:   5%|4         | 144/3000 [07:31<2:37:38,  3.31s/it, lr: 1.0e-04 loss: 2.679e-01]hash_cache_v1:   5%|4         | 145/3000 [07:31<2:21:34,  2.98s/it, lr: 1.0e-04 loss: 2.679e-01]hash_cache_v1:   5%|4         | 145/3000 [07:31<2:21:34,  2.98s/it, lr: 1.0e-04 loss: 2.679e-01]hash_cache_v1:   5%|4         | 145/3000 [07:35<2:21:34,  2.98s/it, lr: 1.0e-04 loss: 2.527e-02]hash_cache_v1:   5%|4         | 145/3000 [07:35<2:21:34,  2.98s/it, lr: 1.0e-04 loss: 2.527e-02]hash_cache_v1:   5%|4         | 146/3000 [07:35<2:38:19,  3.33s/it, lr: 1.0e-04 loss: 2.527e-02]hash_cache_v1:   5%|4         | 146/3000 [07:35<2:38:19,  3.33s/it, lr: 1.0e-04 loss: 2.527e-02]hash_cache_v1:   5%|4         | 146/3000 [07:40<2:38:19,  3.33s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:   5%|4         | 146/3000 [07:40<2:38:19,  3.33s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:   5%|4         | 147/3000 [07:40<2:54:13,  3.66s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:   5%|4         | 147/3000 [07:40<2:54:13,  3.66s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:   5%|4         | 147/3000 [07:42<2:54:13,  3.66s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   5%|4         | 147/3000 [07:42<2:54:13,  3.66s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   5%|4         | 148/3000 [07:42<2:32:22,  3.21s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   5%|4         | 148/3000 [07:42<2:32:22,  3.21s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:   5%|4         | 148/3000 [07:44<2:32:22,  3.21s/it, lr: 1.0e-04 loss: 2.949e-01]hash_cache_v1:   5%|4         | 148/3000 [07:44<2:32:22,  3.21s/it, lr: 1.0e-04 loss: 2.949e-01]hash_cache_v1:   5%|4         | 149/3000 [07:44<2:16:51,  2.88s/it, lr: 1.0e-04 loss: 2.949e-01]hash_cache_v1:   5%|4         | 149/3000 [07:44<2:16:51,  2.88s/it, lr: 1.0e-04 loss: 2.949e-01]hash_cache_v1:   5%|4         | 149/3000 [07:48<2:16:51,  2.88s/it, lr: 1.0e-04 loss: 2.117e-01]hash_cache_v1:   5%|4         | 149/3000 [07:48<2:16:51,  2.88s/it, lr: 1.0e-04 loss: 2.117e-01]hash_cache_v1:   5%|5         | 150/3000 [07:53<2:16:48,  2.88s/it, lr: 1.0e-04 loss: 2.039e-01]hash_cache_v1:   5%|5         | 150/3000 [07:53<2:16:48,  2.88s/it, lr: 1.0e-04 loss: 2.039e-01]hash_cache_v1:   5%|5         | 151/3000 [07:53<2:03:10,  2.59s/it, lr: 1.0e-04 loss: 2.039e-01]hash_cache_v1:   5%|5         | 151/3000 [07:53<2:03:10,  2.59s/it, lr: 1.0e-04 loss: 2.039e-01]hash_cache_v1:   5%|5         | 151/3000 [07:56<2:03:10,  2.59s/it, lr: 1.0e-04 loss: 2.061e-01]hash_cache_v1:   5%|5         | 151/3000 [07:56<2:03:10,  2.59s/it, lr: 1.0e-04 loss: 2.061e-01]hash_cache_v1:   5%|5         | 152/3000 [07:56<2:04:59,  2.63s/it, lr: 1.0e-04 loss: 2.061e-01]hash_cache_v1:   5%|5         | 152/3000 [07:56<2:04:59,  2.63s/it, lr: 1.0e-04 loss: 2.061e-01]hash_cache_v1:   5%|5         | 152/3000 [08:00<2:04:59,  2.63s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 152/3000 [08:00<2:04:59,  2.63s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 153/3000 [08:00<2:25:56,  3.08s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 153/3000 [08:00<2:25:56,  3.08s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 153/3000 [08:03<2:25:56,  3.08s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 153/3000 [08:03<2:25:56,  3.08s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 154/3000 [08:03<2:23:10,  3.02s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 154/3000 [08:03<2:23:10,  3.02s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:   5%|5         | 154/3000 [08:05<2:23:10,  3.02s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:   5%|5         | 154/3000 [08:05<2:23:10,  3.02s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:   5%|5         | 155/3000 [08:05<2:14:10,  2.83s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:   5%|5         | 155/3000 [08:05<2:14:10,  2.83s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:   5%|5         | 155/3000 [08:09<2:14:10,  2.83s/it, lr: 1.0e-04 loss: 1.277e-01]hash_cache_v1:   5%|5         | 155/3000 [08:09<2:14:10,  2.83s/it, lr: 1.0e-04 loss: 1.277e-01]hash_cache_v1:   5%|5         | 156/3000 [08:09<2:33:43,  3.24s/it, lr: 1.0e-04 loss: 1.277e-01]hash_cache_v1:   5%|5         | 156/3000 [08:09<2:33:43,  3.24s/it, lr: 1.0e-04 loss: 1.277e-01]hash_cache_v1:   5%|5         | 156/3000 [08:12<2:33:43,  3.24s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:   5%|5         | 156/3000 [08:12<2:33:43,  3.24s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:   5%|5         | 157/3000 [08:12<2:28:45,  3.14s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:   5%|5         | 157/3000 [08:12<2:28:45,  3.14s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:   5%|5         | 157/3000 [08:17<2:28:45,  3.14s/it, lr: 1.0e-04 loss: 1.454e-01]hash_cache_v1:   5%|5         | 157/3000 [08:17<2:28:45,  3.14s/it, lr: 1.0e-04 loss: 1.454e-01]hash_cache_v1:   5%|5         | 158/3000 [08:17<2:47:44,  3.54s/it, lr: 1.0e-04 loss: 1.454e-01]hash_cache_v1:   5%|5         | 158/3000 [08:17<2:47:44,  3.54s/it, lr: 1.0e-04 loss: 1.454e-01]hash_cache_v1:   5%|5         | 158/3000 [08:20<2:47:44,  3.54s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:   5%|5         | 158/3000 [08:20<2:47:44,  3.54s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:   5%|5         | 159/3000 [08:20<2:36:42,  3.31s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:   5%|5         | 159/3000 [08:20<2:36:42,  3.31s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:   5%|5         | 159/3000 [08:22<2:36:42,  3.31s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:   5%|5         | 159/3000 [08:22<2:36:42,  3.31s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:   5%|5         | 160/3000 [08:24<2:36:38,  3.31s/it, lr: 1.0e-04 loss: 2.952e-01]hash_cache_v1:   5%|5         | 160/3000 [08:24<2:36:38,  3.31s/it, lr: 1.0e-04 loss: 2.952e-01]hash_cache_v1:   5%|5         | 161/3000 [08:24<1:47:33,  2.27s/it, lr: 1.0e-04 loss: 2.952e-01]hash_cache_v1:   5%|5         | 161/3000 [08:24<1:47:33,  2.27s/it, lr: 1.0e-04 loss: 2.952e-01]hash_cache_v1:   5%|5         | 161/3000 [08:27<1:47:33,  2.27s/it, lr: 1.0e-04 loss: 2.217e-01]hash_cache_v1:   5%|5         | 161/3000 [08:27<1:47:33,  2.27s/it, lr: 1.0e-04 loss: 2.217e-01]hash_cache_v1:   5%|5         | 162/3000 [08:27<1:56:41,  2.47s/it, lr: 1.0e-04 loss: 2.217e-01]hash_cache_v1:   5%|5         | 162/3000 [08:27<1:56:41,  2.47s/it, lr: 1.0e-04 loss: 2.217e-01]hash_cache_v1:   5%|5         | 162/3000 [08:30<1:56:41,  2.47s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:   5%|5         | 162/3000 [08:30<1:56:41,  2.47s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:   5%|5         | 163/3000 [08:30<2:01:50,  2.58s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:   5%|5         | 163/3000 [08:30<2:01:50,  2.58s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:   5%|5         | 163/3000 [08:34<2:01:50,  2.58s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:   5%|5         | 163/3000 [08:34<2:01:50,  2.58s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:   5%|5         | 164/3000 [08:34<2:23:45,  3.04s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:   5%|5         | 164/3000 [08:34<2:23:45,  3.04s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:   5%|5         | 164/3000 [08:37<2:23:45,  3.04s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:   5%|5         | 164/3000 [08:37<2:23:45,  3.04s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:   6%|5         | 165/3000 [08:37<2:23:39,  3.04s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:   6%|5         | 165/3000 [08:37<2:23:39,  3.04s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:   6%|5         | 165/3000 [08:41<2:23:39,  3.04s/it, lr: 1.0e-04 loss: 1.973e-01]hash_cache_v1:   6%|5         | 165/3000 [08:41<2:23:39,  3.04s/it, lr: 1.0e-04 loss: 1.973e-01]hash_cache_v1:   6%|5         | 166/3000 [08:41<2:40:56,  3.41s/it, lr: 1.0e-04 loss: 1.973e-01]hash_cache_v1:   6%|5         | 166/3000 [08:41<2:40:56,  3.41s/it, lr: 1.0e-04 loss: 1.973e-01]hash_cache_v1:   6%|5         | 166/3000 [08:46<2:40:56,  3.41s/it, lr: 1.0e-04 loss: 1.911e-01]hash_cache_v1:   6%|5         | 166/3000 [08:46<2:40:56,  3.41s/it, lr: 1.0e-04 loss: 1.911e-01]hash_cache_v1:   6%|5         | 167/3000 [08:46<2:53:23,  3.67s/it, lr: 1.0e-04 loss: 1.911e-01]hash_cache_v1:   6%|5         | 167/3000 [08:46<2:53:23,  3.67s/it, lr: 1.0e-04 loss: 1.911e-01]hash_cache_v1:   6%|5         | 167/3000 [08:50<2:53:23,  3.67s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:   6%|5         | 167/3000 [08:50<2:53:23,  3.67s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:   6%|5         | 168/3000 [08:50<3:02:32,  3.87s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:   6%|5         | 168/3000 [08:50<3:02:32,  3.87s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:   6%|5         | 168/3000 [08:55<3:02:32,  3.87s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:   6%|5         | 168/3000 [08:55<3:02:32,  3.87s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:   6%|5         | 169/3000 [08:55<3:11:27,  4.06s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:   6%|5         | 169/3000 [08:55<3:11:27,  4.06s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:   6%|5         | 169/3000 [08:59<3:11:27,  4.06s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:   6%|5         | 169/3000 [08:59<3:11:27,  4.06s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:   6%|5         | 170/3000 [09:03<3:11:23,  4.06s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:   6%|5         | 170/3000 [09:03<3:11:23,  4.06s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:   6%|5         | 171/3000 [09:03<2:30:27,  3.19s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:   6%|5         | 171/3000 [09:03<2:30:27,  3.19s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:   6%|5         | 171/3000 [09:08<2:30:27,  3.19s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   6%|5         | 171/3000 [09:08<2:30:27,  3.19s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   6%|5         | 172/3000 [09:08<2:45:39,  3.51s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   6%|5         | 172/3000 [09:08<2:45:39,  3.51s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:   6%|5         | 172/3000 [09:12<2:45:39,  3.51s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:   6%|5         | 172/3000 [09:12<2:45:39,  3.51s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:   6%|5         | 173/3000 [09:12<2:56:03,  3.74s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:   6%|5         | 173/3000 [09:12<2:56:03,  3.74s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:   6%|5         | 173/3000 [09:15<2:56:03,  3.74s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:   6%|5         | 173/3000 [09:15<2:56:03,  3.74s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:   6%|5         | 174/3000 [09:15<2:45:14,  3.51s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:   6%|5         | 174/3000 [09:15<2:45:14,  3.51s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:   6%|5         | 174/3000 [09:17<2:45:14,  3.51s/it, lr: 1.0e-04 loss: 2.539e-01]hash_cache_v1:   6%|5         | 174/3000 [09:17<2:45:14,  3.51s/it, lr: 1.0e-04 loss: 2.539e-01]hash_cache_v1:   6%|5         | 175/3000 [09:17<2:26:40,  3.12s/it, lr: 1.0e-04 loss: 2.539e-01]hash_cache_v1:   6%|5         | 175/3000 [09:17<2:26:40,  3.12s/it, lr: 1.0e-04 loss: 2.539e-01]hash_cache_v1:   6%|5         | 175/3000 [09:22<2:26:40,  3.12s/it, lr: 1.0e-04 loss: 1.977e-01]hash_cache_v1:   6%|5         | 175/3000 [09:22<2:26:40,  3.12s/it, lr: 1.0e-04 loss: 1.977e-01]hash_cache_v1:   6%|5         | 176/3000 [09:22<2:45:48,  3.52s/it, lr: 1.0e-04 loss: 1.977e-01]hash_cache_v1:   6%|5         | 176/3000 [09:22<2:45:48,  3.52s/it, lr: 1.0e-04 loss: 1.977e-01]hash_cache_v1:   6%|5         | 176/3000 [09:24<2:45:48,  3.52s/it, lr: 1.0e-04 loss: 2.891e-01]hash_cache_v1:   6%|5         | 176/3000 [09:24<2:45:48,  3.52s/it, lr: 1.0e-04 loss: 2.891e-01]hash_cache_v1:   6%|5         | 177/3000 [09:24<2:26:30,  3.11s/it, lr: 1.0e-04 loss: 2.891e-01]hash_cache_v1:   6%|5         | 177/3000 [09:24<2:26:30,  3.11s/it, lr: 1.0e-04 loss: 2.891e-01]hash_cache_v1:   6%|5         | 177/3000 [09:26<2:26:30,  3.11s/it, lr: 1.0e-04 loss: 3.015e-01]hash_cache_v1:   6%|5         | 177/3000 [09:26<2:26:30,  3.11s/it, lr: 1.0e-04 loss: 3.015e-01]hash_cache_v1:   6%|5         | 178/3000 [09:26<2:12:38,  2.82s/it, lr: 1.0e-04 loss: 3.015e-01]hash_cache_v1:   6%|5         | 178/3000 [09:26<2:12:38,  2.82s/it, lr: 1.0e-04 loss: 3.015e-01]hash_cache_v1:   6%|5         | 178/3000 [09:28<2:12:38,  2.82s/it, lr: 1.0e-04 loss: 9.212e-02]hash_cache_v1:   6%|5         | 178/3000 [09:28<2:12:38,  2.82s/it, lr: 1.0e-04 loss: 9.212e-02]hash_cache_v1:   6%|5         | 179/3000 [09:28<2:06:34,  2.69s/it, lr: 1.0e-04 loss: 9.212e-02]hash_cache_v1:   6%|5         | 179/3000 [09:28<2:06:34,  2.69s/it, lr: 1.0e-04 loss: 9.212e-02]hash_cache_v1:   6%|5         | 179/3000 [09:31<2:06:34,  2.69s/it, lr: 1.0e-04 loss: 2.473e-01]hash_cache_v1:   6%|5         | 179/3000 [09:31<2:06:34,  2.69s/it, lr: 1.0e-04 loss: 2.473e-01]hash_cache_v1:   6%|6         | 180/3000 [09:33<2:06:32,  2.69s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:   6%|6         | 180/3000 [09:33<2:06:32,  2.69s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:   6%|6         | 181/3000 [09:33<1:31:22,  1.94s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:   6%|6         | 181/3000 [09:33<1:31:22,  1.94s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:   6%|6         | 181/3000 [09:36<1:31:22,  1.94s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:   6%|6         | 181/3000 [09:36<1:31:22,  1.94s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:   6%|6         | 182/3000 [09:36<1:32:59,  1.98s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:   6%|6         | 182/3000 [09:36<1:32:59,  1.98s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:   6%|6         | 182/3000 [09:39<1:32:59,  1.98s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:   6%|6         | 182/3000 [09:39<1:32:59,  1.98s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:   6%|6         | 183/3000 [09:39<1:47:44,  2.29s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:   6%|6         | 183/3000 [09:39<1:47:44,  2.29s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:   6%|6         | 183/3000 [09:43<1:47:44,  2.29s/it, lr: 1.0e-04 loss: 1.258e-01]hash_cache_v1:   6%|6         | 183/3000 [09:43<1:47:44,  2.29s/it, lr: 1.0e-04 loss: 1.258e-01]hash_cache_v1:   6%|6         | 184/3000 [09:43<2:13:23,  2.84s/it, lr: 1.0e-04 loss: 1.258e-01]hash_cache_v1:   6%|6         | 184/3000 [09:43<2:13:23,  2.84s/it, lr: 1.0e-04 loss: 1.258e-01]hash_cache_v1:   6%|6         | 184/3000 [09:46<2:13:23,  2.84s/it, lr: 1.0e-04 loss: 1.651e-01]hash_cache_v1:   6%|6         | 184/3000 [09:46<2:13:23,  2.84s/it, lr: 1.0e-04 loss: 1.651e-01]hash_cache_v1:   6%|6         | 185/3000 [09:46<2:12:14,  2.82s/it, lr: 1.0e-04 loss: 1.651e-01]hash_cache_v1:   6%|6         | 185/3000 [09:46<2:12:14,  2.82s/it, lr: 1.0e-04 loss: 1.651e-01]hash_cache_v1:   6%|6         | 185/3000 [09:50<2:12:14,  2.82s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:   6%|6         | 185/3000 [09:50<2:12:14,  2.82s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:   6%|6         | 186/3000 [09:50<2:34:33,  3.30s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:   6%|6         | 186/3000 [09:50<2:34:33,  3.30s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:   6%|6         | 186/3000 [09:55<2:34:33,  3.30s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:   6%|6         | 186/3000 [09:55<2:34:33,  3.30s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:   6%|6         | 187/3000 [09:55<2:49:07,  3.61s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:   6%|6         | 187/3000 [09:55<2:49:07,  3.61s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:   6%|6         | 187/3000 [09:59<2:49:07,  3.61s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:   6%|6         | 187/3000 [09:59<2:49:07,  3.61s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:   6%|6         | 188/3000 [09:59<2:58:47,  3.82s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:   6%|6         | 188/3000 [09:59<2:58:47,  3.82s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:   6%|6         | 188/3000 [10:03<2:58:47,  3.82s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:   6%|6         | 188/3000 [10:03<2:58:47,  3.82s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:   6%|6         | 189/3000 [10:03<3:05:38,  3.96s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:   6%|6         | 189/3000 [10:03<3:05:38,  3.96s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:   6%|6         | 189/3000 [10:06<3:05:38,  3.96s/it, lr: 1.0e-04 loss: 2.294e-01]hash_cache_v1:   6%|6         | 189/3000 [10:06<3:05:38,  3.96s/it, lr: 1.0e-04 loss: 2.294e-01]hash_cache_v1:   6%|6         | 190/3000 [10:08<3:05:34,  3.96s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:   6%|6         | 190/3000 [10:08<3:05:34,  3.96s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:   6%|6         | 191/3000 [10:08<2:03:14,  2.63s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:   6%|6         | 191/3000 [10:08<2:03:14,  2.63s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:   6%|6         | 191/3000 [10:11<2:03:14,  2.63s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   6%|6         | 191/3000 [10:11<2:03:14,  2.63s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   6%|6         | 192/3000 [10:11<2:05:41,  2.69s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   6%|6         | 192/3000 [10:11<2:05:41,  2.69s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:   6%|6         | 192/3000 [10:14<2:05:41,  2.69s/it, lr: 1.0e-04 loss: 6.131e-02]hash_cache_v1:   6%|6         | 192/3000 [10:14<2:05:41,  2.69s/it, lr: 1.0e-04 loss: 6.131e-02]hash_cache_v1:   6%|6         | 193/3000 [10:14<2:09:58,  2.78s/it, lr: 1.0e-04 loss: 6.131e-02]hash_cache_v1:   6%|6         | 193/3000 [10:14<2:09:58,  2.78s/it, lr: 1.0e-04 loss: 6.131e-02]hash_cache_v1:   6%|6         | 193/3000 [10:19<2:09:58,  2.78s/it, lr: 1.0e-04 loss: 8.296e-02]hash_cache_v1:   6%|6         | 193/3000 [10:19<2:09:58,  2.78s/it, lr: 1.0e-04 loss: 8.296e-02]hash_cache_v1:   6%|6         | 194/3000 [10:19<2:29:06,  3.19s/it, lr: 1.0e-04 loss: 8.296e-02]hash_cache_v1:   6%|6         | 194/3000 [10:19<2:29:06,  3.19s/it, lr: 1.0e-04 loss: 8.296e-02]hash_cache_v1:   6%|6         | 194/3000 [10:22<2:29:06,  3.19s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:   6%|6         | 194/3000 [10:22<2:29:06,  3.19s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:   6%|6         | 195/3000 [10:22<2:25:07,  3.10s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:   6%|6         | 195/3000 [10:22<2:25:07,  3.10s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:   6%|6         | 195/3000 [10:25<2:25:07,  3.10s/it, lr: 1.0e-04 loss: 6.399e-02]hash_cache_v1:   6%|6         | 195/3000 [10:25<2:25:07,  3.10s/it, lr: 1.0e-04 loss: 6.399e-02]hash_cache_v1:   7%|6         | 196/3000 [10:25<2:24:43,  3.10s/it, lr: 1.0e-04 loss: 6.399e-02]hash_cache_v1:   7%|6         | 196/3000 [10:25<2:24:43,  3.10s/it, lr: 1.0e-04 loss: 6.399e-02]hash_cache_v1:   7%|6         | 196/3000 [10:27<2:24:43,  3.10s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:   7%|6         | 196/3000 [10:27<2:24:43,  3.10s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:   7%|6         | 197/3000 [10:27<2:21:43,  3.03s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:   7%|6         | 197/3000 [10:27<2:21:43,  3.03s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:   7%|6         | 197/3000 [10:32<2:21:43,  3.03s/it, lr: 1.0e-04 loss: 1.629e-01]hash_cache_v1:   7%|6         | 197/3000 [10:32<2:21:43,  3.03s/it, lr: 1.0e-04 loss: 1.629e-01]hash_cache_v1:   7%|6         | 198/3000 [10:32<2:39:34,  3.42s/it, lr: 1.0e-04 loss: 1.629e-01]hash_cache_v1:   7%|6         | 198/3000 [10:32<2:39:34,  3.42s/it, lr: 1.0e-04 loss: 1.629e-01]hash_cache_v1:   7%|6         | 198/3000 [10:35<2:39:34,  3.42s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:   7%|6         | 198/3000 [10:35<2:39:34,  3.42s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:   7%|6         | 199/3000 [10:35<2:31:37,  3.25s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:   7%|6         | 199/3000 [10:35<2:31:37,  3.25s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:   7%|6         | 199/3000 [10:39<2:31:37,  3.25s/it, lr: 1.0e-04 loss: 1.584e-01]hash_cache_v1:   7%|6         | 199/3000 [10:39<2:31:37,  3.25s/it, lr: 1.0e-04 loss: 1.584e-01]hash_cache_v1:   7%|6         | 200/3000 [10:41<2:31:34,  3.25s/it, lr: 1.0e-04 loss: 2.903e-01]hash_cache_v1:   7%|6         | 200/3000 [10:41<2:31:34,  3.25s/it, lr: 1.0e-04 loss: 2.903e-01]hash_cache_v1:   7%|6         | 201/3000 [10:41<1:44:52,  2.25s/it, lr: 1.0e-04 loss: 2.903e-01]hash_cache_v1:   7%|6         | 201/3000 [10:41<1:44:52,  2.25s/it, lr: 1.0e-04 loss: 2.903e-01]hash_cache_v1:   7%|6         | 201/3000 [10:43<1:44:52,  2.25s/it, lr: 1.0e-04 loss: 2.712e-01]hash_cache_v1:   7%|6         | 201/3000 [10:43<1:44:52,  2.25s/it, lr: 1.0e-04 loss: 2.712e-01]hash_cache_v1:   7%|6         | 202/3000 [10:43<1:43:21,  2.22s/it, lr: 1.0e-04 loss: 2.712e-01]hash_cache_v1:   7%|6         | 202/3000 [10:43<1:43:21,  2.22s/it, lr: 1.0e-04 loss: 2.712e-01]hash_cache_v1:   7%|6         | 202/3000 [10:48<1:43:21,  2.22s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:   7%|6         | 202/3000 [10:48<1:43:21,  2.22s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:   7%|6         | 203/3000 [10:48<2:09:00,  2.77s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:   7%|6         | 203/3000 [10:48<2:09:00,  2.77s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:   7%|6         | 203/3000 [10:52<2:09:00,  2.77s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:   7%|6         | 203/3000 [10:52<2:09:00,  2.77s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:   7%|6         | 204/3000 [10:52<2:31:21,  3.25s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:   7%|6         | 204/3000 [10:52<2:31:21,  3.25s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:   7%|6         | 204/3000 [10:54<2:31:21,  3.25s/it, lr: 1.0e-04 loss: 2.031e-01]hash_cache_v1:   7%|6         | 204/3000 [10:54<2:31:21,  3.25s/it, lr: 1.0e-04 loss: 2.031e-01]hash_cache_v1:   7%|6         | 205/3000 [10:54<2:16:33,  2.93s/it, lr: 1.0e-04 loss: 2.031e-01]hash_cache_v1:   7%|6         | 205/3000 [10:54<2:16:33,  2.93s/it, lr: 1.0e-04 loss: 2.031e-01]hash_cache_v1:   7%|6         | 205/3000 [10:57<2:16:33,  2.93s/it, lr: 1.0e-04 loss: 3.105e-01]hash_cache_v1:   7%|6         | 205/3000 [10:57<2:16:33,  2.93s/it, lr: 1.0e-04 loss: 3.105e-01]hash_cache_v1:   7%|6         | 206/3000 [10:57<2:05:35,  2.70s/it, lr: 1.0e-04 loss: 3.105e-01]hash_cache_v1:   7%|6         | 206/3000 [10:57<2:05:35,  2.70s/it, lr: 1.0e-04 loss: 3.105e-01]hash_cache_v1:   7%|6         | 206/3000 [11:00<2:05:35,  2.70s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:   7%|6         | 206/3000 [11:00<2:05:35,  2.70s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:   7%|6         | 207/3000 [11:00<2:10:39,  2.81s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:   7%|6         | 207/3000 [11:00<2:10:39,  2.81s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:   7%|6         | 207/3000 [11:04<2:10:39,  2.81s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:   7%|6         | 207/3000 [11:04<2:10:39,  2.81s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:   7%|6         | 208/3000 [11:04<2:31:31,  3.26s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:   7%|6         | 208/3000 [11:04<2:31:31,  3.26s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:   7%|6         | 208/3000 [11:08<2:31:31,  3.26s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:   7%|6         | 208/3000 [11:08<2:31:31,  3.26s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:   7%|6         | 209/3000 [11:08<2:45:33,  3.56s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:   7%|6         | 209/3000 [11:08<2:45:33,  3.56s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:   7%|6         | 209/3000 [11:13<2:45:33,  3.56s/it, lr: 1.0e-04 loss: 1.355e-01]hash_cache_v1:   7%|6         | 209/3000 [11:13<2:45:33,  3.56s/it, lr: 1.0e-04 loss: 1.355e-01]hash_cache_v1:   7%|7         | 210/3000 [11:16<2:45:30,  3.56s/it, lr: 1.0e-04 loss: 2.234e-01]hash_cache_v1:   7%|7         | 210/3000 [11:16<2:45:30,  3.56s/it, lr: 1.0e-04 loss: 2.234e-01]hash_cache_v1:   7%|7         | 211/3000 [11:16<2:02:52,  2.64s/it, lr: 1.0e-04 loss: 2.234e-01]hash_cache_v1:   7%|7         | 211/3000 [11:16<2:02:52,  2.64s/it, lr: 1.0e-04 loss: 2.234e-01]hash_cache_v1:   7%|7         | 211/3000 [11:19<2:02:52,  2.64s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   7%|7         | 211/3000 [11:19<2:02:52,  2.64s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   7%|7         | 212/3000 [11:19<2:05:51,  2.71s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   7%|7         | 212/3000 [11:19<2:05:51,  2.71s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   7%|7         | 212/3000 [11:21<2:05:51,  2.71s/it, lr: 1.0e-04 loss: 7.007e-02]hash_cache_v1:   7%|7         | 212/3000 [11:21<2:05:51,  2.71s/it, lr: 1.0e-04 loss: 7.007e-02]hash_cache_v1:   7%|7         | 213/3000 [11:21<2:07:54,  2.75s/it, lr: 1.0e-04 loss: 7.007e-02]hash_cache_v1:   7%|7         | 213/3000 [11:21<2:07:54,  2.75s/it, lr: 1.0e-04 loss: 7.007e-02]hash_cache_v1:   7%|7         | 213/3000 [11:24<2:07:54,  2.75s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:   7%|7         | 213/3000 [11:24<2:07:54,  2.75s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:   7%|7         | 214/3000 [11:24<2:10:40,  2.81s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:   7%|7         | 214/3000 [11:24<2:10:40,  2.81s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:   7%|7         | 214/3000 [11:27<2:10:40,  2.81s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:   7%|7         | 214/3000 [11:27<2:10:40,  2.81s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:   7%|7         | 215/3000 [11:27<2:01:29,  2.62s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:   7%|7         | 215/3000 [11:27<2:01:29,  2.62s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:   7%|7         | 215/3000 [11:31<2:01:29,  2.62s/it, lr: 1.0e-04 loss: 7.343e-02]hash_cache_v1:   7%|7         | 215/3000 [11:31<2:01:29,  2.62s/it, lr: 1.0e-04 loss: 7.343e-02]hash_cache_v1:   7%|7         | 216/3000 [11:31<2:24:06,  3.11s/it, lr: 1.0e-04 loss: 7.343e-02]hash_cache_v1:   7%|7         | 216/3000 [11:31<2:24:06,  3.11s/it, lr: 1.0e-04 loss: 7.343e-02]hash_cache_v1:   7%|7         | 216/3000 [11:33<2:24:06,  3.11s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:   7%|7         | 216/3000 [11:33<2:24:06,  3.11s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:   7%|7         | 217/3000 [11:33<2:10:43,  2.82s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:   7%|7         | 217/3000 [11:33<2:10:43,  2.82s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:   7%|7         | 217/3000 [11:38<2:10:43,  2.82s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:   7%|7         | 217/3000 [11:38<2:10:43,  2.82s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:   7%|7         | 218/3000 [11:38<2:34:06,  3.32s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:   7%|7         | 218/3000 [11:38<2:34:06,  3.32s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:   7%|7         | 218/3000 [11:42<2:34:06,  3.32s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   7%|7         | 218/3000 [11:42<2:34:06,  3.32s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   7%|7         | 219/3000 [11:42<2:47:23,  3.61s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   7%|7         | 219/3000 [11:42<2:47:23,  3.61s/it, lr: 1.0e-04 loss: 1.689e-01]hash_cache_v1:   7%|7         | 219/3000 [11:45<2:47:23,  3.61s/it, lr: 1.0e-04 loss: 2.438e-01]hash_cache_v1:   7%|7         | 219/3000 [11:45<2:47:23,  3.61s/it, lr: 1.0e-04 loss: 2.438e-01]hash_cache_v1:   7%|7         | 220/3000 [11:47<2:47:20,  3.61s/it, lr: 1.0e-04 loss: 2.909e-01]hash_cache_v1:   7%|7         | 220/3000 [11:47<2:47:20,  3.61s/it, lr: 1.0e-04 loss: 2.909e-01]hash_cache_v1:   7%|7         | 221/3000 [11:47<1:56:09,  2.51s/it, lr: 1.0e-04 loss: 2.909e-01]hash_cache_v1:   7%|7         | 221/3000 [11:47<1:56:09,  2.51s/it, lr: 1.0e-04 loss: 2.909e-01]hash_cache_v1:   7%|7         | 221/3000 [11:51<1:56:09,  2.51s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:   7%|7         | 221/3000 [11:51<1:56:09,  2.51s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:   7%|7         | 222/3000 [11:51<2:16:51,  2.96s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:   7%|7         | 222/3000 [11:51<2:16:51,  2.96s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:   7%|7         | 222/3000 [11:53<2:16:51,  2.96s/it, lr: 1.0e-04 loss: 2.662e-01]hash_cache_v1:   7%|7         | 222/3000 [11:53<2:16:51,  2.96s/it, lr: 1.0e-04 loss: 2.662e-01]hash_cache_v1:   7%|7         | 223/3000 [11:53<2:06:31,  2.73s/it, lr: 1.0e-04 loss: 2.662e-01]hash_cache_v1:   7%|7         | 223/3000 [11:53<2:06:31,  2.73s/it, lr: 1.0e-04 loss: 2.662e-01]hash_cache_v1:   7%|7         | 223/3000 [11:56<2:06:31,  2.73s/it, lr: 1.0e-04 loss: 2.476e-01]hash_cache_v1:   7%|7         | 223/3000 [11:56<2:06:31,  2.73s/it, lr: 1.0e-04 loss: 2.476e-01]hash_cache_v1:   7%|7         | 224/3000 [11:56<1:58:41,  2.57s/it, lr: 1.0e-04 loss: 2.476e-01]hash_cache_v1:   7%|7         | 224/3000 [11:56<1:58:41,  2.57s/it, lr: 1.0e-04 loss: 2.476e-01]hash_cache_v1:   7%|7         | 224/3000 [11:59<1:58:41,  2.57s/it, lr: 1.0e-04 loss: 1.599e-01]hash_cache_v1:   7%|7         | 224/3000 [11:59<1:58:41,  2.57s/it, lr: 1.0e-04 loss: 1.599e-01]hash_cache_v1:   8%|7         | 225/3000 [11:59<2:05:35,  2.72s/it, lr: 1.0e-04 loss: 1.599e-01]hash_cache_v1:   8%|7         | 225/3000 [11:59<2:05:35,  2.72s/it, lr: 1.0e-04 loss: 1.599e-01]hash_cache_v1:   8%|7         | 225/3000 [12:03<2:05:35,  2.72s/it, lr: 1.0e-04 loss: 1.889e-01]hash_cache_v1:   8%|7         | 225/3000 [12:03<2:05:35,  2.72s/it, lr: 1.0e-04 loss: 1.889e-01]hash_cache_v1:   8%|7         | 226/3000 [12:03<2:26:50,  3.18s/it, lr: 1.0e-04 loss: 1.889e-01]hash_cache_v1:   8%|7         | 226/3000 [12:03<2:26:50,  3.18s/it, lr: 1.0e-04 loss: 1.889e-01]hash_cache_v1:   8%|7         | 226/3000 [12:05<2:26:50,  3.18s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:   8%|7         | 226/3000 [12:05<2:26:50,  3.18s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:   8%|7         | 227/3000 [12:05<2:12:27,  2.87s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:   8%|7         | 227/3000 [12:05<2:12:27,  2.87s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:   8%|7         | 227/3000 [12:07<2:12:27,  2.87s/it, lr: 1.0e-04 loss: 3.155e-01]hash_cache_v1:   8%|7         | 227/3000 [12:07<2:12:27,  2.87s/it, lr: 1.0e-04 loss: 3.155e-01]hash_cache_v1:   8%|7         | 228/3000 [12:07<2:05:48,  2.72s/it, lr: 1.0e-04 loss: 3.155e-01]hash_cache_v1:   8%|7         | 228/3000 [12:07<2:05:48,  2.72s/it, lr: 1.0e-04 loss: 3.155e-01]hash_cache_v1:   8%|7         | 228/3000 [12:10<2:05:48,  2.72s/it, lr: 1.0e-04 loss: 1.646e-01]hash_cache_v1:   8%|7         | 228/3000 [12:10<2:05:48,  2.72s/it, lr: 1.0e-04 loss: 1.646e-01]hash_cache_v1:   8%|7         | 229/3000 [12:10<2:07:39,  2.76s/it, lr: 1.0e-04 loss: 1.646e-01]hash_cache_v1:   8%|7         | 229/3000 [12:10<2:07:39,  2.76s/it, lr: 1.0e-04 loss: 1.646e-01]hash_cache_v1:   8%|7         | 229/3000 [12:13<2:07:39,  2.76s/it, lr: 1.0e-04 loss: 1.978e-01]hash_cache_v1:   8%|7         | 229/3000 [12:13<2:07:39,  2.76s/it, lr: 1.0e-04 loss: 1.978e-01]hash_cache_v1:   8%|7         | 230/3000 [12:16<2:07:36,  2.76s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   8%|7         | 230/3000 [12:16<2:07:36,  2.76s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   8%|7         | 231/3000 [12:16<1:39:31,  2.16s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   8%|7         | 231/3000 [12:16<1:39:31,  2.16s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:   8%|7         | 231/3000 [12:21<1:39:31,  2.16s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:   8%|7         | 231/3000 [12:21<1:39:31,  2.16s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:   8%|7         | 232/3000 [12:21<2:05:53,  2.73s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:   8%|7         | 232/3000 [12:21<2:05:53,  2.73s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:   8%|7         | 232/3000 [12:23<2:05:53,  2.73s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:   8%|7         | 232/3000 [12:23<2:05:53,  2.73s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:   8%|7         | 233/3000 [12:23<2:07:29,  2.76s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:   8%|7         | 233/3000 [12:23<2:07:29,  2.76s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:   8%|7         | 233/3000 [12:28<2:07:29,  2.76s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:   8%|7         | 233/3000 [12:28<2:07:29,  2.76s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:   8%|7         | 234/3000 [12:28<2:26:21,  3.17s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:   8%|7         | 234/3000 [12:28<2:26:21,  3.17s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:   8%|7         | 234/3000 [12:31<2:26:21,  3.17s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:   8%|7         | 234/3000 [12:31<2:26:21,  3.17s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:   8%|7         | 235/3000 [12:31<2:24:52,  3.14s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:   8%|7         | 235/3000 [12:31<2:24:52,  3.14s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:   8%|7         | 235/3000 [12:33<2:24:52,  3.14s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:   8%|7         | 235/3000 [12:33<2:24:52,  3.14s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:   8%|7         | 236/3000 [12:33<2:11:04,  2.85s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:   8%|7         | 236/3000 [12:33<2:11:04,  2.85s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:   8%|7         | 236/3000 [12:35<2:11:04,  2.85s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:   8%|7         | 236/3000 [12:35<2:11:04,  2.85s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:   8%|7         | 237/3000 [12:35<2:00:37,  2.62s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:   8%|7         | 237/3000 [12:35<2:00:37,  2.62s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:   8%|7         | 237/3000 [12:39<2:00:37,  2.62s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:   8%|7         | 237/3000 [12:39<2:00:37,  2.62s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:   8%|7         | 238/3000 [12:39<2:23:53,  3.13s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:   8%|7         | 238/3000 [12:39<2:23:53,  3.13s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:   8%|7         | 238/3000 [12:42<2:23:53,  3.13s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:   8%|7         | 238/3000 [12:42<2:23:53,  3.13s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:   8%|7         | 239/3000 [12:42<2:23:34,  3.12s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:   8%|7         | 239/3000 [12:42<2:23:34,  3.12s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:   8%|7         | 239/3000 [12:45<2:23:34,  3.12s/it, lr: 1.0e-04 loss: 1.094e-01]hash_cache_v1:   8%|7         | 239/3000 [12:45<2:23:34,  3.12s/it, lr: 1.0e-04 loss: 1.094e-01]hash_cache_v1:   8%|8         | 240/3000 [12:47<2:23:31,  3.12s/it, lr: 1.0e-04 loss: 7.547e-02]hash_cache_v1:   8%|8         | 240/3000 [12:47<2:23:31,  3.12s/it, lr: 1.0e-04 loss: 7.547e-02]hash_cache_v1:   8%|8         | 241/3000 [12:47<1:40:01,  2.18s/it, lr: 1.0e-04 loss: 7.547e-02]hash_cache_v1:   8%|8         | 241/3000 [12:47<1:40:01,  2.18s/it, lr: 1.0e-04 loss: 7.547e-02]hash_cache_v1:   8%|8         | 241/3000 [12:50<1:40:01,  2.18s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   8%|8         | 241/3000 [12:50<1:40:01,  2.18s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   8%|8         | 242/3000 [12:50<1:50:28,  2.40s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   8%|8         | 242/3000 [12:50<1:50:28,  2.40s/it, lr: 1.0e-04 loss: 2.152e-01]hash_cache_v1:   8%|8         | 242/3000 [12:53<1:50:28,  2.40s/it, lr: 1.0e-04 loss: 2.581e-01]hash_cache_v1:   8%|8         | 242/3000 [12:53<1:50:28,  2.40s/it, lr: 1.0e-04 loss: 2.581e-01]hash_cache_v1:   8%|8         | 243/3000 [12:53<1:46:46,  2.32s/it, lr: 1.0e-04 loss: 2.581e-01]hash_cache_v1:   8%|8         | 243/3000 [12:53<1:46:46,  2.32s/it, lr: 1.0e-04 loss: 2.581e-01]hash_cache_v1:   8%|8         | 243/3000 [12:55<1:46:46,  2.32s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:   8%|8         | 243/3000 [12:55<1:46:46,  2.32s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:   8%|8         | 244/3000 [12:55<1:44:05,  2.27s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:   8%|8         | 244/3000 [12:55<1:44:05,  2.27s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:   8%|8         | 244/3000 [12:59<1:44:05,  2.27s/it, lr: 1.0e-04 loss: 6.509e-02]hash_cache_v1:   8%|8         | 244/3000 [12:59<1:44:05,  2.27s/it, lr: 1.0e-04 loss: 6.509e-02]hash_cache_v1:   8%|8         | 245/3000 [12:59<2:12:54,  2.89s/it, lr: 1.0e-04 loss: 6.509e-02]hash_cache_v1:   8%|8         | 245/3000 [12:59<2:12:54,  2.89s/it, lr: 1.0e-04 loss: 6.509e-02]hash_cache_v1:   8%|8         | 245/3000 [13:01<2:12:54,  2.89s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:   8%|8         | 245/3000 [13:01<2:12:54,  2.89s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:   8%|8         | 246/3000 [13:01<2:02:28,  2.67s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:   8%|8         | 246/3000 [13:01<2:02:28,  2.67s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:   8%|8         | 246/3000 [13:06<2:02:28,  2.67s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:   8%|8         | 246/3000 [13:06<2:02:28,  2.67s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:   8%|8         | 247/3000 [13:06<2:23:57,  3.14s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:   8%|8         | 247/3000 [13:06<2:23:57,  3.14s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:   8%|8         | 247/3000 [13:08<2:23:57,  3.14s/it, lr: 1.0e-04 loss: 2.245e-01]hash_cache_v1:   8%|8         | 247/3000 [13:08<2:23:57,  3.14s/it, lr: 1.0e-04 loss: 2.245e-01]hash_cache_v1:   8%|8         | 248/3000 [13:08<2:20:23,  3.06s/it, lr: 1.0e-04 loss: 2.245e-01]hash_cache_v1:   8%|8         | 248/3000 [13:08<2:20:23,  3.06s/it, lr: 1.0e-04 loss: 2.245e-01]hash_cache_v1:   8%|8         | 248/3000 [13:13<2:20:23,  3.06s/it, lr: 1.0e-04 loss: 9.435e-02]hash_cache_v1:   8%|8         | 248/3000 [13:13<2:20:23,  3.06s/it, lr: 1.0e-04 loss: 9.435e-02]hash_cache_v1:   8%|8         | 249/3000 [13:13<2:39:42,  3.48s/it, lr: 1.0e-04 loss: 9.435e-02]hash_cache_v1:   8%|8         | 249/3000 [13:13<2:39:42,  3.48s/it, lr: 1.0e-04 loss: 9.435e-02]hash_cache_v1:   8%|8         | 249/3000 [13:17<2:39:42,  3.48s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:   8%|8         | 249/3000 [13:17<2:39:42,  3.48s/it, lr: 1.0e-04 loss: 1.822e-01]
+Saving at step 250
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000000250.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:12<03:37, 72.48s/it]Generating Images:  25%|##5       | 1/4 [01:12<03:37, 72.48s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.39s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.39s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.39s/it]Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.39s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.39s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.39s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:   8%|8         | 250/3000 [13:20<2:39:39,  3.48s/it, lr: 1.0e-04 loss: 2.693e-01]hash_cache_v1:   8%|8         | 250/3000 [13:20<2:39:39,  3.48s/it, lr: 1.0e-04 loss: 2.693e-01]hash_cache_v1:   8%|8         | 251/3000 [13:20<1:51:24,  2.43s/it, lr: 1.0e-04 loss: 2.693e-01]hash_cache_v1:   8%|8         | 251/3000 [13:20<1:51:24,  2.43s/it, lr: 1.0e-04 loss: 2.693e-01]hash_cache_v1:   8%|8         | 251/3000 [13:22<1:51:24,  2.43s/it, lr: 1.0e-04 loss: 2.047e-01]hash_cache_v1:   8%|8         | 251/3000 [13:22<1:51:24,  2.43s/it, lr: 1.0e-04 loss: 2.047e-01]hash_cache_v1:   8%|8         | 252/3000 [13:23<1:56:27,  2.54s/it, lr: 1.0e-04 loss: 2.047e-01]hash_cache_v1:   8%|8         | 252/3000 [13:23<1:56:27,  2.54s/it, lr: 1.0e-04 loss: 2.047e-01]hash_cache_v1:   8%|8         | 252/3000 [13:25<1:56:27,  2.54s/it, lr: 1.0e-04 loss: 2.542e-01]hash_cache_v1:   8%|8         | 252/3000 [13:25<1:56:27,  2.54s/it, lr: 1.0e-04 loss: 2.542e-01]hash_cache_v1:   8%|8         | 253/3000 [13:25<1:51:12,  2.43s/it, lr: 1.0e-04 loss: 2.542e-01]hash_cache_v1:   8%|8         | 253/3000 [13:25<1:51:12,  2.43s/it, lr: 1.0e-04 loss: 2.542e-01]hash_cache_v1:   8%|8         | 253/3000 [13:29<1:51:12,  2.43s/it, lr: 1.0e-04 loss: 1.890e-01]hash_cache_v1:   8%|8         | 253/3000 [13:29<1:51:12,  2.43s/it, lr: 1.0e-04 loss: 1.890e-01]hash_cache_v1:   8%|8         | 254/3000 [13:29<2:17:03,  2.99s/it, lr: 1.0e-04 loss: 1.890e-01]hash_cache_v1:   8%|8         | 254/3000 [13:29<2:17:03,  2.99s/it, lr: 1.0e-04 loss: 1.890e-01]hash_cache_v1:   8%|8         | 254/3000 [13:31<2:17:03,  2.99s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:   8%|8         | 254/3000 [13:31<2:17:03,  2.99s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:   8%|8         | 255/3000 [13:31<2:05:44,  2.75s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:   8%|8         | 255/3000 [13:31<2:05:44,  2.75s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:   8%|8         | 255/3000 [13:33<2:05:44,  2.75s/it, lr: 1.0e-04 loss: 1.865e-01]hash_cache_v1:   8%|8         | 255/3000 [13:33<2:05:44,  2.75s/it, lr: 1.0e-04 loss: 1.865e-01]hash_cache_v1:   9%|8         | 256/3000 [13:33<1:57:23,  2.57s/it, lr: 1.0e-04 loss: 1.865e-01]hash_cache_v1:   9%|8         | 256/3000 [13:33<1:57:23,  2.57s/it, lr: 1.0e-04 loss: 1.865e-01]hash_cache_v1:   9%|8         | 256/3000 [13:36<1:57:23,  2.57s/it, lr: 1.0e-04 loss: 2.456e-01]hash_cache_v1:   9%|8         | 256/3000 [13:36<1:57:23,  2.57s/it, lr: 1.0e-04 loss: 2.456e-01]hash_cache_v1:   9%|8         | 257/3000 [13:36<1:55:18,  2.52s/it, lr: 1.0e-04 loss: 2.456e-01]hash_cache_v1:   9%|8         | 257/3000 [13:36<1:55:18,  2.52s/it, lr: 1.0e-04 loss: 2.456e-01]hash_cache_v1:   9%|8         | 257/3000 [13:40<1:55:18,  2.52s/it, lr: 1.0e-04 loss: 1.804e-01]hash_cache_v1:   9%|8         | 257/3000 [13:40<1:55:18,  2.52s/it, lr: 1.0e-04 loss: 1.804e-01]hash_cache_v1:   9%|8         | 258/3000 [13:40<2:19:05,  3.04s/it, lr: 1.0e-04 loss: 1.804e-01]hash_cache_v1:   9%|8         | 258/3000 [13:40<2:19:05,  3.04s/it, lr: 1.0e-04 loss: 1.804e-01]hash_cache_v1:   9%|8         | 258/3000 [13:43<2:19:05,  3.04s/it, lr: 1.0e-04 loss: 2.355e-01]hash_cache_v1:   9%|8         | 258/3000 [13:43<2:19:05,  3.04s/it, lr: 1.0e-04 loss: 2.355e-01]hash_cache_v1:   9%|8         | 259/3000 [13:43<2:16:12,  2.98s/it, lr: 1.0e-04 loss: 2.355e-01]hash_cache_v1:   9%|8         | 259/3000 [13:43<2:16:12,  2.98s/it, lr: 1.0e-04 loss: 2.355e-01]hash_cache_v1:   9%|8         | 259/3000 [13:45<2:16:12,  2.98s/it, lr: 1.0e-04 loss: 2.182e-01]hash_cache_v1:   9%|8         | 259/3000 [13:45<2:16:12,  2.98s/it, lr: 1.0e-04 loss: 2.182e-01]hash_cache_v1:   9%|8         | 260/3000 [13:47<2:16:09,  2.98s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   9%|8         | 260/3000 [13:47<2:16:09,  2.98s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   9%|8         | 261/3000 [13:47<1:38:51,  2.17s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   9%|8         | 261/3000 [13:47<1:38:51,  2.17s/it, lr: 1.0e-04 loss: 2.243e-01]hash_cache_v1:   9%|8         | 261/3000 [13:50<1:38:51,  2.17s/it, lr: 1.0e-04 loss: 2.303e-01]hash_cache_v1:   9%|8         | 261/3000 [13:50<1:38:51,  2.17s/it, lr: 1.0e-04 loss: 2.303e-01]hash_cache_v1:   9%|8         | 262/3000 [13:50<1:46:55,  2.34s/it, lr: 1.0e-04 loss: 2.303e-01]hash_cache_v1:   9%|8         | 262/3000 [13:50<1:46:55,  2.34s/it, lr: 1.0e-04 loss: 2.303e-01]hash_cache_v1:   9%|8         | 262/3000 [13:52<1:46:55,  2.34s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   9%|8         | 262/3000 [13:52<1:46:55,  2.34s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   9%|8         | 263/3000 [13:52<1:44:09,  2.28s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   9%|8         | 263/3000 [13:52<1:44:09,  2.28s/it, lr: 1.0e-04 loss: 2.420e-01]hash_cache_v1:   9%|8         | 263/3000 [13:57<1:44:09,  2.28s/it, lr: 1.0e-04 loss: 4.827e-02]hash_cache_v1:   9%|8         | 263/3000 [13:57<1:44:09,  2.28s/it, lr: 1.0e-04 loss: 4.827e-02]hash_cache_v1:   9%|8         | 264/3000 [13:57<2:08:41,  2.82s/it, lr: 1.0e-04 loss: 4.827e-02]hash_cache_v1:   9%|8         | 264/3000 [13:57<2:08:41,  2.82s/it, lr: 1.0e-04 loss: 4.827e-02]hash_cache_v1:   9%|8         | 264/3000 [13:59<2:08:41,  2.82s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 264/3000 [13:59<2:08:41,  2.82s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 265/3000 [13:59<2:02:55,  2.70s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 265/3000 [13:59<2:02:55,  2.70s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 265/3000 [14:03<2:02:55,  2.70s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:   9%|8         | 265/3000 [14:03<2:02:55,  2.70s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:   9%|8         | 266/3000 [14:03<2:23:46,  3.16s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:   9%|8         | 266/3000 [14:03<2:23:46,  3.16s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:   9%|8         | 266/3000 [14:05<2:23:46,  3.16s/it, lr: 1.0e-04 loss: 2.526e-01]hash_cache_v1:   9%|8         | 266/3000 [14:05<2:23:46,  3.16s/it, lr: 1.0e-04 loss: 2.526e-01]hash_cache_v1:   9%|8         | 267/3000 [14:05<2:09:58,  2.85s/it, lr: 1.0e-04 loss: 2.526e-01]hash_cache_v1:   9%|8         | 267/3000 [14:05<2:09:58,  2.85s/it, lr: 1.0e-04 loss: 2.526e-01]hash_cache_v1:   9%|8         | 267/3000 [14:10<2:09:58,  2.85s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 267/3000 [14:10<2:09:58,  2.85s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 268/3000 [14:10<2:31:54,  3.34s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 268/3000 [14:10<2:31:54,  3.34s/it, lr: 1.0e-04 loss: 2.177e-01]hash_cache_v1:   9%|8         | 268/3000 [14:13<2:31:54,  3.34s/it, lr: 1.0e-04 loss: 2.478e-01]hash_cache_v1:   9%|8         | 268/3000 [14:13<2:31:54,  3.34s/it, lr: 1.0e-04 loss: 2.478e-01]hash_cache_v1:   9%|8         | 269/3000 [14:13<2:25:38,  3.20s/it, lr: 1.0e-04 loss: 2.478e-01]hash_cache_v1:   9%|8         | 269/3000 [14:13<2:25:38,  3.20s/it, lr: 1.0e-04 loss: 2.478e-01]hash_cache_v1:   9%|8         | 269/3000 [14:15<2:25:38,  3.20s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:   9%|8         | 269/3000 [14:15<2:25:38,  3.20s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:   9%|9         | 270/3000 [14:18<2:25:35,  3.20s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:   9%|9         | 270/3000 [14:18<2:25:35,  3.20s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:   9%|9         | 271/3000 [14:18<1:48:39,  2.39s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:   9%|9         | 271/3000 [14:18<1:48:39,  2.39s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:   9%|9         | 271/3000 [14:21<1:48:39,  2.39s/it, lr: 1.0e-04 loss: 2.810e-01]hash_cache_v1:   9%|9         | 271/3000 [14:21<1:48:39,  2.39s/it, lr: 1.0e-04 loss: 2.810e-01]hash_cache_v1:   9%|9         | 272/3000 [14:21<1:50:31,  2.43s/it, lr: 1.0e-04 loss: 2.810e-01]hash_cache_v1:   9%|9         | 272/3000 [14:21<1:50:31,  2.43s/it, lr: 1.0e-04 loss: 2.810e-01]hash_cache_v1:   9%|9         | 272/3000 [14:23<1:50:31,  2.43s/it, lr: 1.0e-04 loss: 3.113e-01]hash_cache_v1:   9%|9         | 272/3000 [14:23<1:50:31,  2.43s/it, lr: 1.0e-04 loss: 3.113e-01]hash_cache_v1:   9%|9         | 273/3000 [14:23<1:46:49,  2.35s/it, lr: 1.0e-04 loss: 3.113e-01]hash_cache_v1:   9%|9         | 273/3000 [14:23<1:46:49,  2.35s/it, lr: 1.0e-04 loss: 3.113e-01]hash_cache_v1:   9%|9         | 273/3000 [14:26<1:46:49,  2.35s/it, lr: 1.0e-04 loss: 1.937e-01]hash_cache_v1:   9%|9         | 273/3000 [14:26<1:46:49,  2.35s/it, lr: 1.0e-04 loss: 1.937e-01]hash_cache_v1:   9%|9         | 274/3000 [14:26<1:53:04,  2.49s/it, lr: 1.0e-04 loss: 1.937e-01]hash_cache_v1:   9%|9         | 274/3000 [14:26<1:53:04,  2.49s/it, lr: 1.0e-04 loss: 1.937e-01]hash_cache_v1:   9%|9         | 274/3000 [14:28<1:53:04,  2.49s/it, lr: 1.0e-04 loss: 1.101e-01]hash_cache_v1:   9%|9         | 274/3000 [14:28<1:53:04,  2.49s/it, lr: 1.0e-04 loss: 1.101e-01]hash_cache_v1:   9%|9         | 275/3000 [14:28<1:51:58,  2.47s/it, lr: 1.0e-04 loss: 1.101e-01]hash_cache_v1:   9%|9         | 275/3000 [14:28<1:51:58,  2.47s/it, lr: 1.0e-04 loss: 1.101e-01]hash_cache_v1:   9%|9         | 275/3000 [14:32<1:51:58,  2.47s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:   9%|9         | 275/3000 [14:32<1:51:58,  2.47s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:   9%|9         | 276/3000 [14:32<2:15:55,  2.99s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:   9%|9         | 276/3000 [14:32<2:15:55,  2.99s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:   9%|9         | 276/3000 [14:35<2:15:55,  2.99s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   9%|9         | 276/3000 [14:35<2:15:55,  2.99s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   9%|9         | 277/3000 [14:35<2:13:58,  2.95s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   9%|9         | 277/3000 [14:35<2:13:58,  2.95s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:   9%|9         | 277/3000 [14:40<2:13:58,  2.95s/it, lr: 1.0e-04 loss: 9.959e-02]hash_cache_v1:   9%|9         | 277/3000 [14:40<2:13:58,  2.95s/it, lr: 1.0e-04 loss: 9.959e-02]hash_cache_v1:   9%|9         | 278/3000 [14:40<2:32:01,  3.35s/it, lr: 1.0e-04 loss: 9.959e-02]hash_cache_v1:   9%|9         | 278/3000 [14:40<2:32:01,  3.35s/it, lr: 1.0e-04 loss: 9.959e-02]hash_cache_v1:   9%|9         | 278/3000 [14:42<2:32:01,  3.35s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:   9%|9         | 278/3000 [14:42<2:32:01,  3.35s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:   9%|9         | 279/3000 [14:42<2:19:12,  3.07s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:   9%|9         | 279/3000 [14:42<2:19:12,  3.07s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:   9%|9         | 279/3000 [14:44<2:19:12,  3.07s/it, lr: 1.0e-04 loss: 5.090e-02]hash_cache_v1:   9%|9         | 279/3000 [14:44<2:19:12,  3.07s/it, lr: 1.0e-04 loss: 5.090e-02]hash_cache_v1:   9%|9         | 280/3000 [14:48<2:19:08,  3.07s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:   9%|9         | 280/3000 [14:48<2:19:08,  3.07s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:   9%|9         | 281/3000 [14:48<1:59:57,  2.65s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:   9%|9         | 281/3000 [14:48<1:59:57,  2.65s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:   9%|9         | 281/3000 [14:51<1:59:57,  2.65s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:   9%|9         | 281/3000 [14:51<1:59:57,  2.65s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:   9%|9         | 282/3000 [14:51<1:56:38,  2.57s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:   9%|9         | 282/3000 [14:51<1:56:38,  2.57s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:   9%|9         | 282/3000 [14:53<1:56:38,  2.57s/it, lr: 1.0e-04 loss: 2.687e-01]hash_cache_v1:   9%|9         | 282/3000 [14:53<1:56:38,  2.57s/it, lr: 1.0e-04 loss: 2.687e-01]hash_cache_v1:   9%|9         | 283/3000 [14:53<1:50:46,  2.45s/it, lr: 1.0e-04 loss: 2.687e-01]hash_cache_v1:   9%|9         | 283/3000 [14:53<1:50:46,  2.45s/it, lr: 1.0e-04 loss: 2.687e-01]hash_cache_v1:   9%|9         | 283/3000 [14:56<1:50:46,  2.45s/it, lr: 1.0e-04 loss: 6.931e-02]hash_cache_v1:   9%|9         | 283/3000 [14:56<1:50:46,  2.45s/it, lr: 1.0e-04 loss: 6.931e-02]hash_cache_v1:   9%|9         | 284/3000 [14:56<1:55:50,  2.56s/it, lr: 1.0e-04 loss: 6.931e-02]hash_cache_v1:   9%|9         | 284/3000 [14:56<1:55:50,  2.56s/it, lr: 1.0e-04 loss: 6.931e-02]hash_cache_v1:   9%|9         | 284/3000 [15:00<1:55:50,  2.56s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:   9%|9         | 284/3000 [15:00<1:55:50,  2.56s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  10%|9         | 285/3000 [15:00<2:17:25,  3.04s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  10%|9         | 285/3000 [15:00<2:17:25,  3.04s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  10%|9         | 285/3000 [15:03<2:17:25,  3.04s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  10%|9         | 285/3000 [15:03<2:17:25,  3.04s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  10%|9         | 286/3000 [15:03<2:17:24,  3.04s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  10%|9         | 286/3000 [15:03<2:17:24,  3.04s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  10%|9         | 286/3000 [15:06<2:17:24,  3.04s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  10%|9         | 286/3000 [15:06<2:17:24,  3.04s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  10%|9         | 287/3000 [15:06<2:14:44,  2.98s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  10%|9         | 287/3000 [15:06<2:14:44,  2.98s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  10%|9         | 287/3000 [15:10<2:14:44,  2.98s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  10%|9         | 287/3000 [15:10<2:14:44,  2.98s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  10%|9         | 288/3000 [15:10<2:32:15,  3.37s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  10%|9         | 288/3000 [15:10<2:32:15,  3.37s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  10%|9         | 288/3000 [15:13<2:32:15,  3.37s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  10%|9         | 288/3000 [15:13<2:32:15,  3.37s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  10%|9         | 289/3000 [15:13<2:18:44,  3.07s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  10%|9         | 289/3000 [15:13<2:18:44,  3.07s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  10%|9         | 289/3000 [15:15<2:18:44,  3.07s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  10%|9         | 289/3000 [15:15<2:18:44,  3.07s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  10%|9         | 290/3000 [15:20<2:18:41,  3.07s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  10%|9         | 290/3000 [15:20<2:18:41,  3.07s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  10%|9         | 291/3000 [15:20<1:59:22,  2.64s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  10%|9         | 291/3000 [15:20<1:59:22,  2.64s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  10%|9         | 291/3000 [15:24<1:59:22,  2.64s/it, lr: 1.0e-04 loss: 1.780e-01]hash_cache_v1:  10%|9         | 291/3000 [15:24<1:59:22,  2.64s/it, lr: 1.0e-04 loss: 1.780e-01]hash_cache_v1:  10%|9         | 292/3000 [15:24<2:17:55,  3.06s/it, lr: 1.0e-04 loss: 1.780e-01]hash_cache_v1:  10%|9         | 292/3000 [15:24<2:17:55,  3.06s/it, lr: 1.0e-04 loss: 1.780e-01]hash_cache_v1:  10%|9         | 292/3000 [15:28<2:17:55,  3.06s/it, lr: 1.0e-04 loss: 4.072e-02]hash_cache_v1:  10%|9         | 292/3000 [15:28<2:17:55,  3.06s/it, lr: 1.0e-04 loss: 4.072e-02]hash_cache_v1:  10%|9         | 293/3000 [15:28<2:34:26,  3.42s/it, lr: 1.0e-04 loss: 4.072e-02]hash_cache_v1:  10%|9         | 293/3000 [15:28<2:34:26,  3.42s/it, lr: 1.0e-04 loss: 4.072e-02]hash_cache_v1:  10%|9         | 293/3000 [15:33<2:34:26,  3.42s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  10%|9         | 293/3000 [15:33<2:34:26,  3.42s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  10%|9         | 294/3000 [15:33<2:45:13,  3.66s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  10%|9         | 294/3000 [15:33<2:45:13,  3.66s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  10%|9         | 294/3000 [15:37<2:45:13,  3.66s/it, lr: 1.0e-04 loss: 4.324e-03]hash_cache_v1:  10%|9         | 294/3000 [15:37<2:45:13,  3.66s/it, lr: 1.0e-04 loss: 4.324e-03]hash_cache_v1:  10%|9         | 295/3000 [15:37<2:53:20,  3.85s/it, lr: 1.0e-04 loss: 4.324e-03]hash_cache_v1:  10%|9         | 295/3000 [15:37<2:53:20,  3.85s/it, lr: 1.0e-04 loss: 4.324e-03]hash_cache_v1:  10%|9         | 295/3000 [15:40<2:53:20,  3.85s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  10%|9         | 295/3000 [15:40<2:53:20,  3.85s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  10%|9         | 296/3000 [15:40<2:39:17,  3.53s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  10%|9         | 296/3000 [15:40<2:39:17,  3.53s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  10%|9         | 296/3000 [15:43<2:39:17,  3.53s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  10%|9         | 296/3000 [15:43<2:39:17,  3.53s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  10%|9         | 297/3000 [15:43<2:33:59,  3.42s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  10%|9         | 297/3000 [15:43<2:33:59,  3.42s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  10%|9         | 297/3000 [15:45<2:33:59,  3.42s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  10%|9         | 297/3000 [15:45<2:33:59,  3.42s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  10%|9         | 298/3000 [15:45<2:16:12,  3.02s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  10%|9         | 298/3000 [15:45<2:16:12,  3.02s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  10%|9         | 298/3000 [15:48<2:16:12,  3.02s/it, lr: 1.0e-04 loss: 2.230e-01]hash_cache_v1:  10%|9         | 298/3000 [15:48<2:16:12,  3.02s/it, lr: 1.0e-04 loss: 2.230e-01]hash_cache_v1:  10%|9         | 299/3000 [15:48<2:14:09,  2.98s/it, lr: 1.0e-04 loss: 2.230e-01]hash_cache_v1:  10%|9         | 299/3000 [15:48<2:14:09,  2.98s/it, lr: 1.0e-04 loss: 2.230e-01]hash_cache_v1:  10%|9         | 299/3000 [15:50<2:14:09,  2.98s/it, lr: 1.0e-04 loss: 1.162e-01]hash_cache_v1:  10%|9         | 299/3000 [15:50<2:14:09,  2.98s/it, lr: 1.0e-04 loss: 1.162e-01]hash_cache_v1:  10%|#         | 300/3000 [15:52<2:14:06,  2.98s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:  10%|#         | 300/3000 [15:52<2:14:06,  2.98s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:  10%|#         | 301/3000 [15:52<1:34:16,  2.10s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:  10%|#         | 301/3000 [15:52<1:34:16,  2.10s/it, lr: 1.0e-04 loss: 2.844e-01]hash_cache_v1:  10%|#         | 301/3000 [15:57<1:34:16,  2.10s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  10%|#         | 301/3000 [15:57<1:34:16,  2.10s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  10%|#         | 302/3000 [15:57<1:58:47,  2.64s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  10%|#         | 302/3000 [15:57<1:58:47,  2.64s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  10%|#         | 302/3000 [16:00<1:58:47,  2.64s/it, lr: 1.0e-04 loss: 9.897e-02]hash_cache_v1:  10%|#         | 302/3000 [16:00<1:58:47,  2.64s/it, lr: 1.0e-04 loss: 9.897e-02]hash_cache_v1:  10%|#         | 303/3000 [16:00<2:01:41,  2.71s/it, lr: 1.0e-04 loss: 9.897e-02]hash_cache_v1:  10%|#         | 303/3000 [16:00<2:01:41,  2.71s/it, lr: 1.0e-04 loss: 9.897e-02]hash_cache_v1:  10%|#         | 303/3000 [16:03<2:01:41,  2.71s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  10%|#         | 303/3000 [16:03<2:01:41,  2.71s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  10%|#         | 304/3000 [16:03<2:06:43,  2.82s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  10%|#         | 304/3000 [16:03<2:06:43,  2.82s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  10%|#         | 304/3000 [16:05<2:06:43,  2.82s/it, lr: 1.0e-04 loss: 2.219e-01]hash_cache_v1:  10%|#         | 304/3000 [16:05<2:06:43,  2.82s/it, lr: 1.0e-04 loss: 2.219e-01]hash_cache_v1:  10%|#         | 305/3000 [16:06<2:05:53,  2.80s/it, lr: 1.0e-04 loss: 2.219e-01]hash_cache_v1:  10%|#         | 305/3000 [16:06<2:05:53,  2.80s/it, lr: 1.0e-04 loss: 2.219e-01]hash_cache_v1:  10%|#         | 305/3000 [16:08<2:05:53,  2.80s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  10%|#         | 305/3000 [16:08<2:05:53,  2.80s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  10%|#         | 306/3000 [16:08<2:06:54,  2.83s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  10%|#         | 306/3000 [16:08<2:06:54,  2.83s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  10%|#         | 306/3000 [16:13<2:06:54,  2.83s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  10%|#         | 306/3000 [16:13<2:06:54,  2.83s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  10%|#         | 307/3000 [16:13<2:28:19,  3.30s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  10%|#         | 307/3000 [16:13<2:28:19,  3.30s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  10%|#         | 307/3000 [16:15<2:28:19,  3.30s/it, lr: 1.0e-04 loss: 2.333e-01]hash_cache_v1:  10%|#         | 307/3000 [16:15<2:28:19,  3.30s/it, lr: 1.0e-04 loss: 2.333e-01]hash_cache_v1:  10%|#         | 308/3000 [16:15<2:12:37,  2.96s/it, lr: 1.0e-04 loss: 2.333e-01]hash_cache_v1:  10%|#         | 308/3000 [16:15<2:12:37,  2.96s/it, lr: 1.0e-04 loss: 2.333e-01]hash_cache_v1:  10%|#         | 308/3000 [16:19<2:12:37,  2.96s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  10%|#         | 308/3000 [16:19<2:12:37,  2.96s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  10%|#         | 309/3000 [16:19<2:30:36,  3.36s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  10%|#         | 309/3000 [16:19<2:30:36,  3.36s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  10%|#         | 309/3000 [16:24<2:30:36,  3.36s/it, lr: 1.0e-04 loss: 1.875e-01]hash_cache_v1:  10%|#         | 309/3000 [16:24<2:30:36,  3.36s/it, lr: 1.0e-04 loss: 1.875e-01]hash_cache_v1:  10%|#         | 310/3000 [16:26<2:30:33,  3.36s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  10%|#         | 310/3000 [16:26<2:30:33,  3.36s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  10%|#         | 311/3000 [16:26<1:46:03,  2.37s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  10%|#         | 311/3000 [16:26<1:46:03,  2.37s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  10%|#         | 311/3000 [16:29<1:46:03,  2.37s/it, lr: 1.0e-04 loss: 2.125e-01]hash_cache_v1:  10%|#         | 311/3000 [16:29<1:46:03,  2.37s/it, lr: 1.0e-04 loss: 2.125e-01]hash_cache_v1:  10%|#         | 312/3000 [16:29<1:51:40,  2.49s/it, lr: 1.0e-04 loss: 2.125e-01]hash_cache_v1:  10%|#         | 312/3000 [16:29<1:51:40,  2.49s/it, lr: 1.0e-04 loss: 2.125e-01]hash_cache_v1:  10%|#         | 312/3000 [16:33<1:51:40,  2.49s/it, lr: 1.0e-04 loss: 1.545e-01]hash_cache_v1:  10%|#         | 312/3000 [16:33<1:51:40,  2.49s/it, lr: 1.0e-04 loss: 1.545e-01]hash_cache_v1:  10%|#         | 313/3000 [16:33<2:12:44,  2.96s/it, lr: 1.0e-04 loss: 1.545e-01]hash_cache_v1:  10%|#         | 313/3000 [16:33<2:12:44,  2.96s/it, lr: 1.0e-04 loss: 1.545e-01]hash_cache_v1:  10%|#         | 313/3000 [16:38<2:12:44,  2.96s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  10%|#         | 313/3000 [16:38<2:12:44,  2.96s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  10%|#         | 314/3000 [16:38<2:31:21,  3.38s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  10%|#         | 314/3000 [16:38<2:31:21,  3.38s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  10%|#         | 314/3000 [16:42<2:31:21,  3.38s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  10%|#         | 314/3000 [16:42<2:31:21,  3.38s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  10%|#         | 315/3000 [16:42<2:42:38,  3.63s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  10%|#         | 315/3000 [16:42<2:42:38,  3.63s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  10%|#         | 315/3000 [16:45<2:42:38,  3.63s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  10%|#         | 315/3000 [16:45<2:42:38,  3.63s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  11%|#         | 316/3000 [16:45<2:31:18,  3.38s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  11%|#         | 316/3000 [16:45<2:31:18,  3.38s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  11%|#         | 316/3000 [16:47<2:31:18,  3.38s/it, lr: 1.0e-04 loss: 2.434e-01]hash_cache_v1:  11%|#         | 316/3000 [16:47<2:31:18,  3.38s/it, lr: 1.0e-04 loss: 2.434e-01]hash_cache_v1:  11%|#         | 317/3000 [16:47<2:14:41,  3.01s/it, lr: 1.0e-04 loss: 2.434e-01]hash_cache_v1:  11%|#         | 317/3000 [16:47<2:14:41,  3.01s/it, lr: 1.0e-04 loss: 2.434e-01]hash_cache_v1:  11%|#         | 317/3000 [16:50<2:14:41,  3.01s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  11%|#         | 317/3000 [16:50<2:14:41,  3.01s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  11%|#         | 318/3000 [16:50<2:15:33,  3.03s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  11%|#         | 318/3000 [16:50<2:15:33,  3.03s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  11%|#         | 318/3000 [16:54<2:15:33,  3.03s/it, lr: 1.0e-04 loss: 1.416e-01]hash_cache_v1:  11%|#         | 318/3000 [16:54<2:15:33,  3.03s/it, lr: 1.0e-04 loss: 1.416e-01]hash_cache_v1:  11%|#         | 319/3000 [16:54<2:32:46,  3.42s/it, lr: 1.0e-04 loss: 1.416e-01]hash_cache_v1:  11%|#         | 319/3000 [16:54<2:32:46,  3.42s/it, lr: 1.0e-04 loss: 1.416e-01]hash_cache_v1:  11%|#         | 319/3000 [16:59<2:32:46,  3.42s/it, lr: 1.0e-04 loss: 1.302e-01]hash_cache_v1:  11%|#         | 319/3000 [16:59<2:32:46,  3.42s/it, lr: 1.0e-04 loss: 1.302e-01]hash_cache_v1:  11%|#         | 320/3000 [17:03<2:32:42,  3.42s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  11%|#         | 320/3000 [17:03<2:32:42,  3.42s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  11%|#         | 321/3000 [17:03<2:07:42,  2.86s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  11%|#         | 321/3000 [17:03<2:07:42,  2.86s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  11%|#         | 321/3000 [17:05<2:07:42,  2.86s/it, lr: 1.0e-04 loss: 2.868e-01]hash_cache_v1:  11%|#         | 321/3000 [17:05<2:07:42,  2.86s/it, lr: 1.0e-04 loss: 2.868e-01]hash_cache_v1:  11%|#         | 322/3000 [17:05<1:59:21,  2.67s/it, lr: 1.0e-04 loss: 2.868e-01]hash_cache_v1:  11%|#         | 322/3000 [17:05<1:59:21,  2.67s/it, lr: 1.0e-04 loss: 2.868e-01]hash_cache_v1:  11%|#         | 322/3000 [17:08<1:59:21,  2.67s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  11%|#         | 322/3000 [17:08<1:59:21,  2.67s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  11%|#         | 323/3000 [17:08<2:01:12,  2.72s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  11%|#         | 323/3000 [17:08<2:01:12,  2.72s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  11%|#         | 323/3000 [17:10<2:01:12,  2.72s/it, lr: 1.0e-04 loss: 2.547e-01]hash_cache_v1:  11%|#         | 323/3000 [17:10<2:01:12,  2.72s/it, lr: 1.0e-04 loss: 2.547e-01]hash_cache_v1:  11%|#         | 324/3000 [17:10<1:53:26,  2.54s/it, lr: 1.0e-04 loss: 2.547e-01]hash_cache_v1:  11%|#         | 324/3000 [17:10<1:53:26,  2.54s/it, lr: 1.0e-04 loss: 2.547e-01]hash_cache_v1:  11%|#         | 324/3000 [17:14<1:53:26,  2.54s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  11%|#         | 324/3000 [17:14<1:53:26,  2.54s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  11%|#         | 325/3000 [17:14<2:18:01,  3.10s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  11%|#         | 325/3000 [17:14<2:18:01,  3.10s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  11%|#         | 325/3000 [17:17<2:18:01,  3.10s/it, lr: 1.0e-04 loss: 2.631e-01]hash_cache_v1:  11%|#         | 325/3000 [17:17<2:18:01,  3.10s/it, lr: 1.0e-04 loss: 2.631e-01]hash_cache_v1:  11%|#         | 326/3000 [17:17<2:05:12,  2.81s/it, lr: 1.0e-04 loss: 2.631e-01]hash_cache_v1:  11%|#         | 326/3000 [17:17<2:05:12,  2.81s/it, lr: 1.0e-04 loss: 2.631e-01]hash_cache_v1:  11%|#         | 326/3000 [17:19<2:05:12,  2.81s/it, lr: 1.0e-04 loss: 2.998e-01]hash_cache_v1:  11%|#         | 326/3000 [17:19<2:05:12,  2.81s/it, lr: 1.0e-04 loss: 2.998e-01]hash_cache_v1:  11%|#         | 327/3000 [17:19<1:55:54,  2.60s/it, lr: 1.0e-04 loss: 2.998e-01]hash_cache_v1:  11%|#         | 327/3000 [17:19<1:55:54,  2.60s/it, lr: 1.0e-04 loss: 2.998e-01]hash_cache_v1:  11%|#         | 327/3000 [17:23<1:55:54,  2.60s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  11%|#         | 327/3000 [17:23<1:55:54,  2.60s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  11%|#         | 328/3000 [17:23<2:20:30,  3.16s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  11%|#         | 328/3000 [17:23<2:20:30,  3.16s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  11%|#         | 328/3000 [17:26<2:20:30,  3.16s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  11%|#         | 328/3000 [17:26<2:20:30,  3.16s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  11%|#         | 329/3000 [17:26<2:16:49,  3.07s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  11%|#         | 329/3000 [17:26<2:16:49,  3.07s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  11%|#         | 329/3000 [17:29<2:16:49,  3.07s/it, lr: 1.0e-04 loss: 2.330e-01]hash_cache_v1:  11%|#         | 329/3000 [17:29<2:16:49,  3.07s/it, lr: 1.0e-04 loss: 2.330e-01]hash_cache_v1:  11%|#1        | 330/3000 [17:31<2:16:46,  3.07s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  11%|#1        | 330/3000 [17:31<2:16:46,  3.07s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  11%|#1        | 331/3000 [17:31<1:35:41,  2.15s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  11%|#1        | 331/3000 [17:31<1:35:41,  2.15s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  11%|#1        | 331/3000 [17:34<1:35:41,  2.15s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  11%|#1        | 331/3000 [17:34<1:35:41,  2.15s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  11%|#1        | 332/3000 [17:34<1:45:46,  2.38s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  11%|#1        | 332/3000 [17:34<1:45:46,  2.38s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  11%|#1        | 332/3000 [17:36<1:45:46,  2.38s/it, lr: 1.0e-04 loss: 1.010e-01]hash_cache_v1:  11%|#1        | 332/3000 [17:36<1:45:46,  2.38s/it, lr: 1.0e-04 loss: 1.010e-01]hash_cache_v1:  11%|#1        | 333/3000 [17:36<1:42:31,  2.31s/it, lr: 1.0e-04 loss: 1.010e-01]hash_cache_v1:  11%|#1        | 333/3000 [17:36<1:42:31,  2.31s/it, lr: 1.0e-04 loss: 1.010e-01]hash_cache_v1:  11%|#1        | 333/3000 [17:38<1:42:31,  2.31s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  11%|#1        | 333/3000 [17:38<1:42:31,  2.31s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  11%|#1        | 334/3000 [17:38<1:40:12,  2.26s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  11%|#1        | 334/3000 [17:38<1:40:12,  2.26s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  11%|#1        | 334/3000 [17:41<1:40:12,  2.26s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  11%|#1        | 334/3000 [17:41<1:40:12,  2.26s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  11%|#1        | 335/3000 [17:41<1:48:03,  2.43s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  11%|#1        | 335/3000 [17:41<1:48:03,  2.43s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  11%|#1        | 335/3000 [17:44<1:48:03,  2.43s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  11%|#1        | 335/3000 [17:44<1:48:03,  2.43s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  11%|#1        | 336/3000 [17:44<1:56:51,  2.63s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  11%|#1        | 336/3000 [17:44<1:56:51,  2.63s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  11%|#1        | 336/3000 [17:46<1:56:51,  2.63s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  11%|#1        | 336/3000 [17:46<1:56:51,  2.63s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  11%|#1        | 337/3000 [17:46<1:50:04,  2.48s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  11%|#1        | 337/3000 [17:46<1:50:04,  2.48s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  11%|#1        | 337/3000 [17:51<1:50:04,  2.48s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:  11%|#1        | 337/3000 [17:51<1:50:04,  2.48s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:  11%|#1        | 338/3000 [17:51<2:14:01,  3.02s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:  11%|#1        | 338/3000 [17:51<2:14:01,  3.02s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:  11%|#1        | 338/3000 [17:53<2:14:01,  3.02s/it, lr: 1.0e-04 loss: 2.151e-01]hash_cache_v1:  11%|#1        | 338/3000 [17:53<2:14:01,  3.02s/it, lr: 1.0e-04 loss: 2.151e-01]hash_cache_v1:  11%|#1        | 339/3000 [17:53<2:05:53,  2.84s/it, lr: 1.0e-04 loss: 2.151e-01]hash_cache_v1:  11%|#1        | 339/3000 [17:53<2:05:53,  2.84s/it, lr: 1.0e-04 loss: 2.151e-01]hash_cache_v1:  11%|#1        | 339/3000 [17:56<2:05:53,  2.84s/it, lr: 1.0e-04 loss: 2.031e-01]hash_cache_v1:  11%|#1        | 339/3000 [17:56<2:05:53,  2.84s/it, lr: 1.0e-04 loss: 2.031e-01]hash_cache_v1:  11%|#1        | 340/3000 [17:58<2:05:50,  2.84s/it, lr: 1.0e-04 loss: 2.640e-01]hash_cache_v1:  11%|#1        | 340/3000 [17:58<2:05:50,  2.84s/it, lr: 1.0e-04 loss: 2.640e-01]hash_cache_v1:  11%|#1        | 341/3000 [17:58<1:29:36,  2.02s/it, lr: 1.0e-04 loss: 2.640e-01]hash_cache_v1:  11%|#1        | 341/3000 [17:58<1:29:36,  2.02s/it, lr: 1.0e-04 loss: 2.640e-01]hash_cache_v1:  11%|#1        | 341/3000 [18:01<1:29:36,  2.02s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  11%|#1        | 341/3000 [18:01<1:29:36,  2.02s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  11%|#1        | 342/3000 [18:01<1:38:29,  2.22s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  11%|#1        | 342/3000 [18:01<1:38:29,  2.22s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  11%|#1        | 342/3000 [18:04<1:38:29,  2.22s/it, lr: 1.0e-04 loss: 2.387e-01]hash_cache_v1:  11%|#1        | 342/3000 [18:04<1:38:29,  2.22s/it, lr: 1.0e-04 loss: 2.387e-01]hash_cache_v1:  11%|#1        | 343/3000 [18:04<1:48:11,  2.44s/it, lr: 1.0e-04 loss: 2.387e-01]hash_cache_v1:  11%|#1        | 343/3000 [18:04<1:48:11,  2.44s/it, lr: 1.0e-04 loss: 2.387e-01]hash_cache_v1:  11%|#1        | 343/3000 [18:08<1:48:11,  2.44s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  11%|#1        | 343/3000 [18:08<1:48:11,  2.44s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  11%|#1        | 344/3000 [18:08<2:10:41,  2.95s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  11%|#1        | 344/3000 [18:08<2:10:41,  2.95s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  11%|#1        | 344/3000 [18:10<2:10:41,  2.95s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  11%|#1        | 344/3000 [18:10<2:10:41,  2.95s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  12%|#1        | 345/3000 [18:10<2:00:11,  2.72s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  12%|#1        | 345/3000 [18:10<2:00:11,  2.72s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  12%|#1        | 345/3000 [18:13<2:00:11,  2.72s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  12%|#1        | 345/3000 [18:13<2:00:11,  2.72s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  12%|#1        | 346/3000 [18:13<1:56:00,  2.62s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  12%|#1        | 346/3000 [18:13<1:56:00,  2.62s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  12%|#1        | 346/3000 [18:16<1:56:00,  2.62s/it, lr: 1.0e-04 loss: 1.231e-01]hash_cache_v1:  12%|#1        | 346/3000 [18:16<1:56:00,  2.62s/it, lr: 1.0e-04 loss: 1.231e-01]hash_cache_v1:  12%|#1        | 347/3000 [18:16<1:58:38,  2.68s/it, lr: 1.0e-04 loss: 1.231e-01]hash_cache_v1:  12%|#1        | 347/3000 [18:16<1:58:38,  2.68s/it, lr: 1.0e-04 loss: 1.231e-01]hash_cache_v1:  12%|#1        | 347/3000 [18:20<1:58:38,  2.68s/it, lr: 1.0e-04 loss: 1.157e-01]hash_cache_v1:  12%|#1        | 347/3000 [18:20<1:58:38,  2.68s/it, lr: 1.0e-04 loss: 1.157e-01]hash_cache_v1:  12%|#1        | 348/3000 [18:20<2:19:39,  3.16s/it, lr: 1.0e-04 loss: 1.157e-01]hash_cache_v1:  12%|#1        | 348/3000 [18:20<2:19:39,  3.16s/it, lr: 1.0e-04 loss: 1.157e-01]hash_cache_v1:  12%|#1        | 348/3000 [18:22<2:19:39,  3.16s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:  12%|#1        | 348/3000 [18:22<2:19:39,  3.16s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:  12%|#1        | 349/3000 [18:22<2:05:54,  2.85s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:  12%|#1        | 349/3000 [18:22<2:05:54,  2.85s/it, lr: 1.0e-04 loss: 2.598e-01]hash_cache_v1:  12%|#1        | 349/3000 [18:27<2:05:54,  2.85s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  12%|#1        | 349/3000 [18:27<2:05:54,  2.85s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  12%|#1        | 350/3000 [18:30<2:05:51,  2.85s/it, lr: 1.0e-04 loss: 1.991e-01]hash_cache_v1:  12%|#1        | 350/3000 [18:30<2:05:51,  2.85s/it, lr: 1.0e-04 loss: 1.991e-01]hash_cache_v1:  12%|#1        | 351/3000 [18:30<1:37:12,  2.20s/it, lr: 1.0e-04 loss: 1.991e-01]hash_cache_v1:  12%|#1        | 351/3000 [18:30<1:37:12,  2.20s/it, lr: 1.0e-04 loss: 1.991e-01]hash_cache_v1:  12%|#1        | 351/3000 [18:34<1:37:12,  2.20s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  12%|#1        | 351/3000 [18:34<1:37:12,  2.20s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  12%|#1        | 352/3000 [18:34<2:00:09,  2.72s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  12%|#1        | 352/3000 [18:34<2:00:09,  2.72s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  12%|#1        | 352/3000 [18:38<2:00:09,  2.72s/it, lr: 1.0e-04 loss: 5.011e-02]hash_cache_v1:  12%|#1        | 352/3000 [18:38<2:00:09,  2.72s/it, lr: 1.0e-04 loss: 5.011e-02]hash_cache_v1:  12%|#1        | 353/3000 [18:38<2:20:33,  3.19s/it, lr: 1.0e-04 loss: 5.011e-02]hash_cache_v1:  12%|#1        | 353/3000 [18:38<2:20:33,  3.19s/it, lr: 1.0e-04 loss: 5.011e-02]hash_cache_v1:  12%|#1        | 353/3000 [18:43<2:20:33,  3.19s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  12%|#1        | 353/3000 [18:43<2:20:33,  3.19s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  12%|#1        | 354/3000 [18:43<2:33:40,  3.48s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  12%|#1        | 354/3000 [18:43<2:33:40,  3.48s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  12%|#1        | 354/3000 [18:45<2:33:40,  3.48s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:  12%|#1        | 354/3000 [18:45<2:33:40,  3.48s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:  12%|#1        | 355/3000 [18:45<2:16:39,  3.10s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:  12%|#1        | 355/3000 [18:45<2:16:39,  3.10s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:  12%|#1        | 355/3000 [18:47<2:16:39,  3.10s/it, lr: 1.0e-04 loss: 2.406e-01]hash_cache_v1:  12%|#1        | 355/3000 [18:47<2:16:39,  3.10s/it, lr: 1.0e-04 loss: 2.406e-01]hash_cache_v1:  12%|#1        | 356/3000 [18:47<2:04:07,  2.82s/it, lr: 1.0e-04 loss: 2.406e-01]hash_cache_v1:  12%|#1        | 356/3000 [18:47<2:04:07,  2.82s/it, lr: 1.0e-04 loss: 2.406e-01]hash_cache_v1:  12%|#1        | 356/3000 [18:50<2:04:07,  2.82s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  12%|#1        | 356/3000 [18:50<2:04:07,  2.82s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  12%|#1        | 357/3000 [18:50<2:07:35,  2.90s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  12%|#1        | 357/3000 [18:50<2:07:35,  2.90s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  12%|#1        | 357/3000 [18:53<2:07:35,  2.90s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  12%|#1        | 357/3000 [18:53<2:07:35,  2.90s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  12%|#1        | 358/3000 [18:53<2:07:07,  2.89s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  12%|#1        | 358/3000 [18:53<2:07:07,  2.89s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  12%|#1        | 358/3000 [18:57<2:07:07,  2.89s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  12%|#1        | 358/3000 [18:57<2:07:07,  2.89s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  12%|#1        | 359/3000 [18:57<2:25:16,  3.30s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  12%|#1        | 359/3000 [18:57<2:25:16,  3.30s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  12%|#1        | 359/3000 [19:00<2:25:16,  3.30s/it, lr: 1.0e-04 loss: 2.302e-01]hash_cache_v1:  12%|#1        | 359/3000 [19:00<2:25:16,  3.30s/it, lr: 1.0e-04 loss: 2.302e-01]hash_cache_v1:  12%|#2        | 360/3000 [19:04<2:25:13,  3.30s/it, lr: 1.0e-04 loss: 9.655e-02]hash_cache_v1:  12%|#2        | 360/3000 [19:04<2:25:13,  3.30s/it, lr: 1.0e-04 loss: 9.655e-02]hash_cache_v1:  12%|#2        | 361/3000 [19:04<2:02:13,  2.78s/it, lr: 1.0e-04 loss: 9.655e-02]hash_cache_v1:  12%|#2        | 361/3000 [19:04<2:02:13,  2.78s/it, lr: 1.0e-04 loss: 9.655e-02]hash_cache_v1:  12%|#2        | 361/3000 [19:07<2:02:13,  2.78s/it, lr: 1.0e-04 loss: 2.112e-01]hash_cache_v1:  12%|#2        | 361/3000 [19:07<2:02:13,  2.78s/it, lr: 1.0e-04 loss: 2.112e-01]hash_cache_v1:  12%|#2        | 362/3000 [19:07<2:03:26,  2.81s/it, lr: 1.0e-04 loss: 2.112e-01]hash_cache_v1:  12%|#2        | 362/3000 [19:07<2:03:26,  2.81s/it, lr: 1.0e-04 loss: 2.112e-01]hash_cache_v1:  12%|#2        | 362/3000 [19:11<2:03:26,  2.81s/it, lr: 1.0e-04 loss: 1.794e-01]hash_cache_v1:  12%|#2        | 362/3000 [19:11<2:03:26,  2.81s/it, lr: 1.0e-04 loss: 1.794e-01]hash_cache_v1:  12%|#2        | 363/3000 [19:11<2:20:47,  3.20s/it, lr: 1.0e-04 loss: 1.794e-01]hash_cache_v1:  12%|#2        | 363/3000 [19:11<2:20:47,  3.20s/it, lr: 1.0e-04 loss: 1.794e-01]hash_cache_v1:  12%|#2        | 363/3000 [19:15<2:20:47,  3.20s/it, lr: 1.0e-04 loss: 2.056e-01]hash_cache_v1:  12%|#2        | 363/3000 [19:15<2:20:47,  3.20s/it, lr: 1.0e-04 loss: 2.056e-01]hash_cache_v1:  12%|#2        | 364/3000 [19:15<2:19:26,  3.17s/it, lr: 1.0e-04 loss: 2.056e-01]hash_cache_v1:  12%|#2        | 364/3000 [19:15<2:19:26,  3.17s/it, lr: 1.0e-04 loss: 2.056e-01]hash_cache_v1:  12%|#2        | 364/3000 [19:17<2:19:26,  3.17s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  12%|#2        | 364/3000 [19:17<2:19:26,  3.17s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  12%|#2        | 365/3000 [19:17<2:15:45,  3.09s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  12%|#2        | 365/3000 [19:17<2:15:45,  3.09s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  12%|#2        | 365/3000 [19:22<2:15:45,  3.09s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  12%|#2        | 365/3000 [19:22<2:15:45,  3.09s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  12%|#2        | 366/3000 [19:22<2:31:17,  3.45s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  12%|#2        | 366/3000 [19:22<2:31:17,  3.45s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  12%|#2        | 366/3000 [19:25<2:31:17,  3.45s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  12%|#2        | 366/3000 [19:25<2:31:17,  3.45s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  12%|#2        | 367/3000 [19:25<2:24:01,  3.28s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  12%|#2        | 367/3000 [19:25<2:24:01,  3.28s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  12%|#2        | 367/3000 [19:27<2:24:01,  3.28s/it, lr: 1.0e-04 loss: 2.635e-01]hash_cache_v1:  12%|#2        | 367/3000 [19:27<2:24:01,  3.28s/it, lr: 1.0e-04 loss: 2.635e-01]hash_cache_v1:  12%|#2        | 368/3000 [19:27<2:12:27,  3.02s/it, lr: 1.0e-04 loss: 2.635e-01]hash_cache_v1:  12%|#2        | 368/3000 [19:27<2:12:27,  3.02s/it, lr: 1.0e-04 loss: 2.635e-01]hash_cache_v1:  12%|#2        | 368/3000 [19:30<2:12:27,  3.02s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  12%|#2        | 368/3000 [19:30<2:12:27,  3.02s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  12%|#2        | 369/3000 [19:30<2:10:31,  2.98s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  12%|#2        | 369/3000 [19:30<2:10:31,  2.98s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  12%|#2        | 369/3000 [19:34<2:10:31,  2.98s/it, lr: 1.0e-04 loss: 1.957e-01]hash_cache_v1:  12%|#2        | 369/3000 [19:34<2:10:31,  2.98s/it, lr: 1.0e-04 loss: 1.957e-01]hash_cache_v1:  12%|#2        | 370/3000 [19:37<2:10:28,  2.98s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  12%|#2        | 370/3000 [19:37<2:10:28,  2.98s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  12%|#2        | 371/3000 [19:37<1:41:43,  2.32s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  12%|#2        | 371/3000 [19:37<1:41:43,  2.32s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  12%|#2        | 371/3000 [19:42<1:41:43,  2.32s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  12%|#2        | 371/3000 [19:42<1:41:43,  2.32s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  12%|#2        | 372/3000 [19:42<2:02:58,  2.81s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  12%|#2        | 372/3000 [19:42<2:02:58,  2.81s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  12%|#2        | 372/3000 [19:46<2:02:58,  2.81s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  12%|#2        | 372/3000 [19:46<2:02:58,  2.81s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  12%|#2        | 373/3000 [19:46<2:19:37,  3.19s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  12%|#2        | 373/3000 [19:46<2:19:37,  3.19s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  12%|#2        | 373/3000 [19:49<2:19:37,  3.19s/it, lr: 1.0e-04 loss: 2.344e-01]hash_cache_v1:  12%|#2        | 373/3000 [19:49<2:19:37,  3.19s/it, lr: 1.0e-04 loss: 2.344e-01]hash_cache_v1:  12%|#2        | 374/3000 [19:49<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 2.344e-01]hash_cache_v1:  12%|#2        | 374/3000 [19:49<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 2.344e-01]hash_cache_v1:  12%|#2        | 374/3000 [19:52<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 2.385e-01]hash_cache_v1:  12%|#2        | 374/3000 [19:52<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 2.385e-01]hash_cache_v1:  12%|#2        | 375/3000 [19:52<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 2.385e-01]hash_cache_v1:  12%|#2        | 375/3000 [19:52<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 2.385e-01]hash_cache_v1:  12%|#2        | 375/3000 [19:55<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  12%|#2        | 375/3000 [19:55<2:15:58,  3.11s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  13%|#2        | 376/3000 [19:55<2:13:04,  3.04s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  13%|#2        | 376/3000 [19:55<2:13:04,  3.04s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  13%|#2        | 376/3000 [19:59<2:13:04,  3.04s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  13%|#2        | 376/3000 [19:59<2:13:04,  3.04s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  13%|#2        | 377/3000 [19:59<2:29:28,  3.42s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  13%|#2        | 377/3000 [19:59<2:29:28,  3.42s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  13%|#2        | 377/3000 [20:01<2:29:28,  3.42s/it, lr: 1.0e-04 loss: 2.728e-01]hash_cache_v1:  13%|#2        | 377/3000 [20:01<2:29:28,  3.42s/it, lr: 1.0e-04 loss: 2.728e-01]hash_cache_v1:  13%|#2        | 378/3000 [20:01<2:16:05,  3.11s/it, lr: 1.0e-04 loss: 2.728e-01]hash_cache_v1:  13%|#2        | 378/3000 [20:01<2:16:05,  3.11s/it, lr: 1.0e-04 loss: 2.728e-01]hash_cache_v1:  13%|#2        | 378/3000 [20:04<2:16:05,  3.11s/it, lr: 1.0e-04 loss: 2.175e-02]hash_cache_v1:  13%|#2        | 378/3000 [20:04<2:16:05,  3.11s/it, lr: 1.0e-04 loss: 2.175e-02]hash_cache_v1:  13%|#2        | 379/3000 [20:04<2:12:42,  3.04s/it, lr: 1.0e-04 loss: 2.175e-02]hash_cache_v1:  13%|#2        | 379/3000 [20:04<2:12:42,  3.04s/it, lr: 1.0e-04 loss: 2.175e-02]hash_cache_v1:  13%|#2        | 379/3000 [20:06<2:12:42,  3.04s/it, lr: 1.0e-04 loss: 2.840e-01]hash_cache_v1:  13%|#2        | 379/3000 [20:06<2:12:42,  3.04s/it, lr: 1.0e-04 loss: 2.840e-01]hash_cache_v1:  13%|#2        | 380/3000 [20:08<2:12:39,  3.04s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  13%|#2        | 380/3000 [20:08<2:12:39,  3.04s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  13%|#2        | 381/3000 [20:08<1:32:55,  2.13s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  13%|#2        | 381/3000 [20:08<1:32:55,  2.13s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  13%|#2        | 381/3000 [20:11<1:32:55,  2.13s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:  13%|#2        | 381/3000 [20:11<1:32:55,  2.13s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:  13%|#2        | 382/3000 [20:11<1:35:29,  2.19s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:  13%|#2        | 382/3000 [20:11<1:35:29,  2.19s/it, lr: 1.0e-04 loss: 2.183e-01]hash_cache_v1:  13%|#2        | 382/3000 [20:14<1:35:29,  2.19s/it, lr: 1.0e-04 loss: 1.922e-01]hash_cache_v1:  13%|#2        | 382/3000 [20:14<1:35:29,  2.19s/it, lr: 1.0e-04 loss: 1.922e-01]hash_cache_v1:  13%|#2        | 383/3000 [20:14<1:42:52,  2.36s/it, lr: 1.0e-04 loss: 1.922e-01]hash_cache_v1:  13%|#2        | 383/3000 [20:14<1:42:52,  2.36s/it, lr: 1.0e-04 loss: 1.922e-01]hash_cache_v1:  13%|#2        | 383/3000 [20:17<1:42:52,  2.36s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  13%|#2        | 383/3000 [20:17<1:42:52,  2.36s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  13%|#2        | 384/3000 [20:17<1:48:55,  2.50s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  13%|#2        | 384/3000 [20:17<1:48:55,  2.50s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  13%|#2        | 384/3000 [20:20<1:48:55,  2.50s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  13%|#2        | 384/3000 [20:20<1:48:55,  2.50s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  13%|#2        | 385/3000 [20:20<1:55:50,  2.66s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  13%|#2        | 385/3000 [20:20<1:55:50,  2.66s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  13%|#2        | 385/3000 [20:22<1:55:50,  2.66s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:  13%|#2        | 385/3000 [20:22<1:55:50,  2.66s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:  13%|#2        | 386/3000 [20:22<1:48:44,  2.50s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:  13%|#2        | 386/3000 [20:22<1:48:44,  2.50s/it, lr: 1.0e-04 loss: 2.087e-01]hash_cache_v1:  13%|#2        | 386/3000 [20:26<1:48:44,  2.50s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  13%|#2        | 386/3000 [20:26<1:48:44,  2.50s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  13%|#2        | 387/3000 [20:26<2:11:06,  3.01s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  13%|#2        | 387/3000 [20:26<2:11:06,  3.01s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  13%|#2        | 387/3000 [20:29<2:11:06,  3.01s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  13%|#2        | 387/3000 [20:29<2:11:06,  3.01s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  13%|#2        | 388/3000 [20:29<2:07:49,  2.94s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  13%|#2        | 388/3000 [20:29<2:07:49,  2.94s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  13%|#2        | 388/3000 [20:31<2:07:49,  2.94s/it, lr: 1.0e-04 loss: 1.352e-01]hash_cache_v1:  13%|#2        | 388/3000 [20:31<2:07:49,  2.94s/it, lr: 1.0e-04 loss: 1.352e-01]hash_cache_v1:  13%|#2        | 389/3000 [20:31<2:00:27,  2.77s/it, lr: 1.0e-04 loss: 1.352e-01]hash_cache_v1:  13%|#2        | 389/3000 [20:31<2:00:27,  2.77s/it, lr: 1.0e-04 loss: 1.352e-01]hash_cache_v1:  13%|#2        | 389/3000 [20:33<2:00:27,  2.77s/it, lr: 1.0e-04 loss: 2.674e-01]hash_cache_v1:  13%|#2        | 389/3000 [20:33<2:00:27,  2.77s/it, lr: 1.0e-04 loss: 2.674e-01]hash_cache_v1:  13%|#3        | 390/3000 [20:38<2:00:24,  2.77s/it, lr: 1.0e-04 loss: 8.507e-02]hash_cache_v1:  13%|#3        | 390/3000 [20:38<2:00:24,  2.77s/it, lr: 1.0e-04 loss: 8.507e-02]hash_cache_v1:  13%|#3        | 391/3000 [20:38<1:48:09,  2.49s/it, lr: 1.0e-04 loss: 8.507e-02]hash_cache_v1:  13%|#3        | 391/3000 [20:38<1:48:09,  2.49s/it, lr: 1.0e-04 loss: 8.507e-02]hash_cache_v1:  13%|#3        | 391/3000 [20:42<1:48:09,  2.49s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  13%|#3        | 391/3000 [20:42<1:48:09,  2.49s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  13%|#3        | 392/3000 [20:42<2:07:13,  2.93s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  13%|#3        | 392/3000 [20:42<2:07:13,  2.93s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  13%|#3        | 392/3000 [20:45<2:07:13,  2.93s/it, lr: 1.0e-04 loss: 9.504e-02]hash_cache_v1:  13%|#3        | 392/3000 [20:45<2:07:13,  2.93s/it, lr: 1.0e-04 loss: 9.504e-02]hash_cache_v1:  13%|#3        | 393/3000 [20:45<2:09:17,  2.98s/it, lr: 1.0e-04 loss: 9.504e-02]hash_cache_v1:  13%|#3        | 393/3000 [20:45<2:09:17,  2.98s/it, lr: 1.0e-04 loss: 9.504e-02]hash_cache_v1:  13%|#3        | 393/3000 [20:48<2:09:17,  2.98s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  13%|#3        | 393/3000 [20:48<2:09:17,  2.98s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  13%|#3        | 394/3000 [20:48<2:07:57,  2.95s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  13%|#3        | 394/3000 [20:48<2:07:57,  2.95s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  13%|#3        | 394/3000 [20:50<2:07:57,  2.95s/it, lr: 1.0e-04 loss: 3.290e-01]hash_cache_v1:  13%|#3        | 394/3000 [20:50<2:07:57,  2.95s/it, lr: 1.0e-04 loss: 3.290e-01]hash_cache_v1:  13%|#3        | 395/3000 [20:50<1:57:36,  2.71s/it, lr: 1.0e-04 loss: 3.290e-01]hash_cache_v1:  13%|#3        | 395/3000 [20:50<1:57:36,  2.71s/it, lr: 1.0e-04 loss: 3.290e-01]hash_cache_v1:  13%|#3        | 395/3000 [20:53<1:57:36,  2.71s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:  13%|#3        | 395/3000 [20:53<1:57:36,  2.71s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:  13%|#3        | 396/3000 [20:53<2:02:13,  2.82s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:  13%|#3        | 396/3000 [20:53<2:02:13,  2.82s/it, lr: 1.0e-04 loss: 1.949e-01]hash_cache_v1:  13%|#3        | 396/3000 [20:57<2:02:13,  2.82s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  13%|#3        | 396/3000 [20:57<2:02:13,  2.82s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  13%|#3        | 397/3000 [20:57<2:21:20,  3.26s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  13%|#3        | 397/3000 [20:57<2:21:20,  3.26s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  13%|#3        | 397/3000 [20:59<2:21:20,  3.26s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  13%|#3        | 397/3000 [20:59<2:21:20,  3.26s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  13%|#3        | 398/3000 [20:59<2:06:19,  2.91s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  13%|#3        | 398/3000 [20:59<2:06:19,  2.91s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  13%|#3        | 398/3000 [21:04<2:06:19,  2.91s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  13%|#3        | 398/3000 [21:04<2:06:19,  2.91s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  13%|#3        | 399/3000 [21:04<2:24:27,  3.33s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  13%|#3        | 399/3000 [21:04<2:24:27,  3.33s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  13%|#3        | 399/3000 [21:06<2:24:27,  3.33s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  13%|#3        | 399/3000 [21:06<2:24:27,  3.33s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  13%|#3        | 400/3000 [21:09<2:24:24,  3.33s/it, lr: 1.0e-04 loss: 1.972e-01]hash_cache_v1:  13%|#3        | 400/3000 [21:09<2:24:24,  3.33s/it, lr: 1.0e-04 loss: 1.972e-01]hash_cache_v1:  13%|#3        | 401/3000 [21:09<1:46:32,  2.46s/it, lr: 1.0e-04 loss: 1.972e-01]hash_cache_v1:  13%|#3        | 401/3000 [21:09<1:46:32,  2.46s/it, lr: 1.0e-04 loss: 1.972e-01]hash_cache_v1:  13%|#3        | 401/3000 [21:13<1:46:32,  2.46s/it, lr: 1.0e-04 loss: 7.372e-02]hash_cache_v1:  13%|#3        | 401/3000 [21:13<1:46:32,  2.46s/it, lr: 1.0e-04 loss: 7.372e-02]hash_cache_v1:  13%|#3        | 402/3000 [21:13<2:06:16,  2.92s/it, lr: 1.0e-04 loss: 7.372e-02]hash_cache_v1:  13%|#3        | 402/3000 [21:13<2:06:16,  2.92s/it, lr: 1.0e-04 loss: 7.372e-02]hash_cache_v1:  13%|#3        | 402/3000 [21:16<2:06:16,  2.92s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  13%|#3        | 402/3000 [21:16<2:06:16,  2.92s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  13%|#3        | 403/3000 [21:16<2:07:42,  2.95s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  13%|#3        | 403/3000 [21:16<2:07:42,  2.95s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  13%|#3        | 403/3000 [21:21<2:07:42,  2.95s/it, lr: 1.0e-04 loss: 1.774e-02]hash_cache_v1:  13%|#3        | 403/3000 [21:21<2:07:42,  2.95s/it, lr: 1.0e-04 loss: 1.774e-02]hash_cache_v1:  13%|#3        | 404/3000 [21:21<2:23:08,  3.31s/it, lr: 1.0e-04 loss: 1.774e-02]hash_cache_v1:  13%|#3        | 404/3000 [21:21<2:23:08,  3.31s/it, lr: 1.0e-04 loss: 1.774e-02]hash_cache_v1:  13%|#3        | 404/3000 [21:23<2:23:08,  3.31s/it, lr: 1.0e-04 loss: 2.044e-01]hash_cache_v1:  13%|#3        | 404/3000 [21:23<2:23:08,  3.31s/it, lr: 1.0e-04 loss: 2.044e-01]hash_cache_v1:  14%|#3        | 405/3000 [21:23<2:08:44,  2.98s/it, lr: 1.0e-04 loss: 2.044e-01]hash_cache_v1:  14%|#3        | 405/3000 [21:23<2:08:44,  2.98s/it, lr: 1.0e-04 loss: 2.044e-01]hash_cache_v1:  14%|#3        | 405/3000 [21:26<2:08:44,  2.98s/it, lr: 1.0e-04 loss: 2.053e-01]hash_cache_v1:  14%|#3        | 405/3000 [21:26<2:08:44,  2.98s/it, lr: 1.0e-04 loss: 2.053e-01]hash_cache_v1:  14%|#3        | 406/3000 [21:26<2:07:15,  2.94s/it, lr: 1.0e-04 loss: 2.053e-01]hash_cache_v1:  14%|#3        | 406/3000 [21:26<2:07:15,  2.94s/it, lr: 1.0e-04 loss: 2.053e-01]hash_cache_v1:  14%|#3        | 406/3000 [21:28<2:07:15,  2.94s/it, lr: 1.0e-04 loss: 2.641e-01]hash_cache_v1:  14%|#3        | 406/3000 [21:28<2:07:15,  2.94s/it, lr: 1.0e-04 loss: 2.641e-01]hash_cache_v1:  14%|#3        | 407/3000 [21:28<2:00:13,  2.78s/it, lr: 1.0e-04 loss: 2.641e-01]hash_cache_v1:  14%|#3        | 407/3000 [21:28<2:00:13,  2.78s/it, lr: 1.0e-04 loss: 2.641e-01]hash_cache_v1:  14%|#3        | 407/3000 [21:30<2:00:13,  2.78s/it, lr: 1.0e-04 loss: 2.684e-01]hash_cache_v1:  14%|#3        | 407/3000 [21:30<2:00:13,  2.78s/it, lr: 1.0e-04 loss: 2.684e-01]hash_cache_v1:  14%|#3        | 408/3000 [21:30<1:51:47,  2.59s/it, lr: 1.0e-04 loss: 2.684e-01]hash_cache_v1:  14%|#3        | 408/3000 [21:30<1:51:47,  2.59s/it, lr: 1.0e-04 loss: 2.684e-01]hash_cache_v1:  14%|#3        | 408/3000 [21:33<1:51:47,  2.59s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  14%|#3        | 408/3000 [21:33<1:51:47,  2.59s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  14%|#3        | 409/3000 [21:33<1:55:23,  2.67s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  14%|#3        | 409/3000 [21:33<1:55:23,  2.67s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  14%|#3        | 409/3000 [21:36<1:55:23,  2.67s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:  14%|#3        | 409/3000 [21:36<1:55:23,  2.67s/it, lr: 1.0e-04 loss: 2.147e-01]hash_cache_v1:  14%|#3        | 410/3000 [21:40<1:55:20,  2.67s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  14%|#3        | 410/3000 [21:40<1:55:20,  2.67s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  14%|#3        | 411/3000 [21:40<1:45:06,  2.44s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  14%|#3        | 411/3000 [21:40<1:45:06,  2.44s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  14%|#3        | 411/3000 [21:42<1:45:06,  2.44s/it, lr: 1.0e-04 loss: 6.692e-03]hash_cache_v1:  14%|#3        | 411/3000 [21:42<1:45:06,  2.44s/it, lr: 1.0e-04 loss: 6.692e-03]hash_cache_v1:  14%|#3        | 412/3000 [21:42<1:41:37,  2.36s/it, lr: 1.0e-04 loss: 6.692e-03]hash_cache_v1:  14%|#3        | 412/3000 [21:42<1:41:37,  2.36s/it, lr: 1.0e-04 loss: 6.692e-03]hash_cache_v1:  14%|#3        | 412/3000 [21:45<1:41:37,  2.36s/it, lr: 1.0e-04 loss: 2.561e-01]hash_cache_v1:  14%|#3        | 412/3000 [21:45<1:41:37,  2.36s/it, lr: 1.0e-04 loss: 2.561e-01]hash_cache_v1:  14%|#3        | 413/3000 [21:45<1:38:50,  2.29s/it, lr: 1.0e-04 loss: 2.561e-01]hash_cache_v1:  14%|#3        | 413/3000 [21:45<1:38:50,  2.29s/it, lr: 1.0e-04 loss: 2.561e-01]hash_cache_v1:  14%|#3        | 413/3000 [21:47<1:38:50,  2.29s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  14%|#3        | 413/3000 [21:47<1:38:50,  2.29s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  14%|#3        | 414/3000 [21:47<1:39:47,  2.32s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  14%|#3        | 414/3000 [21:47<1:39:47,  2.32s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  14%|#3        | 414/3000 [21:49<1:39:47,  2.32s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  14%|#3        | 414/3000 [21:49<1:39:47,  2.32s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  14%|#3        | 415/3000 [21:49<1:37:16,  2.26s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  14%|#3        | 415/3000 [21:49<1:37:16,  2.26s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  14%|#3        | 415/3000 [21:51<1:37:16,  2.26s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  14%|#3        | 415/3000 [21:51<1:37:16,  2.26s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  14%|#3        | 416/3000 [21:51<1:35:24,  2.22s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  14%|#3        | 416/3000 [21:51<1:35:24,  2.22s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  14%|#3        | 416/3000 [21:54<1:35:24,  2.22s/it, lr: 1.0e-04 loss: 2.439e-01]hash_cache_v1:  14%|#3        | 416/3000 [21:54<1:35:24,  2.22s/it, lr: 1.0e-04 loss: 2.439e-01]hash_cache_v1:  14%|#3        | 417/3000 [21:54<1:37:26,  2.26s/it, lr: 1.0e-04 loss: 2.439e-01]hash_cache_v1:  14%|#3        | 417/3000 [21:54<1:37:26,  2.26s/it, lr: 1.0e-04 loss: 2.439e-01]hash_cache_v1:  14%|#3        | 417/3000 [21:56<1:37:26,  2.26s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  14%|#3        | 417/3000 [21:56<1:37:26,  2.26s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  14%|#3        | 418/3000 [21:56<1:35:17,  2.21s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  14%|#3        | 418/3000 [21:56<1:35:17,  2.21s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  14%|#3        | 418/3000 [21:58<1:35:17,  2.21s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  14%|#3        | 418/3000 [21:58<1:35:17,  2.21s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  14%|#3        | 419/3000 [21:58<1:41:56,  2.37s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  14%|#3        | 419/3000 [21:58<1:41:56,  2.37s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  14%|#3        | 419/3000 [22:00<1:41:56,  2.37s/it, lr: 1.0e-04 loss: 2.636e-01]hash_cache_v1:  14%|#3        | 419/3000 [22:00<1:41:56,  2.37s/it, lr: 1.0e-04 loss: 2.636e-01]hash_cache_v1:  14%|#4        | 420/3000 [22:04<1:41:54,  2.37s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  14%|#4        | 420/3000 [22:04<1:41:54,  2.37s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  14%|#4        | 421/3000 [22:04<1:25:23,  1.99s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  14%|#4        | 421/3000 [22:04<1:25:23,  1.99s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  14%|#4        | 421/3000 [22:08<1:25:23,  1.99s/it, lr: 1.0e-04 loss: 3.846e-02]hash_cache_v1:  14%|#4        | 421/3000 [22:08<1:25:23,  1.99s/it, lr: 1.0e-04 loss: 3.846e-02]hash_cache_v1:  14%|#4        | 422/3000 [22:08<1:48:38,  2.53s/it, lr: 1.0e-04 loss: 3.846e-02]hash_cache_v1:  14%|#4        | 422/3000 [22:08<1:48:38,  2.53s/it, lr: 1.0e-04 loss: 3.846e-02]hash_cache_v1:  14%|#4        | 422/3000 [22:10<1:48:38,  2.53s/it, lr: 1.0e-04 loss: 8.055e-02]hash_cache_v1:  14%|#4        | 422/3000 [22:10<1:48:38,  2.53s/it, lr: 1.0e-04 loss: 8.055e-02]hash_cache_v1:  14%|#4        | 423/3000 [22:10<1:43:47,  2.42s/it, lr: 1.0e-04 loss: 8.055e-02]hash_cache_v1:  14%|#4        | 423/3000 [22:10<1:43:47,  2.42s/it, lr: 1.0e-04 loss: 8.055e-02]hash_cache_v1:  14%|#4        | 423/3000 [22:14<1:43:47,  2.42s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  14%|#4        | 423/3000 [22:14<1:43:47,  2.42s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  14%|#4        | 424/3000 [22:14<2:07:51,  2.98s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  14%|#4        | 424/3000 [22:14<2:07:51,  2.98s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  14%|#4        | 424/3000 [22:17<2:07:51,  2.98s/it, lr: 1.0e-04 loss: 2.118e-01]hash_cache_v1:  14%|#4        | 424/3000 [22:17<2:07:51,  2.98s/it, lr: 1.0e-04 loss: 2.118e-01]hash_cache_v1:  14%|#4        | 425/3000 [22:17<2:06:36,  2.95s/it, lr: 1.0e-04 loss: 2.118e-01]hash_cache_v1:  14%|#4        | 425/3000 [22:17<2:06:36,  2.95s/it, lr: 1.0e-04 loss: 2.118e-01]hash_cache_v1:  14%|#4        | 425/3000 [22:19<2:06:36,  2.95s/it, lr: 1.0e-04 loss: 2.543e-01]hash_cache_v1:  14%|#4        | 425/3000 [22:19<2:06:36,  2.95s/it, lr: 1.0e-04 loss: 2.543e-01]hash_cache_v1:  14%|#4        | 426/3000 [22:19<1:56:16,  2.71s/it, lr: 1.0e-04 loss: 2.543e-01]hash_cache_v1:  14%|#4        | 426/3000 [22:19<1:56:16,  2.71s/it, lr: 1.0e-04 loss: 2.543e-01]hash_cache_v1:  14%|#4        | 426/3000 [22:22<1:56:16,  2.71s/it, lr: 1.0e-04 loss: 7.563e-02]hash_cache_v1:  14%|#4        | 426/3000 [22:22<1:56:16,  2.71s/it, lr: 1.0e-04 loss: 7.563e-02]hash_cache_v1:  14%|#4        | 427/3000 [22:22<1:56:52,  2.73s/it, lr: 1.0e-04 loss: 7.563e-02]hash_cache_v1:  14%|#4        | 427/3000 [22:22<1:56:52,  2.73s/it, lr: 1.0e-04 loss: 7.563e-02]hash_cache_v1:  14%|#4        | 427/3000 [22:27<1:56:52,  2.73s/it, lr: 1.0e-04 loss: 1.293e-01]hash_cache_v1:  14%|#4        | 427/3000 [22:27<1:56:52,  2.73s/it, lr: 1.0e-04 loss: 1.293e-01]hash_cache_v1:  14%|#4        | 428/3000 [22:27<2:18:45,  3.24s/it, lr: 1.0e-04 loss: 1.293e-01]hash_cache_v1:  14%|#4        | 428/3000 [22:27<2:18:45,  3.24s/it, lr: 1.0e-04 loss: 1.293e-01]hash_cache_v1:  14%|#4        | 428/3000 [22:29<2:18:45,  3.24s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  14%|#4        | 428/3000 [22:29<2:18:45,  3.24s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  14%|#4        | 429/3000 [22:29<2:04:19,  2.90s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  14%|#4        | 429/3000 [22:29<2:04:19,  2.90s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  14%|#4        | 429/3000 [22:33<2:04:19,  2.90s/it, lr: 1.0e-04 loss: 1.890e-01]hash_cache_v1:  14%|#4        | 429/3000 [22:33<2:04:19,  2.90s/it, lr: 1.0e-04 loss: 1.890e-01]hash_cache_v1:  14%|#4        | 430/3000 [22:37<2:04:16,  2.90s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  14%|#4        | 430/3000 [22:37<2:04:16,  2.90s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  14%|#4        | 431/3000 [22:37<1:50:35,  2.58s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  14%|#4        | 431/3000 [22:37<1:50:35,  2.58s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  14%|#4        | 431/3000 [22:40<1:50:35,  2.58s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  14%|#4        | 431/3000 [22:40<1:50:35,  2.58s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  14%|#4        | 432/3000 [22:40<1:53:21,  2.65s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  14%|#4        | 432/3000 [22:40<1:53:21,  2.65s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  14%|#4        | 432/3000 [22:44<1:53:21,  2.65s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  14%|#4        | 432/3000 [22:44<1:53:21,  2.65s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  14%|#4        | 433/3000 [22:45<2:11:41,  3.08s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  14%|#4        | 433/3000 [22:45<2:11:41,  3.08s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  14%|#4        | 433/3000 [22:49<2:11:41,  3.08s/it, lr: 1.0e-04 loss: 1.083e-01]hash_cache_v1:  14%|#4        | 433/3000 [22:49<2:11:41,  3.08s/it, lr: 1.0e-04 loss: 1.083e-01]hash_cache_v1:  14%|#4        | 434/3000 [22:49<2:26:09,  3.42s/it, lr: 1.0e-04 loss: 1.083e-01]hash_cache_v1:  14%|#4        | 434/3000 [22:49<2:26:09,  3.42s/it, lr: 1.0e-04 loss: 1.083e-01]hash_cache_v1:  14%|#4        | 434/3000 [22:53<2:26:09,  3.42s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:  14%|#4        | 434/3000 [22:53<2:26:09,  3.42s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:  14%|#4        | 435/3000 [22:53<2:39:36,  3.73s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:  14%|#4        | 435/3000 [22:53<2:39:36,  3.73s/it, lr: 1.0e-04 loss: 1.931e-01]hash_cache_v1:  14%|#4        | 435/3000 [22:55<2:39:36,  3.73s/it, lr: 1.0e-04 loss: 3.083e-01]hash_cache_v1:  14%|#4        | 435/3000 [22:55<2:39:36,  3.73s/it, lr: 1.0e-04 loss: 3.083e-01]hash_cache_v1:  15%|#4        | 436/3000 [22:55<2:19:45,  3.27s/it, lr: 1.0e-04 loss: 3.083e-01]hash_cache_v1:  15%|#4        | 436/3000 [22:55<2:19:45,  3.27s/it, lr: 1.0e-04 loss: 3.083e-01]hash_cache_v1:  15%|#4        | 436/3000 [23:00<2:19:45,  3.27s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  15%|#4        | 436/3000 [23:00<2:19:45,  3.27s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  15%|#4        | 437/3000 [23:00<2:32:40,  3.57s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  15%|#4        | 437/3000 [23:00<2:32:40,  3.57s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  15%|#4        | 437/3000 [23:02<2:32:40,  3.57s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  15%|#4        | 437/3000 [23:02<2:32:40,  3.57s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  15%|#4        | 438/3000 [23:02<2:14:20,  3.15s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  15%|#4        | 438/3000 [23:02<2:14:20,  3.15s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  15%|#4        | 438/3000 [23:06<2:14:20,  3.15s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  15%|#4        | 438/3000 [23:06<2:14:20,  3.15s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  15%|#4        | 439/3000 [23:06<2:32:06,  3.56s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  15%|#4        | 439/3000 [23:06<2:32:06,  3.56s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  15%|#4        | 439/3000 [23:11<2:32:06,  3.56s/it, lr: 1.0e-04 loss: 7.197e-02]hash_cache_v1:  15%|#4        | 439/3000 [23:11<2:32:06,  3.56s/it, lr: 1.0e-04 loss: 7.197e-02]hash_cache_v1:  15%|#4        | 440/3000 [23:14<2:32:02,  3.56s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  15%|#4        | 440/3000 [23:14<2:32:02,  3.56s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  15%|#4        | 441/3000 [23:14<1:50:12,  2.58s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  15%|#4        | 441/3000 [23:14<1:50:12,  2.58s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  15%|#4        | 441/3000 [23:18<1:50:12,  2.58s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  15%|#4        | 441/3000 [23:18<1:50:12,  2.58s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  15%|#4        | 442/3000 [23:18<2:10:23,  3.06s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  15%|#4        | 442/3000 [23:18<2:10:23,  3.06s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  15%|#4        | 442/3000 [23:21<2:10:23,  3.06s/it, lr: 1.0e-04 loss: 1.505e-01]hash_cache_v1:  15%|#4        | 442/3000 [23:21<2:10:23,  3.06s/it, lr: 1.0e-04 loss: 1.505e-01]hash_cache_v1:  15%|#4        | 443/3000 [23:21<2:08:17,  3.01s/it, lr: 1.0e-04 loss: 1.505e-01]hash_cache_v1:  15%|#4        | 443/3000 [23:21<2:08:17,  3.01s/it, lr: 1.0e-04 loss: 1.505e-01]hash_cache_v1:  15%|#4        | 443/3000 [23:25<2:08:17,  3.01s/it, lr: 1.0e-04 loss: 1.484e-01]hash_cache_v1:  15%|#4        | 443/3000 [23:25<2:08:17,  3.01s/it, lr: 1.0e-04 loss: 1.484e-01]hash_cache_v1:  15%|#4        | 444/3000 [23:25<2:22:50,  3.35s/it, lr: 1.0e-04 loss: 1.484e-01]hash_cache_v1:  15%|#4        | 444/3000 [23:25<2:22:50,  3.35s/it, lr: 1.0e-04 loss: 1.484e-01]hash_cache_v1:  15%|#4        | 444/3000 [23:30<2:22:50,  3.35s/it, lr: 1.0e-04 loss: 1.200e-01]hash_cache_v1:  15%|#4        | 444/3000 [23:30<2:22:50,  3.35s/it, lr: 1.0e-04 loss: 1.200e-01]hash_cache_v1:  15%|#4        | 445/3000 [23:30<2:33:52,  3.61s/it, lr: 1.0e-04 loss: 1.200e-01]hash_cache_v1:  15%|#4        | 445/3000 [23:30<2:33:52,  3.61s/it, lr: 1.0e-04 loss: 1.200e-01]hash_cache_v1:  15%|#4        | 445/3000 [23:32<2:33:52,  3.61s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  15%|#4        | 445/3000 [23:32<2:33:52,  3.61s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  15%|#4        | 446/3000 [23:32<2:18:28,  3.25s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  15%|#4        | 446/3000 [23:32<2:18:28,  3.25s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  15%|#4        | 446/3000 [23:35<2:18:28,  3.25s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  15%|#4        | 446/3000 [23:35<2:18:28,  3.25s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  15%|#4        | 447/3000 [23:35<2:13:42,  3.14s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  15%|#4        | 447/3000 [23:35<2:13:42,  3.14s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  15%|#4        | 447/3000 [23:37<2:13:42,  3.14s/it, lr: 1.0e-04 loss: 2.904e-01]hash_cache_v1:  15%|#4        | 447/3000 [23:37<2:13:42,  3.14s/it, lr: 1.0e-04 loss: 2.904e-01]hash_cache_v1:  15%|#4        | 448/3000 [23:37<2:00:42,  2.84s/it, lr: 1.0e-04 loss: 2.904e-01]hash_cache_v1:  15%|#4        | 448/3000 [23:37<2:00:42,  2.84s/it, lr: 1.0e-04 loss: 2.904e-01]hash_cache_v1:  15%|#4        | 448/3000 [23:41<2:00:42,  2.84s/it, lr: 1.0e-04 loss: 1.551e-01]hash_cache_v1:  15%|#4        | 448/3000 [23:41<2:00:42,  2.84s/it, lr: 1.0e-04 loss: 1.551e-01]hash_cache_v1:  15%|#4        | 449/3000 [23:41<2:21:23,  3.33s/it, lr: 1.0e-04 loss: 1.551e-01]hash_cache_v1:  15%|#4        | 449/3000 [23:41<2:21:23,  3.33s/it, lr: 1.0e-04 loss: 1.551e-01]hash_cache_v1:  15%|#4        | 449/3000 [23:45<2:21:23,  3.33s/it, lr: 1.0e-04 loss: 1.727e-01]hash_cache_v1:  15%|#4        | 449/3000 [23:45<2:21:23,  3.33s/it, lr: 1.0e-04 loss: 1.727e-01]hash_cache_v1:  15%|#5        | 450/3000 [23:47<2:21:19,  3.33s/it, lr: 1.0e-04 loss: 2.466e-01]hash_cache_v1:  15%|#5        | 450/3000 [23:47<2:21:19,  3.33s/it, lr: 1.0e-04 loss: 2.466e-01]hash_cache_v1:  15%|#5        | 451/3000 [23:47<1:37:02,  2.28s/it, lr: 1.0e-04 loss: 2.466e-01]hash_cache_v1:  15%|#5        | 451/3000 [23:47<1:37:02,  2.28s/it, lr: 1.0e-04 loss: 2.466e-01]hash_cache_v1:  15%|#5        | 451/3000 [23:51<1:37:02,  2.28s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  15%|#5        | 451/3000 [23:51<1:37:02,  2.28s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  15%|#5        | 452/3000 [23:51<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  15%|#5        | 452/3000 [23:51<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  15%|#5        | 452/3000 [23:54<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  15%|#5        | 452/3000 [23:54<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  15%|#5        | 453/3000 [23:54<1:55:26,  2.72s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  15%|#5        | 453/3000 [23:54<1:55:26,  2.72s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  15%|#5        | 453/3000 [23:56<1:55:26,  2.72s/it, lr: 1.0e-04 loss: 2.097e-01]hash_cache_v1:  15%|#5        | 453/3000 [23:56<1:55:26,  2.72s/it, lr: 1.0e-04 loss: 2.097e-01]hash_cache_v1:  15%|#5        | 454/3000 [23:56<1:57:04,  2.76s/it, lr: 1.0e-04 loss: 2.097e-01]hash_cache_v1:  15%|#5        | 454/3000 [23:56<1:57:04,  2.76s/it, lr: 1.0e-04 loss: 2.097e-01]hash_cache_v1:  15%|#5        | 454/3000 [23:59<1:57:04,  2.76s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:  15%|#5        | 454/3000 [23:59<1:57:04,  2.76s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:  15%|#5        | 455/3000 [23:59<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:  15%|#5        | 455/3000 [23:59<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 1.993e-01]hash_cache_v1:  15%|#5        | 455/3000 [24:02<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  15%|#5        | 455/3000 [24:02<1:58:23,  2.79s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  15%|#5        | 456/3000 [24:02<2:01:43,  2.87s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  15%|#5        | 456/3000 [24:02<2:01:43,  2.87s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  15%|#5        | 456/3000 [24:04<2:01:43,  2.87s/it, lr: 1.0e-04 loss: 2.750e-01]hash_cache_v1:  15%|#5        | 456/3000 [24:04<2:01:43,  2.87s/it, lr: 1.0e-04 loss: 2.750e-01]hash_cache_v1:  15%|#5        | 457/3000 [24:04<1:51:58,  2.64s/it, lr: 1.0e-04 loss: 2.750e-01]hash_cache_v1:  15%|#5        | 457/3000 [24:04<1:51:58,  2.64s/it, lr: 1.0e-04 loss: 2.750e-01]hash_cache_v1:  15%|#5        | 457/3000 [24:09<1:51:58,  2.64s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  15%|#5        | 457/3000 [24:09<1:51:58,  2.64s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  15%|#5        | 458/3000 [24:09<2:13:00,  3.14s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  15%|#5        | 458/3000 [24:09<2:13:00,  3.14s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  15%|#5        | 458/3000 [24:11<2:13:00,  3.14s/it, lr: 1.0e-04 loss: 9.453e-02]hash_cache_v1:  15%|#5        | 458/3000 [24:11<2:13:00,  3.14s/it, lr: 1.0e-04 loss: 9.453e-02]hash_cache_v1:  15%|#5        | 459/3000 [24:11<2:00:00,  2.83s/it, lr: 1.0e-04 loss: 9.453e-02]hash_cache_v1:  15%|#5        | 459/3000 [24:11<2:00:00,  2.83s/it, lr: 1.0e-04 loss: 9.453e-02]hash_cache_v1:  15%|#5        | 459/3000 [24:15<2:00:00,  2.83s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:  15%|#5        | 459/3000 [24:15<2:00:00,  2.83s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:  15%|#5        | 460/3000 [24:18<1:59:57,  2.83s/it, lr: 1.0e-04 loss: 2.218e-01]hash_cache_v1:  15%|#5        | 460/3000 [24:18<1:59:57,  2.83s/it, lr: 1.0e-04 loss: 2.218e-01]hash_cache_v1:  15%|#5        | 461/3000 [24:18<1:32:53,  2.20s/it, lr: 1.0e-04 loss: 2.218e-01]hash_cache_v1:  15%|#5        | 461/3000 [24:18<1:32:53,  2.20s/it, lr: 1.0e-04 loss: 2.218e-01]hash_cache_v1:  15%|#5        | 461/3000 [24:23<1:32:53,  2.20s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  15%|#5        | 461/3000 [24:23<1:32:53,  2.20s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  15%|#5        | 462/3000 [24:23<1:54:59,  2.72s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  15%|#5        | 462/3000 [24:23<1:54:59,  2.72s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  15%|#5        | 462/3000 [24:25<1:54:59,  2.72s/it, lr: 1.0e-04 loss: 7.507e-02]hash_cache_v1:  15%|#5        | 462/3000 [24:25<1:54:59,  2.72s/it, lr: 1.0e-04 loss: 7.507e-02]hash_cache_v1:  15%|#5        | 463/3000 [24:25<1:56:41,  2.76s/it, lr: 1.0e-04 loss: 7.507e-02]hash_cache_v1:  15%|#5        | 463/3000 [24:25<1:56:41,  2.76s/it, lr: 1.0e-04 loss: 7.507e-02]hash_cache_v1:  15%|#5        | 463/3000 [24:28<1:56:41,  2.76s/it, lr: 1.0e-04 loss: 2.384e-01]hash_cache_v1:  15%|#5        | 463/3000 [24:28<1:56:41,  2.76s/it, lr: 1.0e-04 loss: 2.384e-01]hash_cache_v1:  15%|#5        | 464/3000 [24:28<1:52:01,  2.65s/it, lr: 1.0e-04 loss: 2.384e-01]hash_cache_v1:  15%|#5        | 464/3000 [24:28<1:52:01,  2.65s/it, lr: 1.0e-04 loss: 2.384e-01]hash_cache_v1:  15%|#5        | 464/3000 [24:32<1:52:01,  2.65s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  15%|#5        | 464/3000 [24:32<1:52:01,  2.65s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  16%|#5        | 465/3000 [24:32<2:11:58,  3.12s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  16%|#5        | 465/3000 [24:32<2:11:58,  3.12s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  16%|#5        | 465/3000 [24:36<2:11:58,  3.12s/it, lr: 1.0e-04 loss: 2.043e-02]hash_cache_v1:  16%|#5        | 465/3000 [24:36<2:11:58,  3.12s/it, lr: 1.0e-04 loss: 2.043e-02]hash_cache_v1:  16%|#5        | 466/3000 [24:36<2:26:30,  3.47s/it, lr: 1.0e-04 loss: 2.043e-02]hash_cache_v1:  16%|#5        | 466/3000 [24:36<2:26:30,  3.47s/it, lr: 1.0e-04 loss: 2.043e-02]hash_cache_v1:  16%|#5        | 466/3000 [24:39<2:26:30,  3.47s/it, lr: 1.0e-04 loss: 6.726e-03]hash_cache_v1:  16%|#5        | 466/3000 [24:39<2:26:30,  3.47s/it, lr: 1.0e-04 loss: 6.726e-03]hash_cache_v1:  16%|#5        | 467/3000 [24:39<2:12:58,  3.15s/it, lr: 1.0e-04 loss: 6.726e-03]hash_cache_v1:  16%|#5        | 467/3000 [24:39<2:12:58,  3.15s/it, lr: 1.0e-04 loss: 6.726e-03]hash_cache_v1:  16%|#5        | 467/3000 [24:43<2:12:58,  3.15s/it, lr: 1.0e-04 loss: 1.590e-01]hash_cache_v1:  16%|#5        | 467/3000 [24:43<2:12:58,  3.15s/it, lr: 1.0e-04 loss: 1.590e-01]hash_cache_v1:  16%|#5        | 468/3000 [24:43<2:27:16,  3.49s/it, lr: 1.0e-04 loss: 1.590e-01]hash_cache_v1:  16%|#5        | 468/3000 [24:43<2:27:16,  3.49s/it, lr: 1.0e-04 loss: 1.590e-01]hash_cache_v1:  16%|#5        | 468/3000 [24:45<2:27:16,  3.49s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  16%|#5        | 468/3000 [24:45<2:27:16,  3.49s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  16%|#5        | 469/3000 [24:45<2:09:55,  3.08s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  16%|#5        | 469/3000 [24:45<2:09:55,  3.08s/it, lr: 1.0e-04 loss: 2.192e-01]hash_cache_v1:  16%|#5        | 469/3000 [24:47<2:09:55,  3.08s/it, lr: 1.0e-04 loss: 2.171e-01]hash_cache_v1:  16%|#5        | 469/3000 [24:47<2:09:55,  3.08s/it, lr: 1.0e-04 loss: 2.171e-01]hash_cache_v1:  16%|#5        | 470/3000 [24:52<2:09:52,  3.08s/it, lr: 1.0e-04 loss: 2.058e-01]hash_cache_v1:  16%|#5        | 470/3000 [24:52<2:09:52,  3.08s/it, lr: 1.0e-04 loss: 2.058e-01]hash_cache_v1:  16%|#5        | 471/3000 [24:52<1:54:11,  2.71s/it, lr: 1.0e-04 loss: 2.058e-01]hash_cache_v1:  16%|#5        | 471/3000 [24:52<1:54:11,  2.71s/it, lr: 1.0e-04 loss: 2.058e-01]hash_cache_v1:  16%|#5        | 471/3000 [24:56<1:54:11,  2.71s/it, lr: 1.0e-04 loss: 1.015e-01]hash_cache_v1:  16%|#5        | 471/3000 [24:56<1:54:11,  2.71s/it, lr: 1.0e-04 loss: 1.015e-01]hash_cache_v1:  16%|#5        | 472/3000 [24:56<2:10:36,  3.10s/it, lr: 1.0e-04 loss: 1.015e-01]hash_cache_v1:  16%|#5        | 472/3000 [24:56<2:10:36,  3.10s/it, lr: 1.0e-04 loss: 1.015e-01]hash_cache_v1:  16%|#5        | 472/3000 [25:00<2:10:36,  3.10s/it, lr: 1.0e-04 loss: 2.180e-02]hash_cache_v1:  16%|#5        | 472/3000 [25:00<2:10:36,  3.10s/it, lr: 1.0e-04 loss: 2.180e-02]hash_cache_v1:  16%|#5        | 473/3000 [25:00<2:23:25,  3.41s/it, lr: 1.0e-04 loss: 2.180e-02]hash_cache_v1:  16%|#5        | 473/3000 [25:00<2:23:25,  3.41s/it, lr: 1.0e-04 loss: 2.180e-02]hash_cache_v1:  16%|#5        | 473/3000 [25:03<2:23:25,  3.41s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  16%|#5        | 473/3000 [25:03<2:23:25,  3.41s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  16%|#5        | 474/3000 [25:03<2:11:39,  3.13s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  16%|#5        | 474/3000 [25:03<2:11:39,  3.13s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  16%|#5        | 474/3000 [25:05<2:11:39,  3.13s/it, lr: 1.0e-04 loss: 1.821e-01]hash_cache_v1:  16%|#5        | 474/3000 [25:05<2:11:39,  3.13s/it, lr: 1.0e-04 loss: 1.821e-01]hash_cache_v1:  16%|#5        | 475/3000 [25:05<1:59:29,  2.84s/it, lr: 1.0e-04 loss: 1.821e-01]hash_cache_v1:  16%|#5        | 475/3000 [25:05<1:59:29,  2.84s/it, lr: 1.0e-04 loss: 1.821e-01]hash_cache_v1:  16%|#5        | 475/3000 [25:07<1:59:29,  2.84s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  16%|#5        | 475/3000 [25:07<1:59:29,  2.84s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  16%|#5        | 476/3000 [25:07<1:50:41,  2.63s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  16%|#5        | 476/3000 [25:07<1:50:41,  2.63s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  16%|#5        | 476/3000 [25:10<1:50:41,  2.63s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  16%|#5        | 476/3000 [25:10<1:50:41,  2.63s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  16%|#5        | 477/3000 [25:10<1:53:07,  2.69s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  16%|#5        | 477/3000 [25:10<1:53:07,  2.69s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  16%|#5        | 477/3000 [25:13<1:53:07,  2.69s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:  16%|#5        | 477/3000 [25:13<1:53:07,  2.69s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:  16%|#5        | 478/3000 [25:13<1:58:07,  2.81s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:  16%|#5        | 478/3000 [25:13<1:58:07,  2.81s/it, lr: 1.0e-04 loss: 1.942e-01]hash_cache_v1:  16%|#5        | 478/3000 [25:16<1:58:07,  2.81s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  16%|#5        | 478/3000 [25:16<1:58:07,  2.81s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  16%|#5        | 479/3000 [25:16<1:58:28,  2.82s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  16%|#5        | 479/3000 [25:16<1:58:28,  2.82s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  16%|#5        | 479/3000 [25:19<1:58:28,  2.82s/it, lr: 1.0e-04 loss: 4.568e-02]hash_cache_v1:  16%|#5        | 479/3000 [25:19<1:58:28,  2.82s/it, lr: 1.0e-04 loss: 4.568e-02]hash_cache_v1:  16%|#6        | 480/3000 [25:22<1:58:25,  2.82s/it, lr: 1.0e-04 loss: 9.378e-02]hash_cache_v1:  16%|#6        | 480/3000 [25:22<1:58:25,  2.82s/it, lr: 1.0e-04 loss: 9.378e-02]hash_cache_v1:  16%|#6        | 481/3000 [25:22<1:33:31,  2.23s/it, lr: 1.0e-04 loss: 9.378e-02]hash_cache_v1:  16%|#6        | 481/3000 [25:22<1:33:31,  2.23s/it, lr: 1.0e-04 loss: 9.378e-02]hash_cache_v1:  16%|#6        | 481/3000 [25:26<1:33:31,  2.23s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  16%|#6        | 481/3000 [25:26<1:33:31,  2.23s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  16%|#6        | 482/3000 [25:26<1:54:59,  2.74s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  16%|#6        | 482/3000 [25:26<1:54:59,  2.74s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  16%|#6        | 482/3000 [25:30<1:54:59,  2.74s/it, lr: 1.0e-04 loss: 7.387e-02]hash_cache_v1:  16%|#6        | 482/3000 [25:30<1:54:59,  2.74s/it, lr: 1.0e-04 loss: 7.387e-02]hash_cache_v1:  16%|#6        | 483/3000 [25:30<2:12:09,  3.15s/it, lr: 1.0e-04 loss: 7.387e-02]hash_cache_v1:  16%|#6        | 483/3000 [25:30<2:12:09,  3.15s/it, lr: 1.0e-04 loss: 7.387e-02]hash_cache_v1:  16%|#6        | 483/3000 [25:32<2:12:09,  3.15s/it, lr: 1.0e-04 loss: 3.095e-02]hash_cache_v1:  16%|#6        | 483/3000 [25:32<2:12:09,  3.15s/it, lr: 1.0e-04 loss: 3.095e-02]hash_cache_v1:  16%|#6        | 484/3000 [25:32<2:00:14,  2.87s/it, lr: 1.0e-04 loss: 3.095e-02]hash_cache_v1:  16%|#6        | 484/3000 [25:32<2:00:14,  2.87s/it, lr: 1.0e-04 loss: 3.095e-02]hash_cache_v1:  16%|#6        | 484/3000 [25:35<2:00:14,  2.87s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  16%|#6        | 484/3000 [25:35<2:00:14,  2.87s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  16%|#6        | 485/3000 [25:35<2:02:28,  2.92s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  16%|#6        | 485/3000 [25:35<2:02:28,  2.92s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  16%|#6        | 485/3000 [25:40<2:02:28,  2.92s/it, lr: 1.0e-04 loss: 7.233e-02]hash_cache_v1:  16%|#6        | 485/3000 [25:40<2:02:28,  2.92s/it, lr: 1.0e-04 loss: 7.233e-02]hash_cache_v1:  16%|#6        | 486/3000 [25:40<2:19:00,  3.32s/it, lr: 1.0e-04 loss: 7.233e-02]hash_cache_v1:  16%|#6        | 486/3000 [25:40<2:19:00,  3.32s/it, lr: 1.0e-04 loss: 7.233e-02]hash_cache_v1:  16%|#6        | 486/3000 [25:42<2:19:00,  3.32s/it, lr: 1.0e-04 loss: 1.690e-02]hash_cache_v1:  16%|#6        | 486/3000 [25:42<2:19:00,  3.32s/it, lr: 1.0e-04 loss: 1.690e-02]hash_cache_v1:  16%|#6        | 487/3000 [25:42<2:04:15,  2.97s/it, lr: 1.0e-04 loss: 1.690e-02]hash_cache_v1:  16%|#6        | 487/3000 [25:42<2:04:15,  2.97s/it, lr: 1.0e-04 loss: 1.690e-02]hash_cache_v1:  16%|#6        | 487/3000 [25:44<2:04:15,  2.97s/it, lr: 1.0e-04 loss: 6.586e-02]hash_cache_v1:  16%|#6        | 487/3000 [25:44<2:04:15,  2.97s/it, lr: 1.0e-04 loss: 6.586e-02]hash_cache_v1:  16%|#6        | 488/3000 [25:44<1:56:53,  2.79s/it, lr: 1.0e-04 loss: 6.586e-02]hash_cache_v1:  16%|#6        | 488/3000 [25:44<1:56:53,  2.79s/it, lr: 1.0e-04 loss: 6.586e-02]hash_cache_v1:  16%|#6        | 488/3000 [25:48<1:56:53,  2.79s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  16%|#6        | 488/3000 [25:48<1:56:53,  2.79s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  16%|#6        | 489/3000 [25:48<2:15:06,  3.23s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  16%|#6        | 489/3000 [25:48<2:15:06,  3.23s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  16%|#6        | 489/3000 [25:53<2:15:06,  3.23s/it, lr: 1.0e-04 loss: 9.684e-02]hash_cache_v1:  16%|#6        | 489/3000 [25:53<2:15:06,  3.23s/it, lr: 1.0e-04 loss: 9.684e-02]hash_cache_v1:  16%|#6        | 490/3000 [25:57<2:15:03,  3.23s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  16%|#6        | 490/3000 [25:57<2:15:03,  3.23s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  16%|#6        | 491/3000 [25:57<1:54:36,  2.74s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  16%|#6        | 491/3000 [25:57<1:54:36,  2.74s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  16%|#6        | 491/3000 [26:02<1:54:36,  2.74s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  16%|#6        | 491/3000 [26:02<1:54:36,  2.74s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  16%|#6        | 492/3000 [26:02<2:12:48,  3.18s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  16%|#6        | 492/3000 [26:02<2:12:48,  3.18s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  16%|#6        | 492/3000 [26:04<2:12:48,  3.18s/it, lr: 1.0e-04 loss: 1.989e-01]hash_cache_v1:  16%|#6        | 492/3000 [26:04<2:12:48,  3.18s/it, lr: 1.0e-04 loss: 1.989e-01]hash_cache_v1:  16%|#6        | 493/3000 [26:04<2:01:10,  2.90s/it, lr: 1.0e-04 loss: 1.989e-01]hash_cache_v1:  16%|#6        | 493/3000 [26:04<2:01:10,  2.90s/it, lr: 1.0e-04 loss: 1.989e-01]hash_cache_v1:  16%|#6        | 493/3000 [26:07<2:01:10,  2.90s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  16%|#6        | 493/3000 [26:07<2:01:10,  2.90s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  16%|#6        | 494/3000 [26:07<2:00:49,  2.89s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  16%|#6        | 494/3000 [26:07<2:00:49,  2.89s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  16%|#6        | 494/3000 [26:10<2:00:49,  2.89s/it, lr: 1.0e-04 loss: 4.956e-03]hash_cache_v1:  16%|#6        | 494/3000 [26:10<2:00:49,  2.89s/it, lr: 1.0e-04 loss: 4.956e-03]hash_cache_v1:  16%|#6        | 495/3000 [26:10<2:02:28,  2.93s/it, lr: 1.0e-04 loss: 4.956e-03]hash_cache_v1:  16%|#6        | 495/3000 [26:10<2:02:28,  2.93s/it, lr: 1.0e-04 loss: 4.956e-03]hash_cache_v1:  16%|#6        | 495/3000 [26:12<2:02:28,  2.93s/it, lr: 1.0e-04 loss: 1.433e-01]hash_cache_v1:  16%|#6        | 495/3000 [26:12<2:02:28,  2.93s/it, lr: 1.0e-04 loss: 1.433e-01]hash_cache_v1:  17%|#6        | 496/3000 [26:12<1:52:22,  2.69s/it, lr: 1.0e-04 loss: 1.433e-01]hash_cache_v1:  17%|#6        | 496/3000 [26:12<1:52:22,  2.69s/it, lr: 1.0e-04 loss: 1.433e-01]hash_cache_v1:  17%|#6        | 496/3000 [26:15<1:52:22,  2.69s/it, lr: 1.0e-04 loss: 8.999e-02]hash_cache_v1:  17%|#6        | 496/3000 [26:15<1:52:22,  2.69s/it, lr: 1.0e-04 loss: 8.999e-02]hash_cache_v1:  17%|#6        | 497/3000 [26:15<1:54:06,  2.74s/it, lr: 1.0e-04 loss: 8.999e-02]hash_cache_v1:  17%|#6        | 497/3000 [26:15<1:54:06,  2.74s/it, lr: 1.0e-04 loss: 8.999e-02]hash_cache_v1:  17%|#6        | 497/3000 [26:19<1:54:06,  2.74s/it, lr: 1.0e-04 loss: 2.993e-02]hash_cache_v1:  17%|#6        | 497/3000 [26:19<1:54:06,  2.74s/it, lr: 1.0e-04 loss: 2.993e-02]hash_cache_v1:  17%|#6        | 498/3000 [26:19<2:13:42,  3.21s/it, lr: 1.0e-04 loss: 2.993e-02]hash_cache_v1:  17%|#6        | 498/3000 [26:19<2:13:42,  3.21s/it, lr: 1.0e-04 loss: 2.993e-02]hash_cache_v1:  17%|#6        | 498/3000 [26:23<2:13:42,  3.21s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  17%|#6        | 498/3000 [26:23<2:13:42,  3.21s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  17%|#6        | 499/3000 [26:23<2:30:17,  3.61s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  17%|#6        | 499/3000 [26:23<2:30:17,  3.61s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  17%|#6        | 499/3000 [26:28<2:30:17,  3.61s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  17%|#6        | 499/3000 [26:28<2:30:17,  3.61s/it, lr: 1.0e-04 loss: 1.190e-01]
+Saving at step 500
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000000500.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.97s/it]Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.97s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.12s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.12s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.21s/it]Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.21s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:48<00:00, 72.26s/it]Generating Images: 100%|##########| 4/4 [04:48<00:00, 72.26s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  17%|#6        | 500/3000 [26:30<2:30:13,  3.61s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  17%|#6        | 500/3000 [26:30<2:30:13,  3.61s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  17%|#6        | 501/3000 [26:30<1:43:57,  2.50s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  17%|#6        | 501/3000 [26:30<1:43:57,  2.50s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  17%|#6        | 501/3000 [26:33<1:43:57,  2.50s/it, lr: 1.0e-04 loss: 5.509e-02]hash_cache_v1:  17%|#6        | 501/3000 [26:33<1:43:57,  2.50s/it, lr: 1.0e-04 loss: 5.509e-02]hash_cache_v1:  17%|#6        | 502/3000 [26:33<1:47:45,  2.59s/it, lr: 1.0e-04 loss: 5.509e-02]hash_cache_v1:  17%|#6        | 502/3000 [26:33<1:47:45,  2.59s/it, lr: 1.0e-04 loss: 5.509e-02]hash_cache_v1:  17%|#6        | 502/3000 [26:37<1:47:45,  2.59s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  17%|#6        | 502/3000 [26:37<1:47:45,  2.59s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  17%|#6        | 503/3000 [26:37<2:06:11,  3.03s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  17%|#6        | 503/3000 [26:37<2:06:11,  3.03s/it, lr: 1.0e-04 loss: 1.839e-01]hash_cache_v1:  17%|#6        | 503/3000 [26:40<2:06:11,  3.03s/it, lr: 1.0e-04 loss: 2.317e-01]hash_cache_v1:  17%|#6        | 503/3000 [26:40<2:06:11,  3.03s/it, lr: 1.0e-04 loss: 2.317e-01]hash_cache_v1:  17%|#6        | 504/3000 [26:40<2:06:34,  3.04s/it, lr: 1.0e-04 loss: 2.317e-01]hash_cache_v1:  17%|#6        | 504/3000 [26:40<2:06:34,  3.04s/it, lr: 1.0e-04 loss: 2.317e-01]hash_cache_v1:  17%|#6        | 504/3000 [26:45<2:06:34,  3.04s/it, lr: 1.0e-04 loss: 3.638e-02]hash_cache_v1:  17%|#6        | 504/3000 [26:45<2:06:34,  3.04s/it, lr: 1.0e-04 loss: 3.638e-02]hash_cache_v1:  17%|#6        | 505/3000 [26:45<2:20:39,  3.38s/it, lr: 1.0e-04 loss: 3.638e-02]hash_cache_v1:  17%|#6        | 505/3000 [26:45<2:20:39,  3.38s/it, lr: 1.0e-04 loss: 3.638e-02]hash_cache_v1:  17%|#6        | 505/3000 [26:47<2:20:39,  3.38s/it, lr: 1.0e-04 loss: 2.356e-01]hash_cache_v1:  17%|#6        | 505/3000 [26:47<2:20:39,  3.38s/it, lr: 1.0e-04 loss: 2.356e-01]hash_cache_v1:  17%|#6        | 506/3000 [26:47<2:05:28,  3.02s/it, lr: 1.0e-04 loss: 2.356e-01]hash_cache_v1:  17%|#6        | 506/3000 [26:47<2:05:28,  3.02s/it, lr: 1.0e-04 loss: 2.356e-01]hash_cache_v1:  17%|#6        | 506/3000 [26:51<2:05:28,  3.02s/it, lr: 1.0e-04 loss: 1.806e-01]hash_cache_v1:  17%|#6        | 506/3000 [26:51<2:05:28,  3.02s/it, lr: 1.0e-04 loss: 1.806e-01]hash_cache_v1:  17%|#6        | 507/3000 [26:51<2:22:47,  3.44s/it, lr: 1.0e-04 loss: 1.806e-01]hash_cache_v1:  17%|#6        | 507/3000 [26:51<2:22:47,  3.44s/it, lr: 1.0e-04 loss: 1.806e-01]hash_cache_v1:  17%|#6        | 507/3000 [26:53<2:22:47,  3.44s/it, lr: 1.0e-04 loss: 2.105e-01]hash_cache_v1:  17%|#6        | 507/3000 [26:53<2:22:47,  3.44s/it, lr: 1.0e-04 loss: 2.105e-01]hash_cache_v1:  17%|#6        | 508/3000 [26:53<2:06:21,  3.04s/it, lr: 1.0e-04 loss: 2.105e-01]hash_cache_v1:  17%|#6        | 508/3000 [26:53<2:06:21,  3.04s/it, lr: 1.0e-04 loss: 2.105e-01]hash_cache_v1:  17%|#6        | 508/3000 [26:55<2:06:21,  3.04s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  17%|#6        | 508/3000 [26:55<2:06:21,  3.04s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  17%|#6        | 509/3000 [26:55<1:54:27,  2.76s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  17%|#6        | 509/3000 [26:55<1:54:27,  2.76s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  17%|#6        | 509/3000 [26:57<1:54:27,  2.76s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  17%|#6        | 509/3000 [26:57<1:54:27,  2.76s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  17%|#7        | 510/3000 [27:02<1:54:24,  2.76s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  17%|#7        | 510/3000 [27:02<1:54:24,  2.76s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  17%|#7        | 511/3000 [27:02<1:44:44,  2.52s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  17%|#7        | 511/3000 [27:02<1:44:44,  2.52s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  17%|#7        | 511/3000 [27:06<1:44:44,  2.52s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  17%|#7        | 511/3000 [27:06<1:44:44,  2.52s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  17%|#7        | 512/3000 [27:06<2:02:52,  2.96s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  17%|#7        | 512/3000 [27:06<2:02:52,  2.96s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  17%|#7        | 512/3000 [27:09<2:02:52,  2.96s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  17%|#7        | 512/3000 [27:09<2:02:52,  2.96s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  17%|#7        | 513/3000 [27:09<2:02:16,  2.95s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  17%|#7        | 513/3000 [27:09<2:02:16,  2.95s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  17%|#7        | 513/3000 [27:14<2:02:16,  2.95s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  17%|#7        | 513/3000 [27:14<2:02:16,  2.95s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  17%|#7        | 514/3000 [27:14<2:17:59,  3.33s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  17%|#7        | 514/3000 [27:14<2:17:59,  3.33s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  17%|#7        | 514/3000 [27:17<2:17:59,  3.33s/it, lr: 1.0e-04 loss: 1.001e-01]hash_cache_v1:  17%|#7        | 514/3000 [27:17<2:17:59,  3.33s/it, lr: 1.0e-04 loss: 1.001e-01]hash_cache_v1:  17%|#7        | 515/3000 [27:17<2:15:44,  3.28s/it, lr: 1.0e-04 loss: 1.001e-01]hash_cache_v1:  17%|#7        | 515/3000 [27:17<2:15:44,  3.28s/it, lr: 1.0e-04 loss: 1.001e-01]hash_cache_v1:  17%|#7        | 515/3000 [27:21<2:15:44,  3.28s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  17%|#7        | 515/3000 [27:21<2:15:44,  3.28s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  17%|#7        | 516/3000 [27:21<2:27:32,  3.56s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  17%|#7        | 516/3000 [27:21<2:27:32,  3.56s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  17%|#7        | 516/3000 [27:23<2:27:32,  3.56s/it, lr: 1.0e-04 loss: 1.817e-01]hash_cache_v1:  17%|#7        | 516/3000 [27:23<2:27:32,  3.56s/it, lr: 1.0e-04 loss: 1.817e-01]hash_cache_v1:  17%|#7        | 517/3000 [27:23<2:10:00,  3.14s/it, lr: 1.0e-04 loss: 1.817e-01]hash_cache_v1:  17%|#7        | 517/3000 [27:23<2:10:00,  3.14s/it, lr: 1.0e-04 loss: 1.817e-01]hash_cache_v1:  17%|#7        | 517/3000 [27:26<2:10:00,  3.14s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  17%|#7        | 517/3000 [27:26<2:10:00,  3.14s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  17%|#7        | 518/3000 [27:26<2:09:20,  3.13s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  17%|#7        | 518/3000 [27:26<2:09:20,  3.13s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  17%|#7        | 518/3000 [27:29<2:09:20,  3.13s/it, lr: 1.0e-04 loss: 1.761e-01]hash_cache_v1:  17%|#7        | 518/3000 [27:29<2:09:20,  3.13s/it, lr: 1.0e-04 loss: 1.761e-01]hash_cache_v1:  17%|#7        | 519/3000 [27:29<2:05:48,  3.04s/it, lr: 1.0e-04 loss: 1.761e-01]hash_cache_v1:  17%|#7        | 519/3000 [27:29<2:05:48,  3.04s/it, lr: 1.0e-04 loss: 1.761e-01]hash_cache_v1:  17%|#7        | 519/3000 [27:32<2:05:48,  3.04s/it, lr: 1.0e-04 loss: 1.411e-01]hash_cache_v1:  17%|#7        | 519/3000 [27:32<2:05:48,  3.04s/it, lr: 1.0e-04 loss: 1.411e-01]hash_cache_v1:  17%|#7        | 520/3000 [27:36<2:05:45,  3.04s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  17%|#7        | 520/3000 [27:36<2:05:45,  3.04s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  17%|#7        | 521/3000 [27:36<1:48:38,  2.63s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  17%|#7        | 521/3000 [27:36<1:48:38,  2.63s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  17%|#7        | 521/3000 [27:39<1:48:38,  2.63s/it, lr: 1.0e-04 loss: 2.337e-01]hash_cache_v1:  17%|#7        | 521/3000 [27:39<1:48:38,  2.63s/it, lr: 1.0e-04 loss: 2.337e-01]hash_cache_v1:  17%|#7        | 522/3000 [27:39<1:45:48,  2.56s/it, lr: 1.0e-04 loss: 2.337e-01]hash_cache_v1:  17%|#7        | 522/3000 [27:39<1:45:48,  2.56s/it, lr: 1.0e-04 loss: 2.337e-01]hash_cache_v1:  17%|#7        | 522/3000 [27:41<1:45:48,  2.56s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  17%|#7        | 522/3000 [27:41<1:45:48,  2.56s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  17%|#7        | 523/3000 [27:41<1:49:00,  2.64s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  17%|#7        | 523/3000 [27:41<1:49:00,  2.64s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  17%|#7        | 523/3000 [27:43<1:49:00,  2.64s/it, lr: 1.0e-04 loss: 2.247e-01]hash_cache_v1:  17%|#7        | 523/3000 [27:43<1:49:00,  2.64s/it, lr: 1.0e-04 loss: 2.247e-01]hash_cache_v1:  17%|#7        | 524/3000 [27:43<1:42:52,  2.49s/it, lr: 1.0e-04 loss: 2.247e-01]hash_cache_v1:  17%|#7        | 524/3000 [27:43<1:42:52,  2.49s/it, lr: 1.0e-04 loss: 2.247e-01]hash_cache_v1:  17%|#7        | 524/3000 [27:46<1:42:52,  2.49s/it, lr: 1.0e-04 loss: 2.029e-01]hash_cache_v1:  17%|#7        | 524/3000 [27:46<1:42:52,  2.49s/it, lr: 1.0e-04 loss: 2.029e-01]hash_cache_v1:  18%|#7        | 525/3000 [27:46<1:41:23,  2.46s/it, lr: 1.0e-04 loss: 2.029e-01]hash_cache_v1:  18%|#7        | 525/3000 [27:46<1:41:23,  2.46s/it, lr: 1.0e-04 loss: 2.029e-01]hash_cache_v1:  18%|#7        | 525/3000 [27:48<1:41:23,  2.46s/it, lr: 1.0e-04 loss: 1.815e-02]hash_cache_v1:  18%|#7        | 525/3000 [27:48<1:41:23,  2.46s/it, lr: 1.0e-04 loss: 1.815e-02]hash_cache_v1:  18%|#7        | 526/3000 [27:48<1:37:27,  2.36s/it, lr: 1.0e-04 loss: 1.815e-02]hash_cache_v1:  18%|#7        | 526/3000 [27:48<1:37:27,  2.36s/it, lr: 1.0e-04 loss: 1.815e-02]hash_cache_v1:  18%|#7        | 526/3000 [27:51<1:37:27,  2.36s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  18%|#7        | 526/3000 [27:51<1:37:27,  2.36s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  18%|#7        | 527/3000 [27:51<1:43:48,  2.52s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  18%|#7        | 527/3000 [27:51<1:43:48,  2.52s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  18%|#7        | 527/3000 [27:54<1:43:48,  2.52s/it, lr: 1.0e-04 loss: 2.066e-01]hash_cache_v1:  18%|#7        | 527/3000 [27:54<1:43:48,  2.52s/it, lr: 1.0e-04 loss: 2.066e-01]hash_cache_v1:  18%|#7        | 528/3000 [27:54<1:48:01,  2.62s/it, lr: 1.0e-04 loss: 2.066e-01]hash_cache_v1:  18%|#7        | 528/3000 [27:54<1:48:01,  2.62s/it, lr: 1.0e-04 loss: 2.066e-01]hash_cache_v1:  18%|#7        | 528/3000 [27:57<1:48:01,  2.62s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  18%|#7        | 528/3000 [27:57<1:48:01,  2.62s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  18%|#7        | 529/3000 [27:57<1:53:57,  2.77s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  18%|#7        | 529/3000 [27:57<1:53:57,  2.77s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  18%|#7        | 529/3000 [28:00<1:53:57,  2.77s/it, lr: 1.0e-04 loss: 7.349e-02]hash_cache_v1:  18%|#7        | 529/3000 [28:00<1:53:57,  2.77s/it, lr: 1.0e-04 loss: 7.349e-02]hash_cache_v1:  18%|#7        | 530/3000 [28:03<1:53:54,  2.77s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#7        | 530/3000 [28:03<1:53:54,  2.77s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#7        | 531/3000 [28:03<1:28:50,  2.16s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#7        | 531/3000 [28:03<1:28:50,  2.16s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#7        | 531/3000 [28:07<1:28:50,  2.16s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  18%|#7        | 531/3000 [28:07<1:28:50,  2.16s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  18%|#7        | 532/3000 [28:07<1:52:07,  2.73s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  18%|#7        | 532/3000 [28:07<1:52:07,  2.73s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  18%|#7        | 532/3000 [28:10<1:52:07,  2.73s/it, lr: 1.0e-04 loss: 4.509e-02]hash_cache_v1:  18%|#7        | 532/3000 [28:10<1:52:07,  2.73s/it, lr: 1.0e-04 loss: 4.509e-02]hash_cache_v1:  18%|#7        | 533/3000 [28:10<1:53:48,  2.77s/it, lr: 1.0e-04 loss: 4.509e-02]hash_cache_v1:  18%|#7        | 533/3000 [28:10<1:53:48,  2.77s/it, lr: 1.0e-04 loss: 4.509e-02]hash_cache_v1:  18%|#7        | 533/3000 [28:12<1:53:48,  2.77s/it, lr: 1.0e-04 loss: 2.795e-01]hash_cache_v1:  18%|#7        | 533/3000 [28:12<1:53:48,  2.77s/it, lr: 1.0e-04 loss: 2.795e-01]hash_cache_v1:  18%|#7        | 534/3000 [28:12<1:46:24,  2.59s/it, lr: 1.0e-04 loss: 2.795e-01]hash_cache_v1:  18%|#7        | 534/3000 [28:12<1:46:24,  2.59s/it, lr: 1.0e-04 loss: 2.795e-01]hash_cache_v1:  18%|#7        | 534/3000 [28:14<1:46:24,  2.59s/it, lr: 1.0e-04 loss: 9.171e-02]hash_cache_v1:  18%|#7        | 534/3000 [28:14<1:46:24,  2.59s/it, lr: 1.0e-04 loss: 9.171e-02]hash_cache_v1:  18%|#7        | 535/3000 [28:14<1:40:39,  2.45s/it, lr: 1.0e-04 loss: 9.171e-02]hash_cache_v1:  18%|#7        | 535/3000 [28:14<1:40:39,  2.45s/it, lr: 1.0e-04 loss: 9.171e-02]hash_cache_v1:  18%|#7        | 535/3000 [28:17<1:40:39,  2.45s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  18%|#7        | 535/3000 [28:17<1:40:39,  2.45s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  18%|#7        | 536/3000 [28:17<1:40:01,  2.44s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  18%|#7        | 536/3000 [28:17<1:40:01,  2.44s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  18%|#7        | 536/3000 [28:19<1:40:01,  2.44s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  18%|#7        | 536/3000 [28:19<1:40:01,  2.44s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  18%|#7        | 537/3000 [28:19<1:44:39,  2.55s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  18%|#7        | 537/3000 [28:19<1:44:39,  2.55s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  18%|#7        | 537/3000 [28:21<1:44:39,  2.55s/it, lr: 1.0e-04 loss: 2.601e-01]hash_cache_v1:  18%|#7        | 537/3000 [28:21<1:44:39,  2.55s/it, lr: 1.0e-04 loss: 2.601e-01]hash_cache_v1:  18%|#7        | 538/3000 [28:21<1:39:16,  2.42s/it, lr: 1.0e-04 loss: 2.601e-01]hash_cache_v1:  18%|#7        | 538/3000 [28:21<1:39:16,  2.42s/it, lr: 1.0e-04 loss: 2.601e-01]hash_cache_v1:  18%|#7        | 538/3000 [28:26<1:39:16,  2.42s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  18%|#7        | 538/3000 [28:26<1:39:16,  2.42s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  18%|#7        | 539/3000 [28:26<2:04:17,  3.03s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  18%|#7        | 539/3000 [28:26<2:04:17,  3.03s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  18%|#7        | 539/3000 [28:28<2:04:17,  3.03s/it, lr: 1.0e-04 loss: 2.280e-01]hash_cache_v1:  18%|#7        | 539/3000 [28:28<2:04:17,  3.03s/it, lr: 1.0e-04 loss: 2.280e-01]hash_cache_v1:  18%|#8        | 540/3000 [28:33<2:04:14,  3.03s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  18%|#8        | 540/3000 [28:33<2:04:14,  3.03s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  18%|#8        | 541/3000 [28:33<1:48:00,  2.64s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  18%|#8        | 541/3000 [28:33<1:48:00,  2.64s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  18%|#8        | 541/3000 [28:35<1:48:00,  2.64s/it, lr: 1.0e-04 loss: 5.293e-02]hash_cache_v1:  18%|#8        | 541/3000 [28:35<1:48:00,  2.64s/it, lr: 1.0e-04 loss: 5.293e-02]hash_cache_v1:  18%|#8        | 542/3000 [28:35<1:42:42,  2.51s/it, lr: 1.0e-04 loss: 5.293e-02]hash_cache_v1:  18%|#8        | 542/3000 [28:35<1:42:42,  2.51s/it, lr: 1.0e-04 loss: 5.293e-02]hash_cache_v1:  18%|#8        | 542/3000 [28:39<1:42:42,  2.51s/it, lr: 1.0e-04 loss: 1.326e-02]hash_cache_v1:  18%|#8        | 542/3000 [28:39<1:42:42,  2.51s/it, lr: 1.0e-04 loss: 1.326e-02]hash_cache_v1:  18%|#8        | 543/3000 [28:40<2:04:46,  3.05s/it, lr: 1.0e-04 loss: 1.326e-02]hash_cache_v1:  18%|#8        | 543/3000 [28:40<2:04:46,  3.05s/it, lr: 1.0e-04 loss: 1.326e-02]hash_cache_v1:  18%|#8        | 543/3000 [28:42<2:04:46,  3.05s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  18%|#8        | 543/3000 [28:42<2:04:46,  3.05s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  18%|#8        | 544/3000 [28:42<2:02:49,  3.00s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  18%|#8        | 544/3000 [28:42<2:02:49,  3.00s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  18%|#8        | 544/3000 [28:45<2:02:49,  3.00s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#8        | 544/3000 [28:45<2:02:49,  3.00s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#8        | 545/3000 [28:45<2:01:15,  2.96s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#8        | 545/3000 [28:45<2:01:15,  2.96s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  18%|#8        | 545/3000 [28:47<2:01:15,  2.96s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  18%|#8        | 545/3000 [28:47<2:01:15,  2.96s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  18%|#8        | 546/3000 [28:47<1:51:23,  2.72s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  18%|#8        | 546/3000 [28:47<1:51:23,  2.72s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  18%|#8        | 546/3000 [28:52<1:51:23,  2.72s/it, lr: 1.0e-04 loss: 1.933e-02]hash_cache_v1:  18%|#8        | 546/3000 [28:52<1:51:23,  2.72s/it, lr: 1.0e-04 loss: 1.933e-02]hash_cache_v1:  18%|#8        | 547/3000 [28:52<2:12:39,  3.24s/it, lr: 1.0e-04 loss: 1.933e-02]hash_cache_v1:  18%|#8        | 547/3000 [28:52<2:12:39,  3.24s/it, lr: 1.0e-04 loss: 1.933e-02]hash_cache_v1:  18%|#8        | 547/3000 [28:56<2:12:39,  3.24s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  18%|#8        | 547/3000 [28:56<2:12:39,  3.24s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  18%|#8        | 548/3000 [28:56<2:25:11,  3.55s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  18%|#8        | 548/3000 [28:56<2:25:11,  3.55s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  18%|#8        | 548/3000 [29:00<2:25:11,  3.55s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  18%|#8        | 548/3000 [29:00<2:25:11,  3.55s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  18%|#8        | 549/3000 [29:00<2:34:09,  3.77s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  18%|#8        | 549/3000 [29:00<2:34:09,  3.77s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  18%|#8        | 549/3000 [29:03<2:34:09,  3.77s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  18%|#8        | 549/3000 [29:03<2:34:09,  3.77s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  18%|#8        | 550/3000 [29:06<2:34:06,  3.77s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  18%|#8        | 550/3000 [29:06<2:34:06,  3.77s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  18%|#8        | 551/3000 [29:06<1:50:09,  2.70s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  18%|#8        | 551/3000 [29:06<1:50:09,  2.70s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  18%|#8        | 551/3000 [29:10<1:50:09,  2.70s/it, lr: 1.0e-04 loss: 1.475e-01]hash_cache_v1:  18%|#8        | 551/3000 [29:10<1:50:09,  2.70s/it, lr: 1.0e-04 loss: 1.475e-01]hash_cache_v1:  18%|#8        | 552/3000 [29:10<2:05:54,  3.09s/it, lr: 1.0e-04 loss: 1.475e-01]hash_cache_v1:  18%|#8        | 552/3000 [29:10<2:05:54,  3.09s/it, lr: 1.0e-04 loss: 1.475e-01]hash_cache_v1:  18%|#8        | 552/3000 [29:12<2:05:54,  3.09s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  18%|#8        | 552/3000 [29:12<2:05:54,  3.09s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  18%|#8        | 553/3000 [29:12<1:55:19,  2.83s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  18%|#8        | 553/3000 [29:12<1:55:19,  2.83s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  18%|#8        | 553/3000 [29:14<1:55:19,  2.83s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  18%|#8        | 553/3000 [29:14<1:55:19,  2.83s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  18%|#8        | 554/3000 [29:14<1:50:20,  2.71s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  18%|#8        | 554/3000 [29:14<1:50:20,  2.71s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  18%|#8        | 554/3000 [29:17<1:50:20,  2.71s/it, lr: 1.0e-04 loss: 4.862e-02]hash_cache_v1:  18%|#8        | 554/3000 [29:17<1:50:20,  2.71s/it, lr: 1.0e-04 loss: 4.862e-02]hash_cache_v1:  18%|#8        | 555/3000 [29:17<1:51:58,  2.75s/it, lr: 1.0e-04 loss: 4.862e-02]hash_cache_v1:  18%|#8        | 555/3000 [29:17<1:51:58,  2.75s/it, lr: 1.0e-04 loss: 4.862e-02]hash_cache_v1:  18%|#8        | 555/3000 [29:20<1:51:58,  2.75s/it, lr: 1.0e-04 loss: 5.641e-02]hash_cache_v1:  18%|#8        | 555/3000 [29:20<1:51:58,  2.75s/it, lr: 1.0e-04 loss: 5.641e-02]hash_cache_v1:  19%|#8        | 556/3000 [29:20<1:53:23,  2.78s/it, lr: 1.0e-04 loss: 5.641e-02]hash_cache_v1:  19%|#8        | 556/3000 [29:20<1:53:23,  2.78s/it, lr: 1.0e-04 loss: 5.641e-02]hash_cache_v1:  19%|#8        | 556/3000 [29:25<1:53:23,  2.78s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  19%|#8        | 556/3000 [29:25<1:53:23,  2.78s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  19%|#8        | 557/3000 [29:25<2:13:26,  3.28s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  19%|#8        | 557/3000 [29:25<2:13:26,  3.28s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  19%|#8        | 557/3000 [29:29<2:13:26,  3.28s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  19%|#8        | 557/3000 [29:29<2:13:26,  3.28s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  19%|#8        | 558/3000 [29:29<2:25:27,  3.57s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  19%|#8        | 558/3000 [29:29<2:25:27,  3.57s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  19%|#8        | 558/3000 [29:31<2:25:27,  3.57s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  19%|#8        | 558/3000 [29:31<2:25:27,  3.57s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  19%|#8        | 559/3000 [29:31<2:07:43,  3.14s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  19%|#8        | 559/3000 [29:31<2:07:43,  3.14s/it, lr: 1.0e-04 loss: 2.184e-01]hash_cache_v1:  19%|#8        | 559/3000 [29:33<2:07:43,  3.14s/it, lr: 1.0e-04 loss: 9.760e-02]hash_cache_v1:  19%|#8        | 559/3000 [29:33<2:07:43,  3.14s/it, lr: 1.0e-04 loss: 9.760e-02]hash_cache_v1:  19%|#8        | 560/3000 [29:36<2:07:39,  3.14s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  19%|#8        | 560/3000 [29:36<2:07:39,  3.14s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  19%|#8        | 561/3000 [29:36<1:37:55,  2.41s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  19%|#8        | 561/3000 [29:36<1:37:55,  2.41s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  19%|#8        | 561/3000 [29:38<1:37:55,  2.41s/it, lr: 1.0e-04 loss: 2.720e-01]hash_cache_v1:  19%|#8        | 561/3000 [29:38<1:37:55,  2.41s/it, lr: 1.0e-04 loss: 2.720e-01]hash_cache_v1:  19%|#8        | 562/3000 [29:38<1:34:53,  2.34s/it, lr: 1.0e-04 loss: 2.720e-01]hash_cache_v1:  19%|#8        | 562/3000 [29:38<1:34:53,  2.34s/it, lr: 1.0e-04 loss: 2.720e-01]hash_cache_v1:  19%|#8        | 562/3000 [29:40<1:34:53,  2.34s/it, lr: 1.0e-04 loss: 2.511e-01]hash_cache_v1:  19%|#8        | 562/3000 [29:40<1:34:53,  2.34s/it, lr: 1.0e-04 loss: 2.511e-01]hash_cache_v1:  19%|#8        | 563/3000 [29:40<1:32:16,  2.27s/it, lr: 1.0e-04 loss: 2.511e-01]hash_cache_v1:  19%|#8        | 563/3000 [29:40<1:32:16,  2.27s/it, lr: 1.0e-04 loss: 2.511e-01]hash_cache_v1:  19%|#8        | 563/3000 [29:43<1:32:16,  2.27s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  19%|#8        | 563/3000 [29:43<1:32:16,  2.27s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  19%|#8        | 564/3000 [29:43<1:33:42,  2.31s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  19%|#8        | 564/3000 [29:43<1:33:42,  2.31s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  19%|#8        | 564/3000 [29:47<1:33:42,  2.31s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  19%|#8        | 564/3000 [29:47<1:33:42,  2.31s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  19%|#8        | 565/3000 [29:47<1:56:30,  2.87s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  19%|#8        | 565/3000 [29:47<1:56:30,  2.87s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  19%|#8        | 565/3000 [29:49<1:56:30,  2.87s/it, lr: 1.0e-04 loss: 9.005e-02]hash_cache_v1:  19%|#8        | 565/3000 [29:49<1:56:30,  2.87s/it, lr: 1.0e-04 loss: 9.005e-02]hash_cache_v1:  19%|#8        | 566/3000 [29:49<1:47:45,  2.66s/it, lr: 1.0e-04 loss: 9.005e-02]hash_cache_v1:  19%|#8        | 566/3000 [29:49<1:47:45,  2.66s/it, lr: 1.0e-04 loss: 9.005e-02]hash_cache_v1:  19%|#8        | 566/3000 [29:52<1:47:45,  2.66s/it, lr: 1.0e-04 loss: 9.660e-02]hash_cache_v1:  19%|#8        | 566/3000 [29:52<1:47:45,  2.66s/it, lr: 1.0e-04 loss: 9.660e-02]hash_cache_v1:  19%|#8        | 567/3000 [29:52<1:50:34,  2.73s/it, lr: 1.0e-04 loss: 9.660e-02]hash_cache_v1:  19%|#8        | 567/3000 [29:52<1:50:34,  2.73s/it, lr: 1.0e-04 loss: 9.660e-02]hash_cache_v1:  19%|#8        | 567/3000 [29:57<1:50:34,  2.73s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  19%|#8        | 567/3000 [29:57<1:50:34,  2.73s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  19%|#8        | 568/3000 [29:57<2:11:49,  3.25s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  19%|#8        | 568/3000 [29:57<2:11:49,  3.25s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  19%|#8        | 568/3000 [30:00<2:11:49,  3.25s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  19%|#8        | 568/3000 [30:00<2:11:49,  3.25s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  19%|#8        | 569/3000 [30:00<2:07:10,  3.14s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  19%|#8        | 569/3000 [30:00<2:07:10,  3.14s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  19%|#8        | 569/3000 [30:02<2:07:10,  3.14s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  19%|#8        | 569/3000 [30:02<2:07:10,  3.14s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  19%|#9        | 570/3000 [30:05<2:07:07,  3.14s/it, lr: 1.0e-04 loss: 2.609e-01]hash_cache_v1:  19%|#9        | 570/3000 [30:05<2:07:07,  3.14s/it, lr: 1.0e-04 loss: 2.609e-01]hash_cache_v1:  19%|#9        | 571/3000 [30:05<1:28:32,  2.19s/it, lr: 1.0e-04 loss: 2.609e-01]hash_cache_v1:  19%|#9        | 571/3000 [30:05<1:28:32,  2.19s/it, lr: 1.0e-04 loss: 2.609e-01]hash_cache_v1:  19%|#9        | 571/3000 [30:09<1:28:32,  2.19s/it, lr: 1.0e-04 loss: 2.698e-02]hash_cache_v1:  19%|#9        | 571/3000 [30:09<1:28:32,  2.19s/it, lr: 1.0e-04 loss: 2.698e-02]hash_cache_v1:  19%|#9        | 572/3000 [30:09<1:51:43,  2.76s/it, lr: 1.0e-04 loss: 2.698e-02]hash_cache_v1:  19%|#9        | 572/3000 [30:09<1:51:43,  2.76s/it, lr: 1.0e-04 loss: 2.698e-02]hash_cache_v1:  19%|#9        | 572/3000 [30:12<1:51:43,  2.76s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  19%|#9        | 572/3000 [30:12<1:51:43,  2.76s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  19%|#9        | 573/3000 [30:12<1:52:27,  2.78s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  19%|#9        | 573/3000 [30:12<1:52:27,  2.78s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  19%|#9        | 573/3000 [30:15<1:52:27,  2.78s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  19%|#9        | 573/3000 [30:15<1:52:27,  2.78s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  19%|#9        | 574/3000 [30:15<1:53:19,  2.80s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  19%|#9        | 574/3000 [30:15<1:53:19,  2.80s/it, lr: 1.0e-04 loss: 2.099e-01]hash_cache_v1:  19%|#9        | 574/3000 [30:17<1:53:19,  2.80s/it, lr: 1.0e-04 loss: 2.814e-01]hash_cache_v1:  19%|#9        | 574/3000 [30:17<1:53:19,  2.80s/it, lr: 1.0e-04 loss: 2.814e-01]hash_cache_v1:  19%|#9        | 575/3000 [30:17<1:48:42,  2.69s/it, lr: 1.0e-04 loss: 2.814e-01]hash_cache_v1:  19%|#9        | 575/3000 [30:17<1:48:42,  2.69s/it, lr: 1.0e-04 loss: 2.814e-01]hash_cache_v1:  19%|#9        | 575/3000 [30:20<1:48:42,  2.69s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  19%|#9        | 575/3000 [30:20<1:48:42,  2.69s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  19%|#9        | 576/3000 [30:20<1:50:23,  2.73s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  19%|#9        | 576/3000 [30:20<1:50:23,  2.73s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  19%|#9        | 576/3000 [30:23<1:50:23,  2.73s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  19%|#9        | 576/3000 [30:23<1:50:23,  2.73s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  19%|#9        | 577/3000 [30:23<1:51:47,  2.77s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  19%|#9        | 577/3000 [30:23<1:51:47,  2.77s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  19%|#9        | 577/3000 [30:27<1:51:47,  2.77s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  19%|#9        | 577/3000 [30:27<1:51:47,  2.77s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  19%|#9        | 578/3000 [30:27<2:09:55,  3.22s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  19%|#9        | 578/3000 [30:27<2:09:55,  3.22s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  19%|#9        | 578/3000 [30:30<2:09:55,  3.22s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  19%|#9        | 578/3000 [30:30<2:09:55,  3.22s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  19%|#9        | 579/3000 [30:30<2:08:54,  3.19s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  19%|#9        | 579/3000 [30:30<2:08:54,  3.19s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  19%|#9        | 579/3000 [30:35<2:08:54,  3.19s/it, lr: 1.0e-04 loss: 7.036e-02]hash_cache_v1:  19%|#9        | 579/3000 [30:35<2:08:54,  3.19s/it, lr: 1.0e-04 loss: 7.036e-02]hash_cache_v1:  19%|#9        | 580/3000 [30:37<2:08:51,  3.19s/it, lr: 1.0e-04 loss: 2.454e-01]hash_cache_v1:  19%|#9        | 580/3000 [30:37<2:08:51,  3.19s/it, lr: 1.0e-04 loss: 2.454e-01]hash_cache_v1:  19%|#9        | 581/3000 [30:37<1:29:20,  2.22s/it, lr: 1.0e-04 loss: 2.454e-01]hash_cache_v1:  19%|#9        | 581/3000 [30:37<1:29:20,  2.22s/it, lr: 1.0e-04 loss: 2.454e-01]hash_cache_v1:  19%|#9        | 581/3000 [30:41<1:29:20,  2.22s/it, lr: 1.0e-04 loss: 1.498e-01]hash_cache_v1:  19%|#9        | 581/3000 [30:41<1:29:20,  2.22s/it, lr: 1.0e-04 loss: 1.498e-01]hash_cache_v1:  19%|#9        | 582/3000 [30:41<1:51:52,  2.78s/it, lr: 1.0e-04 loss: 1.498e-01]hash_cache_v1:  19%|#9        | 582/3000 [30:41<1:51:52,  2.78s/it, lr: 1.0e-04 loss: 1.498e-01]hash_cache_v1:  19%|#9        | 582/3000 [30:46<1:51:52,  2.78s/it, lr: 1.0e-04 loss: 5.802e-02]hash_cache_v1:  19%|#9        | 582/3000 [30:46<1:51:52,  2.78s/it, lr: 1.0e-04 loss: 5.802e-02]hash_cache_v1:  19%|#9        | 583/3000 [30:46<2:07:31,  3.17s/it, lr: 1.0e-04 loss: 5.802e-02]hash_cache_v1:  19%|#9        | 583/3000 [30:46<2:07:31,  3.17s/it, lr: 1.0e-04 loss: 5.802e-02]hash_cache_v1:  19%|#9        | 583/3000 [30:48<2:07:31,  3.17s/it, lr: 1.0e-04 loss: 2.246e-01]hash_cache_v1:  19%|#9        | 583/3000 [30:48<2:07:31,  3.17s/it, lr: 1.0e-04 loss: 2.246e-01]hash_cache_v1:  19%|#9        | 584/3000 [30:48<2:04:16,  3.09s/it, lr: 1.0e-04 loss: 2.246e-01]hash_cache_v1:  19%|#9        | 584/3000 [30:48<2:04:16,  3.09s/it, lr: 1.0e-04 loss: 2.246e-01]hash_cache_v1:  19%|#9        | 584/3000 [30:51<2:04:16,  3.09s/it, lr: 1.0e-04 loss: 6.367e-02]hash_cache_v1:  19%|#9        | 584/3000 [30:51<2:04:16,  3.09s/it, lr: 1.0e-04 loss: 6.367e-02]hash_cache_v1:  20%|#9        | 585/3000 [30:51<2:02:00,  3.03s/it, lr: 1.0e-04 loss: 6.367e-02]hash_cache_v1:  20%|#9        | 585/3000 [30:51<2:02:00,  3.03s/it, lr: 1.0e-04 loss: 6.367e-02]hash_cache_v1:  20%|#9        | 585/3000 [30:54<2:02:00,  3.03s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  20%|#9        | 585/3000 [30:54<2:02:00,  3.03s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  20%|#9        | 586/3000 [30:54<1:54:21,  2.84s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  20%|#9        | 586/3000 [30:54<1:54:21,  2.84s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  20%|#9        | 586/3000 [30:56<1:54:21,  2.84s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  20%|#9        | 586/3000 [30:56<1:54:21,  2.84s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  20%|#9        | 587/3000 [30:56<1:45:47,  2.63s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  20%|#9        | 587/3000 [30:56<1:45:47,  2.63s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  20%|#9        | 587/3000 [30:58<1:45:47,  2.63s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  20%|#9        | 587/3000 [30:58<1:45:47,  2.63s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  20%|#9        | 588/3000 [30:58<1:39:32,  2.48s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  20%|#9        | 588/3000 [30:58<1:39:32,  2.48s/it, lr: 1.0e-04 loss: 2.798e-01]hash_cache_v1:  20%|#9        | 588/3000 [31:02<1:39:32,  2.48s/it, lr: 1.0e-04 loss: 1.779e-01]hash_cache_v1:  20%|#9        | 588/3000 [31:02<1:39:32,  2.48s/it, lr: 1.0e-04 loss: 1.779e-01]hash_cache_v1:  20%|#9        | 589/3000 [31:02<2:02:11,  3.04s/it, lr: 1.0e-04 loss: 1.779e-01]hash_cache_v1:  20%|#9        | 589/3000 [31:02<2:02:11,  3.04s/it, lr: 1.0e-04 loss: 1.779e-01]hash_cache_v1:  20%|#9        | 589/3000 [31:04<2:02:11,  3.04s/it, lr: 1.0e-04 loss: 1.745e-01]hash_cache_v1:  20%|#9        | 589/3000 [31:04<2:02:11,  3.04s/it, lr: 1.0e-04 loss: 1.745e-01]hash_cache_v1:  20%|#9        | 590/3000 [31:06<2:02:08,  3.04s/it, lr: 1.0e-04 loss: 1.797e-01]hash_cache_v1:  20%|#9        | 590/3000 [31:06<2:02:08,  3.04s/it, lr: 1.0e-04 loss: 1.797e-01]hash_cache_v1:  20%|#9        | 591/3000 [31:06<1:25:41,  2.13s/it, lr: 1.0e-04 loss: 1.797e-01]hash_cache_v1:  20%|#9        | 591/3000 [31:06<1:25:41,  2.13s/it, lr: 1.0e-04 loss: 1.797e-01]hash_cache_v1:  20%|#9        | 591/3000 [31:09<1:25:41,  2.13s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  20%|#9        | 591/3000 [31:09<1:25:41,  2.13s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  20%|#9        | 592/3000 [31:09<1:33:13,  2.32s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  20%|#9        | 592/3000 [31:09<1:33:13,  2.32s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  20%|#9        | 592/3000 [31:14<1:33:13,  2.32s/it, lr: 1.0e-04 loss: 7.821e-03]hash_cache_v1:  20%|#9        | 592/3000 [31:14<1:33:13,  2.32s/it, lr: 1.0e-04 loss: 7.821e-03]hash_cache_v1:  20%|#9        | 593/3000 [31:14<1:55:48,  2.89s/it, lr: 1.0e-04 loss: 7.821e-03]hash_cache_v1:  20%|#9        | 593/3000 [31:14<1:55:48,  2.89s/it, lr: 1.0e-04 loss: 7.821e-03]hash_cache_v1:  20%|#9        | 593/3000 [31:16<1:55:48,  2.89s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  20%|#9        | 593/3000 [31:16<1:55:48,  2.89s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  20%|#9        | 594/3000 [31:16<1:47:23,  2.68s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  20%|#9        | 594/3000 [31:16<1:47:23,  2.68s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  20%|#9        | 594/3000 [31:20<1:47:23,  2.68s/it, lr: 1.0e-04 loss: 7.720e-02]hash_cache_v1:  20%|#9        | 594/3000 [31:20<1:47:23,  2.68s/it, lr: 1.0e-04 loss: 7.720e-02]hash_cache_v1:  20%|#9        | 595/3000 [31:20<2:05:22,  3.13s/it, lr: 1.0e-04 loss: 7.720e-02]hash_cache_v1:  20%|#9        | 595/3000 [31:20<2:05:22,  3.13s/it, lr: 1.0e-04 loss: 7.720e-02]hash_cache_v1:  20%|#9        | 595/3000 [31:25<2:05:22,  3.13s/it, lr: 1.0e-04 loss: 6.969e-02]hash_cache_v1:  20%|#9        | 595/3000 [31:25<2:05:22,  3.13s/it, lr: 1.0e-04 loss: 6.969e-02]hash_cache_v1:  20%|#9        | 596/3000 [31:25<2:20:53,  3.52s/it, lr: 1.0e-04 loss: 6.969e-02]hash_cache_v1:  20%|#9        | 596/3000 [31:25<2:20:53,  3.52s/it, lr: 1.0e-04 loss: 6.969e-02]hash_cache_v1:  20%|#9        | 596/3000 [31:28<2:20:53,  3.52s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  20%|#9        | 596/3000 [31:28<2:20:53,  3.52s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  20%|#9        | 597/3000 [31:28<2:13:00,  3.32s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  20%|#9        | 597/3000 [31:28<2:13:00,  3.32s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  20%|#9        | 597/3000 [31:30<2:13:00,  3.32s/it, lr: 1.0e-04 loss: 2.286e-01]hash_cache_v1:  20%|#9        | 597/3000 [31:30<2:13:00,  3.32s/it, lr: 1.0e-04 loss: 2.286e-01]hash_cache_v1:  20%|#9        | 598/3000 [31:30<1:58:44,  2.97s/it, lr: 1.0e-04 loss: 2.286e-01]hash_cache_v1:  20%|#9        | 598/3000 [31:30<1:58:44,  2.97s/it, lr: 1.0e-04 loss: 2.286e-01]hash_cache_v1:  20%|#9        | 598/3000 [31:33<1:58:44,  2.97s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  20%|#9        | 598/3000 [31:33<1:58:44,  2.97s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  20%|#9        | 599/3000 [31:33<1:57:39,  2.94s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  20%|#9        | 599/3000 [31:33<1:57:39,  2.94s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  20%|#9        | 599/3000 [31:37<1:57:39,  2.94s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  20%|#9        | 599/3000 [31:37<1:57:39,  2.94s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  20%|##        | 600/3000 [31:41<1:57:36,  2.94s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  20%|##        | 600/3000 [31:41<1:57:36,  2.94s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  20%|##        | 601/3000 [31:41<1:42:59,  2.58s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  20%|##        | 601/3000 [31:41<1:42:59,  2.58s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  20%|##        | 601/3000 [31:43<1:42:59,  2.58s/it, lr: 1.0e-04 loss: 2.470e-01]hash_cache_v1:  20%|##        | 601/3000 [31:43<1:42:59,  2.58s/it, lr: 1.0e-04 loss: 2.470e-01]hash_cache_v1:  20%|##        | 602/3000 [31:43<1:38:22,  2.46s/it, lr: 1.0e-04 loss: 2.470e-01]hash_cache_v1:  20%|##        | 602/3000 [31:43<1:38:22,  2.46s/it, lr: 1.0e-04 loss: 2.470e-01]hash_cache_v1:  20%|##        | 602/3000 [31:48<1:38:22,  2.46s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  20%|##        | 602/3000 [31:48<1:38:22,  2.46s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  20%|##        | 603/3000 [31:48<1:59:01,  2.98s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  20%|##        | 603/3000 [31:48<1:59:01,  2.98s/it, lr: 1.0e-04 loss: 1.695e-01]hash_cache_v1:  20%|##        | 603/3000 [31:52<1:59:01,  2.98s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  20%|##        | 603/3000 [31:52<1:59:01,  2.98s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  20%|##        | 604/3000 [31:52<2:13:34,  3.34s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  20%|##        | 604/3000 [31:52<2:13:34,  3.34s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  20%|##        | 604/3000 [31:57<2:13:34,  3.34s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  20%|##        | 604/3000 [31:57<2:13:34,  3.34s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  20%|##        | 605/3000 [31:57<2:23:57,  3.61s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  20%|##        | 605/3000 [31:57<2:23:57,  3.61s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  20%|##        | 605/3000 [31:59<2:23:57,  3.61s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  20%|##        | 605/3000 [31:59<2:23:57,  3.61s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  20%|##        | 606/3000 [31:59<2:06:53,  3.18s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  20%|##        | 606/3000 [31:59<2:06:53,  3.18s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  20%|##        | 606/3000 [32:02<2:06:53,  3.18s/it, lr: 1.0e-04 loss: 1.893e-01]hash_cache_v1:  20%|##        | 606/3000 [32:02<2:06:53,  3.18s/it, lr: 1.0e-04 loss: 1.893e-01]hash_cache_v1:  20%|##        | 607/3000 [32:02<2:05:21,  3.14s/it, lr: 1.0e-04 loss: 1.893e-01]hash_cache_v1:  20%|##        | 607/3000 [32:02<2:05:21,  3.14s/it, lr: 1.0e-04 loss: 1.893e-01]hash_cache_v1:  20%|##        | 607/3000 [32:04<2:05:21,  3.14s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  20%|##        | 607/3000 [32:04<2:05:21,  3.14s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  20%|##        | 608/3000 [32:04<1:53:12,  2.84s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  20%|##        | 608/3000 [32:04<1:53:12,  2.84s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  20%|##        | 608/3000 [32:08<1:53:12,  2.84s/it, lr: 1.0e-04 loss: 8.904e-02]hash_cache_v1:  20%|##        | 608/3000 [32:08<1:53:12,  2.84s/it, lr: 1.0e-04 loss: 8.904e-02]hash_cache_v1:  20%|##        | 609/3000 [32:08<2:10:30,  3.27s/it, lr: 1.0e-04 loss: 8.904e-02]hash_cache_v1:  20%|##        | 609/3000 [32:08<2:10:30,  3.27s/it, lr: 1.0e-04 loss: 8.904e-02]hash_cache_v1:  20%|##        | 609/3000 [32:11<2:10:30,  3.27s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  20%|##        | 609/3000 [32:11<2:10:30,  3.27s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  20%|##        | 610/3000 [32:14<2:10:27,  3.27s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  20%|##        | 610/3000 [32:14<2:10:27,  3.27s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  20%|##        | 611/3000 [32:14<1:36:55,  2.43s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  20%|##        | 611/3000 [32:14<1:36:55,  2.43s/it, lr: 1.0e-04 loss: 1.847e-01]hash_cache_v1:  20%|##        | 611/3000 [32:16<1:36:55,  2.43s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  20%|##        | 611/3000 [32:16<1:36:55,  2.43s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  20%|##        | 612/3000 [32:16<1:33:31,  2.35s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  20%|##        | 612/3000 [32:16<1:33:31,  2.35s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  20%|##        | 612/3000 [32:19<1:33:31,  2.35s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  20%|##        | 612/3000 [32:19<1:33:31,  2.35s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  20%|##        | 613/3000 [32:19<1:38:29,  2.48s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  20%|##        | 613/3000 [32:19<1:38:29,  2.48s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  20%|##        | 613/3000 [32:21<1:38:29,  2.48s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  20%|##        | 613/3000 [32:21<1:38:29,  2.48s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  20%|##        | 614/3000 [32:21<1:37:28,  2.45s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  20%|##        | 614/3000 [32:21<1:37:28,  2.45s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  20%|##        | 614/3000 [32:24<1:37:28,  2.45s/it, lr: 1.0e-04 loss: 4.102e-02]hash_cache_v1:  20%|##        | 614/3000 [32:24<1:37:28,  2.45s/it, lr: 1.0e-04 loss: 4.102e-02]hash_cache_v1:  20%|##        | 615/3000 [32:24<1:33:48,  2.36s/it, lr: 1.0e-04 loss: 4.102e-02]hash_cache_v1:  20%|##        | 615/3000 [32:24<1:33:48,  2.36s/it, lr: 1.0e-04 loss: 4.102e-02]hash_cache_v1:  20%|##        | 615/3000 [32:26<1:33:48,  2.36s/it, lr: 1.0e-04 loss: 9.652e-02]hash_cache_v1:  20%|##        | 615/3000 [32:26<1:33:48,  2.36s/it, lr: 1.0e-04 loss: 9.652e-02]hash_cache_v1:  21%|##        | 616/3000 [32:26<1:39:29,  2.50s/it, lr: 1.0e-04 loss: 9.652e-02]hash_cache_v1:  21%|##        | 616/3000 [32:26<1:39:29,  2.50s/it, lr: 1.0e-04 loss: 9.652e-02]hash_cache_v1:  21%|##        | 616/3000 [32:29<1:39:29,  2.50s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  21%|##        | 616/3000 [32:29<1:39:29,  2.50s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  21%|##        | 617/3000 [32:29<1:35:01,  2.39s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  21%|##        | 617/3000 [32:29<1:35:01,  2.39s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  21%|##        | 617/3000 [32:32<1:35:01,  2.39s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  21%|##        | 617/3000 [32:32<1:35:01,  2.39s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  21%|##        | 618/3000 [32:32<1:43:01,  2.60s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  21%|##        | 618/3000 [32:32<1:43:01,  2.60s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  21%|##        | 618/3000 [32:34<1:43:01,  2.60s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  21%|##        | 618/3000 [32:34<1:43:01,  2.60s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  21%|##        | 619/3000 [32:34<1:46:14,  2.68s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  21%|##        | 619/3000 [32:34<1:46:14,  2.68s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  21%|##        | 619/3000 [32:39<1:46:14,  2.68s/it, lr: 1.0e-04 loss: 7.901e-02]hash_cache_v1:  21%|##        | 619/3000 [32:39<1:46:14,  2.68s/it, lr: 1.0e-04 loss: 7.901e-02]hash_cache_v1:  21%|##        | 620/3000 [32:42<1:46:11,  2.68s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  21%|##        | 620/3000 [32:42<1:46:11,  2.68s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  21%|##        | 621/3000 [32:42<1:24:29,  2.13s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  21%|##        | 621/3000 [32:42<1:24:29,  2.13s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  21%|##        | 621/3000 [32:46<1:24:29,  2.13s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  21%|##        | 621/3000 [32:46<1:24:29,  2.13s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  21%|##        | 622/3000 [32:46<1:45:49,  2.67s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  21%|##        | 622/3000 [32:46<1:45:49,  2.67s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  21%|##        | 622/3000 [32:48<1:45:49,  2.67s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  21%|##        | 622/3000 [32:48<1:45:49,  2.67s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  21%|##        | 623/3000 [32:48<1:39:55,  2.52s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  21%|##        | 623/3000 [32:48<1:39:55,  2.52s/it, lr: 1.0e-04 loss: 1.861e-01]hash_cache_v1:  21%|##        | 623/3000 [32:52<1:39:55,  2.52s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  21%|##        | 623/3000 [32:52<1:39:55,  2.52s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  21%|##        | 624/3000 [32:52<1:58:56,  3.00s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  21%|##        | 624/3000 [32:52<1:58:56,  3.00s/it, lr: 1.0e-04 loss: 1.793e-01]hash_cache_v1:  21%|##        | 624/3000 [32:57<1:58:56,  3.00s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  21%|##        | 624/3000 [32:57<1:58:56,  3.00s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  21%|##        | 625/3000 [32:57<2:15:10,  3.41s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  21%|##        | 625/3000 [32:57<2:15:10,  3.41s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  21%|##        | 625/3000 [33:00<2:15:10,  3.41s/it, lr: 1.0e-04 loss: 3.705e-02]hash_cache_v1:  21%|##        | 625/3000 [33:00<2:15:10,  3.41s/it, lr: 1.0e-04 loss: 3.705e-02]hash_cache_v1:  21%|##        | 626/3000 [33:00<2:08:42,  3.25s/it, lr: 1.0e-04 loss: 3.705e-02]hash_cache_v1:  21%|##        | 626/3000 [33:00<2:08:42,  3.25s/it, lr: 1.0e-04 loss: 3.705e-02]hash_cache_v1:  21%|##        | 626/3000 [33:03<2:08:42,  3.25s/it, lr: 1.0e-04 loss: 7.294e-02]hash_cache_v1:  21%|##        | 626/3000 [33:03<2:08:42,  3.25s/it, lr: 1.0e-04 loss: 7.294e-02]hash_cache_v1:  21%|##        | 627/3000 [33:03<2:04:26,  3.15s/it, lr: 1.0e-04 loss: 7.294e-02]hash_cache_v1:  21%|##        | 627/3000 [33:03<2:04:26,  3.15s/it, lr: 1.0e-04 loss: 7.294e-02]hash_cache_v1:  21%|##        | 627/3000 [33:07<2:04:26,  3.15s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  21%|##        | 627/3000 [33:07<2:04:26,  3.15s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  21%|##        | 628/3000 [33:07<2:20:05,  3.54s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  21%|##        | 628/3000 [33:07<2:20:05,  3.54s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  21%|##        | 628/3000 [33:10<2:20:05,  3.54s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  21%|##        | 628/3000 [33:10<2:20:05,  3.54s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  21%|##        | 629/3000 [33:10<2:11:56,  3.34s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  21%|##        | 629/3000 [33:10<2:11:56,  3.34s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  21%|##        | 629/3000 [33:12<2:11:56,  3.34s/it, lr: 1.0e-04 loss: 2.253e-01]hash_cache_v1:  21%|##        | 629/3000 [33:12<2:11:56,  3.34s/it, lr: 1.0e-04 loss: 2.253e-01]hash_cache_v1:  21%|##1       | 630/3000 [33:15<2:11:52,  3.34s/it, lr: 1.0e-04 loss: 2.299e-01]hash_cache_v1:  21%|##1       | 630/3000 [33:15<2:11:52,  3.34s/it, lr: 1.0e-04 loss: 2.299e-01]hash_cache_v1:  21%|##1       | 631/3000 [33:15<1:30:35,  2.29s/it, lr: 1.0e-04 loss: 2.299e-01]hash_cache_v1:  21%|##1       | 631/3000 [33:15<1:30:35,  2.29s/it, lr: 1.0e-04 loss: 2.299e-01]hash_cache_v1:  21%|##1       | 631/3000 [33:18<1:30:35,  2.29s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  21%|##1       | 631/3000 [33:18<1:30:35,  2.29s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  21%|##1       | 632/3000 [33:18<1:39:24,  2.52s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  21%|##1       | 632/3000 [33:18<1:39:24,  2.52s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  21%|##1       | 632/3000 [33:22<1:39:24,  2.52s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  21%|##1       | 632/3000 [33:22<1:39:24,  2.52s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  21%|##1       | 633/3000 [33:22<1:58:07,  2.99s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  21%|##1       | 633/3000 [33:22<1:58:07,  2.99s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  21%|##1       | 633/3000 [33:25<1:58:07,  2.99s/it, lr: 1.0e-04 loss: 7.871e-02]hash_cache_v1:  21%|##1       | 633/3000 [33:25<1:58:07,  2.99s/it, lr: 1.0e-04 loss: 7.871e-02]hash_cache_v1:  21%|##1       | 634/3000 [33:25<1:56:40,  2.96s/it, lr: 1.0e-04 loss: 7.871e-02]hash_cache_v1:  21%|##1       | 634/3000 [33:25<1:56:40,  2.96s/it, lr: 1.0e-04 loss: 7.871e-02]hash_cache_v1:  21%|##1       | 634/3000 [33:29<1:56:40,  2.96s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  21%|##1       | 634/3000 [33:29<1:56:40,  2.96s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  21%|##1       | 635/3000 [33:30<2:13:24,  3.38s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  21%|##1       | 635/3000 [33:30<2:13:24,  3.38s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  21%|##1       | 635/3000 [33:34<2:13:24,  3.38s/it, lr: 1.0e-04 loss: 4.839e-02]hash_cache_v1:  21%|##1       | 635/3000 [33:34<2:13:24,  3.38s/it, lr: 1.0e-04 loss: 4.839e-02]hash_cache_v1:  21%|##1       | 636/3000 [33:34<2:23:42,  3.65s/it, lr: 1.0e-04 loss: 4.839e-02]hash_cache_v1:  21%|##1       | 636/3000 [33:34<2:23:42,  3.65s/it, lr: 1.0e-04 loss: 4.839e-02]hash_cache_v1:  21%|##1       | 636/3000 [33:37<2:23:42,  3.65s/it, lr: 1.0e-04 loss: 2.177e-02]hash_cache_v1:  21%|##1       | 636/3000 [33:37<2:23:42,  3.65s/it, lr: 1.0e-04 loss: 2.177e-02]hash_cache_v1:  21%|##1       | 637/3000 [33:37<2:14:51,  3.42s/it, lr: 1.0e-04 loss: 2.177e-02]hash_cache_v1:  21%|##1       | 637/3000 [33:37<2:14:51,  3.42s/it, lr: 1.0e-04 loss: 2.177e-02]hash_cache_v1:  21%|##1       | 637/3000 [33:40<2:14:51,  3.42s/it, lr: 1.0e-04 loss: 2.100e-01]hash_cache_v1:  21%|##1       | 637/3000 [33:40<2:14:51,  3.42s/it, lr: 1.0e-04 loss: 2.100e-01]hash_cache_v1:  21%|##1       | 638/3000 [33:40<2:08:36,  3.27s/it, lr: 1.0e-04 loss: 2.100e-01]hash_cache_v1:  21%|##1       | 638/3000 [33:40<2:08:36,  3.27s/it, lr: 1.0e-04 loss: 2.100e-01]hash_cache_v1:  21%|##1       | 638/3000 [33:42<2:08:36,  3.27s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  21%|##1       | 638/3000 [33:42<2:08:36,  3.27s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  21%|##1       | 639/3000 [33:42<1:58:29,  3.01s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  21%|##1       | 639/3000 [33:42<1:58:29,  3.01s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  21%|##1       | 639/3000 [33:45<1:58:29,  3.01s/it, lr: 1.0e-04 loss: 1.873e-02]hash_cache_v1:  21%|##1       | 639/3000 [33:45<1:58:29,  3.01s/it, lr: 1.0e-04 loss: 1.873e-02]hash_cache_v1:  21%|##1       | 640/3000 [33:47<1:58:26,  3.01s/it, lr: 1.0e-04 loss: 1.565e-01]hash_cache_v1:  21%|##1       | 640/3000 [33:47<1:58:26,  3.01s/it, lr: 1.0e-04 loss: 1.565e-01]hash_cache_v1:  21%|##1       | 641/3000 [33:47<1:23:15,  2.12s/it, lr: 1.0e-04 loss: 1.565e-01]hash_cache_v1:  21%|##1       | 641/3000 [33:47<1:23:15,  2.12s/it, lr: 1.0e-04 loss: 1.565e-01]hash_cache_v1:  21%|##1       | 641/3000 [33:49<1:23:15,  2.12s/it, lr: 1.0e-04 loss: 2.725e-01]hash_cache_v1:  21%|##1       | 641/3000 [33:49<1:23:15,  2.12s/it, lr: 1.0e-04 loss: 2.725e-01]hash_cache_v1:  21%|##1       | 642/3000 [33:49<1:23:02,  2.11s/it, lr: 1.0e-04 loss: 2.725e-01]hash_cache_v1:  21%|##1       | 642/3000 [33:49<1:23:02,  2.11s/it, lr: 1.0e-04 loss: 2.725e-01]hash_cache_v1:  21%|##1       | 642/3000 [33:51<1:23:02,  2.11s/it, lr: 1.0e-04 loss: 1.602e-01]hash_cache_v1:  21%|##1       | 642/3000 [33:51<1:23:02,  2.11s/it, lr: 1.0e-04 loss: 1.602e-01]hash_cache_v1:  21%|##1       | 643/3000 [33:51<1:25:35,  2.18s/it, lr: 1.0e-04 loss: 1.602e-01]hash_cache_v1:  21%|##1       | 643/3000 [33:51<1:25:35,  2.18s/it, lr: 1.0e-04 loss: 1.602e-01]hash_cache_v1:  21%|##1       | 643/3000 [33:54<1:25:35,  2.18s/it, lr: 1.0e-04 loss: 2.629e-01]hash_cache_v1:  21%|##1       | 643/3000 [33:54<1:25:35,  2.18s/it, lr: 1.0e-04 loss: 2.629e-01]hash_cache_v1:  21%|##1       | 644/3000 [33:54<1:24:44,  2.16s/it, lr: 1.0e-04 loss: 2.629e-01]hash_cache_v1:  21%|##1       | 644/3000 [33:54<1:24:44,  2.16s/it, lr: 1.0e-04 loss: 2.629e-01]hash_cache_v1:  21%|##1       | 644/3000 [33:56<1:24:44,  2.16s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  21%|##1       | 644/3000 [33:56<1:24:44,  2.16s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  22%|##1       | 645/3000 [33:56<1:23:57,  2.14s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  22%|##1       | 645/3000 [33:56<1:23:57,  2.14s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  22%|##1       | 645/3000 [33:59<1:23:57,  2.14s/it, lr: 1.0e-04 loss: 1.093e-01]hash_cache_v1:  22%|##1       | 645/3000 [33:59<1:23:57,  2.14s/it, lr: 1.0e-04 loss: 1.093e-01]hash_cache_v1:  22%|##1       | 646/3000 [33:59<1:34:10,  2.40s/it, lr: 1.0e-04 loss: 1.093e-01]hash_cache_v1:  22%|##1       | 646/3000 [33:59<1:34:10,  2.40s/it, lr: 1.0e-04 loss: 1.093e-01]hash_cache_v1:  22%|##1       | 646/3000 [34:03<1:34:10,  2.40s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  22%|##1       | 646/3000 [34:03<1:34:10,  2.40s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  22%|##1       | 647/3000 [34:03<1:55:27,  2.94s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  22%|##1       | 647/3000 [34:03<1:55:27,  2.94s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  22%|##1       | 647/3000 [34:06<1:55:27,  2.94s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  22%|##1       | 647/3000 [34:06<1:55:27,  2.94s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  22%|##1       | 648/3000 [34:06<1:54:36,  2.92s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  22%|##1       | 648/3000 [34:06<1:54:36,  2.92s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  22%|##1       | 648/3000 [34:09<1:54:36,  2.92s/it, lr: 1.0e-04 loss: 2.101e-01]hash_cache_v1:  22%|##1       | 648/3000 [34:09<1:54:36,  2.92s/it, lr: 1.0e-04 loss: 2.101e-01]hash_cache_v1:  22%|##1       | 649/3000 [34:09<1:53:55,  2.91s/it, lr: 1.0e-04 loss: 2.101e-01]hash_cache_v1:  22%|##1       | 649/3000 [34:09<1:53:55,  2.91s/it, lr: 1.0e-04 loss: 2.101e-01]hash_cache_v1:  22%|##1       | 649/3000 [34:11<1:53:55,  2.91s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  22%|##1       | 649/3000 [34:11<1:53:55,  2.91s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  22%|##1       | 650/3000 [34:15<1:53:52,  2.91s/it, lr: 1.0e-04 loss: 7.263e-02]hash_cache_v1:  22%|##1       | 650/3000 [34:15<1:53:52,  2.91s/it, lr: 1.0e-04 loss: 7.263e-02]hash_cache_v1:  22%|##1       | 651/3000 [34:15<1:40:24,  2.56s/it, lr: 1.0e-04 loss: 7.263e-02]hash_cache_v1:  22%|##1       | 651/3000 [34:15<1:40:24,  2.56s/it, lr: 1.0e-04 loss: 7.263e-02]hash_cache_v1:  22%|##1       | 651/3000 [34:18<1:40:24,  2.56s/it, lr: 1.0e-04 loss: 1.810e-01]hash_cache_v1:  22%|##1       | 651/3000 [34:18<1:40:24,  2.56s/it, lr: 1.0e-04 loss: 1.810e-01]hash_cache_v1:  22%|##1       | 652/3000 [34:18<1:42:09,  2.61s/it, lr: 1.0e-04 loss: 1.810e-01]hash_cache_v1:  22%|##1       | 652/3000 [34:18<1:42:09,  2.61s/it, lr: 1.0e-04 loss: 1.810e-01]hash_cache_v1:  22%|##1       | 652/3000 [34:23<1:42:09,  2.61s/it, lr: 1.0e-04 loss: 1.675e-01]hash_cache_v1:  22%|##1       | 652/3000 [34:23<1:42:09,  2.61s/it, lr: 1.0e-04 loss: 1.675e-01]hash_cache_v1:  22%|##1       | 653/3000 [34:23<2:01:24,  3.10s/it, lr: 1.0e-04 loss: 1.675e-01]hash_cache_v1:  22%|##1       | 653/3000 [34:23<2:01:24,  3.10s/it, lr: 1.0e-04 loss: 1.675e-01]hash_cache_v1:  22%|##1       | 653/3000 [34:27<2:01:24,  3.10s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:  22%|##1       | 653/3000 [34:27<2:01:24,  3.10s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:  22%|##1       | 654/3000 [34:27<2:14:08,  3.43s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:  22%|##1       | 654/3000 [34:27<2:14:08,  3.43s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:  22%|##1       | 654/3000 [34:31<2:14:08,  3.43s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  22%|##1       | 654/3000 [34:31<2:14:08,  3.43s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  22%|##1       | 655/3000 [34:31<2:23:22,  3.67s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  22%|##1       | 655/3000 [34:31<2:23:22,  3.67s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  22%|##1       | 655/3000 [34:36<2:23:22,  3.67s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  22%|##1       | 655/3000 [34:36<2:23:22,  3.67s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  22%|##1       | 656/3000 [34:36<2:30:43,  3.86s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  22%|##1       | 656/3000 [34:36<2:30:43,  3.86s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  22%|##1       | 656/3000 [34:39<2:30:43,  3.86s/it, lr: 1.0e-04 loss: 7.530e-02]hash_cache_v1:  22%|##1       | 656/3000 [34:39<2:30:43,  3.86s/it, lr: 1.0e-04 loss: 7.530e-02]hash_cache_v1:  22%|##1       | 657/3000 [34:39<2:22:52,  3.66s/it, lr: 1.0e-04 loss: 7.530e-02]hash_cache_v1:  22%|##1       | 657/3000 [34:39<2:22:52,  3.66s/it, lr: 1.0e-04 loss: 7.530e-02]hash_cache_v1:  22%|##1       | 657/3000 [34:43<2:22:52,  3.66s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  22%|##1       | 657/3000 [34:43<2:22:52,  3.66s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  22%|##1       | 658/3000 [34:43<2:30:12,  3.85s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  22%|##1       | 658/3000 [34:43<2:30:12,  3.85s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  22%|##1       | 658/3000 [34:47<2:30:12,  3.85s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  22%|##1       | 658/3000 [34:47<2:30:12,  3.85s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  22%|##1       | 659/3000 [34:47<2:35:29,  3.99s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  22%|##1       | 659/3000 [34:47<2:35:29,  3.99s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  22%|##1       | 659/3000 [34:50<2:35:29,  3.99s/it, lr: 1.0e-04 loss: 2.207e-01]hash_cache_v1:  22%|##1       | 659/3000 [34:50<2:35:29,  3.99s/it, lr: 1.0e-04 loss: 2.207e-01]hash_cache_v1:  22%|##2       | 660/3000 [34:52<2:35:25,  3.99s/it, lr: 1.0e-04 loss: 2.991e-01]hash_cache_v1:  22%|##2       | 660/3000 [34:52<2:35:25,  3.99s/it, lr: 1.0e-04 loss: 2.991e-01]hash_cache_v1:  22%|##2       | 661/3000 [34:52<1:43:11,  2.65s/it, lr: 1.0e-04 loss: 2.991e-01]hash_cache_v1:  22%|##2       | 661/3000 [34:52<1:43:11,  2.65s/it, lr: 1.0e-04 loss: 2.991e-01]hash_cache_v1:  22%|##2       | 661/3000 [34:56<1:43:11,  2.65s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  22%|##2       | 661/3000 [34:56<1:43:11,  2.65s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  22%|##2       | 662/3000 [34:56<1:59:20,  3.06s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  22%|##2       | 662/3000 [34:56<1:59:20,  3.06s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  22%|##2       | 662/3000 [35:00<1:59:20,  3.06s/it, lr: 1.0e-04 loss: 7.406e-02]hash_cache_v1:  22%|##2       | 662/3000 [35:00<1:59:20,  3.06s/it, lr: 1.0e-04 loss: 7.406e-02]hash_cache_v1:  22%|##2       | 663/3000 [35:00<2:11:51,  3.39s/it, lr: 1.0e-04 loss: 7.406e-02]hash_cache_v1:  22%|##2       | 663/3000 [35:00<2:11:51,  3.39s/it, lr: 1.0e-04 loss: 7.406e-02]hash_cache_v1:  22%|##2       | 663/3000 [35:04<2:11:51,  3.39s/it, lr: 1.0e-04 loss: 2.652e-01]hash_cache_v1:  22%|##2       | 663/3000 [35:04<2:11:51,  3.39s/it, lr: 1.0e-04 loss: 2.652e-01]hash_cache_v1:  22%|##2       | 664/3000 [35:04<2:09:02,  3.31s/it, lr: 1.0e-04 loss: 2.652e-01]hash_cache_v1:  22%|##2       | 664/3000 [35:04<2:09:02,  3.31s/it, lr: 1.0e-04 loss: 2.652e-01]hash_cache_v1:  22%|##2       | 664/3000 [35:06<2:09:02,  3.31s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  22%|##2       | 664/3000 [35:06<2:09:02,  3.31s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  22%|##2       | 665/3000 [35:06<2:04:07,  3.19s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  22%|##2       | 665/3000 [35:06<2:04:07,  3.19s/it, lr: 1.0e-04 loss: 1.948e-01]hash_cache_v1:  22%|##2       | 665/3000 [35:11<2:04:07,  3.19s/it, lr: 1.0e-04 loss: 1.499e-01]hash_cache_v1:  22%|##2       | 665/3000 [35:11<2:04:07,  3.19s/it, lr: 1.0e-04 loss: 1.499e-01]hash_cache_v1:  22%|##2       | 666/3000 [35:11<2:16:40,  3.51s/it, lr: 1.0e-04 loss: 1.499e-01]hash_cache_v1:  22%|##2       | 666/3000 [35:11<2:16:40,  3.51s/it, lr: 1.0e-04 loss: 1.499e-01]hash_cache_v1:  22%|##2       | 666/3000 [35:13<2:16:40,  3.51s/it, lr: 1.0e-04 loss: 2.358e-01]hash_cache_v1:  22%|##2       | 666/3000 [35:13<2:16:40,  3.51s/it, lr: 1.0e-04 loss: 2.358e-01]hash_cache_v1:  22%|##2       | 667/3000 [35:13<2:03:49,  3.18s/it, lr: 1.0e-04 loss: 2.358e-01]hash_cache_v1:  22%|##2       | 667/3000 [35:13<2:03:49,  3.18s/it, lr: 1.0e-04 loss: 2.358e-01]hash_cache_v1:  22%|##2       | 667/3000 [35:15<2:03:49,  3.18s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  22%|##2       | 667/3000 [35:15<2:03:49,  3.18s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  22%|##2       | 668/3000 [35:15<1:51:27,  2.87s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  22%|##2       | 668/3000 [35:15<1:51:27,  2.87s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  22%|##2       | 668/3000 [35:18<1:51:27,  2.87s/it, lr: 1.0e-04 loss: 2.036e-02]hash_cache_v1:  22%|##2       | 668/3000 [35:18<1:51:27,  2.87s/it, lr: 1.0e-04 loss: 2.036e-02]hash_cache_v1:  22%|##2       | 669/3000 [35:18<1:51:00,  2.86s/it, lr: 1.0e-04 loss: 2.036e-02]hash_cache_v1:  22%|##2       | 669/3000 [35:18<1:51:00,  2.86s/it, lr: 1.0e-04 loss: 2.036e-02]hash_cache_v1:  22%|##2       | 669/3000 [35:22<1:51:00,  2.86s/it, lr: 1.0e-04 loss: 1.382e-01]hash_cache_v1:  22%|##2       | 669/3000 [35:22<1:51:00,  2.86s/it, lr: 1.0e-04 loss: 1.382e-01]hash_cache_v1:  22%|##2       | 670/3000 [35:26<1:50:57,  2.86s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  22%|##2       | 670/3000 [35:26<1:50:57,  2.86s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  22%|##2       | 671/3000 [35:26<1:27:27,  2.25s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  22%|##2       | 671/3000 [35:26<1:27:27,  2.25s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  22%|##2       | 671/3000 [35:28<1:27:27,  2.25s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  22%|##2       | 671/3000 [35:28<1:27:27,  2.25s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  22%|##2       | 672/3000 [35:28<1:26:03,  2.22s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  22%|##2       | 672/3000 [35:28<1:26:03,  2.22s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  22%|##2       | 672/3000 [35:30<1:26:03,  2.22s/it, lr: 1.0e-04 loss: 4.765e-02]hash_cache_v1:  22%|##2       | 672/3000 [35:30<1:26:03,  2.22s/it, lr: 1.0e-04 loss: 4.765e-02]hash_cache_v1:  22%|##2       | 673/3000 [35:30<1:32:36,  2.39s/it, lr: 1.0e-04 loss: 4.765e-02]hash_cache_v1:  22%|##2       | 673/3000 [35:30<1:32:36,  2.39s/it, lr: 1.0e-04 loss: 4.765e-02]hash_cache_v1:  22%|##2       | 673/3000 [35:34<1:32:36,  2.39s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  22%|##2       | 673/3000 [35:34<1:32:36,  2.39s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  22%|##2       | 674/3000 [35:34<1:40:02,  2.58s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  22%|##2       | 674/3000 [35:34<1:40:02,  2.58s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  22%|##2       | 674/3000 [35:36<1:40:02,  2.58s/it, lr: 1.0e-04 loss: 2.528e-01]hash_cache_v1:  22%|##2       | 674/3000 [35:36<1:40:02,  2.58s/it, lr: 1.0e-04 loss: 2.528e-01]hash_cache_v1:  22%|##2       | 675/3000 [35:36<1:34:59,  2.45s/it, lr: 1.0e-04 loss: 2.528e-01]hash_cache_v1:  22%|##2       | 675/3000 [35:36<1:34:59,  2.45s/it, lr: 1.0e-04 loss: 2.528e-01]hash_cache_v1:  22%|##2       | 675/3000 [35:40<1:34:59,  2.45s/it, lr: 1.0e-04 loss: 5.110e-02]hash_cache_v1:  22%|##2       | 675/3000 [35:40<1:34:59,  2.45s/it, lr: 1.0e-04 loss: 5.110e-02]hash_cache_v1:  23%|##2       | 676/3000 [35:40<1:55:37,  2.99s/it, lr: 1.0e-04 loss: 5.110e-02]hash_cache_v1:  23%|##2       | 676/3000 [35:40<1:55:37,  2.99s/it, lr: 1.0e-04 loss: 5.110e-02]hash_cache_v1:  23%|##2       | 676/3000 [35:43<1:55:37,  2.99s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  23%|##2       | 676/3000 [35:43<1:55:37,  2.99s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  23%|##2       | 677/3000 [35:43<1:54:01,  2.95s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  23%|##2       | 677/3000 [35:43<1:54:01,  2.95s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  23%|##2       | 677/3000 [35:46<1:54:01,  2.95s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  23%|##2       | 677/3000 [35:46<1:54:01,  2.95s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  23%|##2       | 678/3000 [35:46<1:55:10,  2.98s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  23%|##2       | 678/3000 [35:46<1:55:10,  2.98s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  23%|##2       | 678/3000 [35:49<1:55:10,  2.98s/it, lr: 1.0e-04 loss: 1.996e-01]hash_cache_v1:  23%|##2       | 678/3000 [35:49<1:55:10,  2.98s/it, lr: 1.0e-04 loss: 1.996e-01]hash_cache_v1:  23%|##2       | 679/3000 [35:49<1:54:03,  2.95s/it, lr: 1.0e-04 loss: 1.996e-01]hash_cache_v1:  23%|##2       | 679/3000 [35:49<1:54:03,  2.95s/it, lr: 1.0e-04 loss: 1.996e-01]hash_cache_v1:  23%|##2       | 679/3000 [35:52<1:54:03,  2.95s/it, lr: 1.0e-04 loss: 6.382e-02]hash_cache_v1:  23%|##2       | 679/3000 [35:52<1:54:03,  2.95s/it, lr: 1.0e-04 loss: 6.382e-02]hash_cache_v1:  23%|##2       | 680/3000 [35:54<1:54:00,  2.95s/it, lr: 1.0e-04 loss: 2.038e-01]hash_cache_v1:  23%|##2       | 680/3000 [35:54<1:54:00,  2.95s/it, lr: 1.0e-04 loss: 2.038e-01]hash_cache_v1:  23%|##2       | 681/3000 [35:54<1:23:18,  2.16s/it, lr: 1.0e-04 loss: 2.038e-01]hash_cache_v1:  23%|##2       | 681/3000 [35:54<1:23:18,  2.16s/it, lr: 1.0e-04 loss: 2.038e-01]hash_cache_v1:  23%|##2       | 681/3000 [35:57<1:23:18,  2.16s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  23%|##2       | 681/3000 [35:57<1:23:18,  2.16s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  23%|##2       | 682/3000 [35:57<1:29:55,  2.33s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  23%|##2       | 682/3000 [35:57<1:29:55,  2.33s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  23%|##2       | 682/3000 [36:01<1:29:55,  2.33s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  23%|##2       | 682/3000 [36:01<1:29:55,  2.33s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  23%|##2       | 683/3000 [36:01<1:49:29,  2.84s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  23%|##2       | 683/3000 [36:01<1:49:29,  2.84s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  23%|##2       | 683/3000 [36:06<1:49:29,  2.84s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  23%|##2       | 683/3000 [36:06<1:49:29,  2.84s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  23%|##2       | 684/3000 [36:06<2:05:20,  3.25s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  23%|##2       | 684/3000 [36:06<2:05:20,  3.25s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  23%|##2       | 684/3000 [36:08<2:05:20,  3.25s/it, lr: 1.0e-04 loss: 2.132e-01]hash_cache_v1:  23%|##2       | 684/3000 [36:08<2:05:20,  3.25s/it, lr: 1.0e-04 loss: 2.132e-01]hash_cache_v1:  23%|##2       | 685/3000 [36:08<1:56:13,  3.01s/it, lr: 1.0e-04 loss: 2.132e-01]hash_cache_v1:  23%|##2       | 685/3000 [36:08<1:56:13,  3.01s/it, lr: 1.0e-04 loss: 2.132e-01]hash_cache_v1:  23%|##2       | 685/3000 [36:12<1:56:13,  3.01s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  23%|##2       | 685/3000 [36:12<1:56:13,  3.01s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  23%|##2       | 686/3000 [36:12<2:10:08,  3.37s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  23%|##2       | 686/3000 [36:12<2:10:08,  3.37s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  23%|##2       | 686/3000 [36:14<2:10:08,  3.37s/it, lr: 1.0e-04 loss: 2.070e-01]hash_cache_v1:  23%|##2       | 686/3000 [36:14<2:10:08,  3.37s/it, lr: 1.0e-04 loss: 2.070e-01]hash_cache_v1:  23%|##2       | 687/3000 [36:14<1:56:02,  3.01s/it, lr: 1.0e-04 loss: 2.070e-01]hash_cache_v1:  23%|##2       | 687/3000 [36:14<1:56:02,  3.01s/it, lr: 1.0e-04 loss: 2.070e-01]hash_cache_v1:  23%|##2       | 687/3000 [36:17<1:56:02,  3.01s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  23%|##2       | 687/3000 [36:17<1:56:02,  3.01s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  23%|##2       | 688/3000 [36:17<1:45:53,  2.75s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  23%|##2       | 688/3000 [36:17<1:45:53,  2.75s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  23%|##2       | 688/3000 [36:21<1:45:53,  2.75s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  23%|##2       | 688/3000 [36:21<1:45:53,  2.75s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  23%|##2       | 689/3000 [36:21<2:06:44,  3.29s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  23%|##2       | 689/3000 [36:21<2:06:44,  3.29s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  23%|##2       | 689/3000 [36:25<2:06:44,  3.29s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  23%|##2       | 689/3000 [36:25<2:06:44,  3.29s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  23%|##3       | 690/3000 [36:28<2:06:41,  3.29s/it, lr: 1.0e-04 loss: 1.871e-01]hash_cache_v1:  23%|##3       | 690/3000 [36:28<2:06:41,  3.29s/it, lr: 1.0e-04 loss: 1.871e-01]hash_cache_v1:  23%|##3       | 691/3000 [36:28<1:34:13,  2.45s/it, lr: 1.0e-04 loss: 1.871e-01]hash_cache_v1:  23%|##3       | 691/3000 [36:28<1:34:13,  2.45s/it, lr: 1.0e-04 loss: 1.871e-01]hash_cache_v1:  23%|##3       | 691/3000 [36:33<1:34:13,  2.45s/it, lr: 1.0e-04 loss: 1.670e-01]hash_cache_v1:  23%|##3       | 691/3000 [36:33<1:34:13,  2.45s/it, lr: 1.0e-04 loss: 1.670e-01]hash_cache_v1:  23%|##3       | 692/3000 [36:33<1:53:50,  2.96s/it, lr: 1.0e-04 loss: 1.670e-01]hash_cache_v1:  23%|##3       | 692/3000 [36:33<1:53:50,  2.96s/it, lr: 1.0e-04 loss: 1.670e-01]hash_cache_v1:  23%|##3       | 692/3000 [36:35<1:53:50,  2.96s/it, lr: 1.0e-04 loss: 9.789e-02]hash_cache_v1:  23%|##3       | 692/3000 [36:35<1:53:50,  2.96s/it, lr: 1.0e-04 loss: 9.789e-02]hash_cache_v1:  23%|##3       | 693/3000 [36:35<1:45:08,  2.73s/it, lr: 1.0e-04 loss: 9.789e-02]hash_cache_v1:  23%|##3       | 693/3000 [36:35<1:45:08,  2.73s/it, lr: 1.0e-04 loss: 9.789e-02]hash_cache_v1:  23%|##3       | 693/3000 [36:37<1:45:08,  2.73s/it, lr: 1.0e-04 loss: 2.546e-01]hash_cache_v1:  23%|##3       | 693/3000 [36:37<1:45:08,  2.73s/it, lr: 1.0e-04 loss: 2.546e-01]hash_cache_v1:  23%|##3       | 694/3000 [36:37<1:38:41,  2.57s/it, lr: 1.0e-04 loss: 2.546e-01]hash_cache_v1:  23%|##3       | 694/3000 [36:37<1:38:41,  2.57s/it, lr: 1.0e-04 loss: 2.546e-01]hash_cache_v1:  23%|##3       | 694/3000 [36:41<1:38:41,  2.57s/it, lr: 1.0e-04 loss: 6.434e-02]hash_cache_v1:  23%|##3       | 694/3000 [36:41<1:38:41,  2.57s/it, lr: 1.0e-04 loss: 6.434e-02]hash_cache_v1:  23%|##3       | 695/3000 [36:41<1:57:14,  3.05s/it, lr: 1.0e-04 loss: 6.434e-02]hash_cache_v1:  23%|##3       | 695/3000 [36:41<1:57:14,  3.05s/it, lr: 1.0e-04 loss: 6.434e-02]hash_cache_v1:  23%|##3       | 695/3000 [36:44<1:57:14,  3.05s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  23%|##3       | 695/3000 [36:44<1:57:14,  3.05s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  23%|##3       | 696/3000 [36:44<1:57:47,  3.07s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  23%|##3       | 696/3000 [36:44<1:57:47,  3.07s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  23%|##3       | 696/3000 [36:47<1:57:47,  3.07s/it, lr: 1.0e-04 loss: 7.228e-02]hash_cache_v1:  23%|##3       | 696/3000 [36:47<1:57:47,  3.07s/it, lr: 1.0e-04 loss: 7.228e-02]hash_cache_v1:  23%|##3       | 697/3000 [36:47<1:55:14,  3.00s/it, lr: 1.0e-04 loss: 7.228e-02]hash_cache_v1:  23%|##3       | 697/3000 [36:47<1:55:14,  3.00s/it, lr: 1.0e-04 loss: 7.228e-02]hash_cache_v1:  23%|##3       | 697/3000 [36:50<1:55:14,  3.00s/it, lr: 1.0e-04 loss: 4.002e-02]hash_cache_v1:  23%|##3       | 697/3000 [36:50<1:55:14,  3.00s/it, lr: 1.0e-04 loss: 4.002e-02]hash_cache_v1:  23%|##3       | 698/3000 [36:50<1:53:48,  2.97s/it, lr: 1.0e-04 loss: 4.002e-02]hash_cache_v1:  23%|##3       | 698/3000 [36:50<1:53:48,  2.97s/it, lr: 1.0e-04 loss: 4.002e-02]hash_cache_v1:  23%|##3       | 698/3000 [36:55<1:53:48,  2.97s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  23%|##3       | 698/3000 [36:55<1:53:48,  2.97s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  23%|##3       | 699/3000 [36:55<2:11:11,  3.42s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  23%|##3       | 699/3000 [36:55<2:11:11,  3.42s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  23%|##3       | 699/3000 [36:58<2:11:11,  3.42s/it, lr: 1.0e-04 loss: 8.691e-02]hash_cache_v1:  23%|##3       | 699/3000 [36:58<2:11:11,  3.42s/it, lr: 1.0e-04 loss: 8.691e-02]hash_cache_v1:  23%|##3       | 700/3000 [37:00<2:11:08,  3.42s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  23%|##3       | 700/3000 [37:00<2:11:08,  3.42s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  23%|##3       | 701/3000 [37:00<1:29:39,  2.34s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  23%|##3       | 701/3000 [37:00<1:29:39,  2.34s/it, lr: 1.0e-04 loss: 1.530e-01]hash_cache_v1:  23%|##3       | 701/3000 [37:04<1:29:39,  2.34s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  23%|##3       | 701/3000 [37:04<1:29:39,  2.34s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  23%|##3       | 702/3000 [37:04<1:47:53,  2.82s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  23%|##3       | 702/3000 [37:04<1:47:53,  2.82s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  23%|##3       | 702/3000 [37:07<1:47:53,  2.82s/it, lr: 1.0e-04 loss: 6.420e-02]hash_cache_v1:  23%|##3       | 702/3000 [37:07<1:47:53,  2.82s/it, lr: 1.0e-04 loss: 6.420e-02]hash_cache_v1:  23%|##3       | 703/3000 [37:07<1:50:36,  2.89s/it, lr: 1.0e-04 loss: 6.420e-02]hash_cache_v1:  23%|##3       | 703/3000 [37:07<1:50:36,  2.89s/it, lr: 1.0e-04 loss: 6.420e-02]hash_cache_v1:  23%|##3       | 703/3000 [37:11<1:50:36,  2.89s/it, lr: 1.0e-04 loss: 2.249e-01]hash_cache_v1:  23%|##3       | 703/3000 [37:11<1:50:36,  2.89s/it, lr: 1.0e-04 loss: 2.249e-01]hash_cache_v1:  23%|##3       | 704/3000 [37:11<2:05:23,  3.28s/it, lr: 1.0e-04 loss: 2.249e-01]hash_cache_v1:  23%|##3       | 704/3000 [37:11<2:05:23,  3.28s/it, lr: 1.0e-04 loss: 2.249e-01]hash_cache_v1:  23%|##3       | 704/3000 [37:16<2:05:23,  3.28s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  23%|##3       | 704/3000 [37:16<2:05:23,  3.28s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  24%|##3       | 705/3000 [37:16<2:16:20,  3.56s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  24%|##3       | 705/3000 [37:16<2:16:20,  3.56s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  24%|##3       | 705/3000 [37:18<2:16:20,  3.56s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  24%|##3       | 705/3000 [37:18<2:16:20,  3.56s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  24%|##3       | 706/3000 [37:18<2:03:39,  3.23s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  24%|##3       | 706/3000 [37:18<2:03:39,  3.23s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  24%|##3       | 706/3000 [37:20<2:03:39,  3.23s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  24%|##3       | 706/3000 [37:20<2:03:39,  3.23s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  24%|##3       | 707/3000 [37:20<1:51:10,  2.91s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  24%|##3       | 707/3000 [37:20<1:51:10,  2.91s/it, lr: 1.0e-04 loss: 9.905e-02]hash_cache_v1:  24%|##3       | 707/3000 [37:22<1:51:10,  2.91s/it, lr: 1.0e-04 loss: 2.228e-01]hash_cache_v1:  24%|##3       | 707/3000 [37:22<1:51:10,  2.91s/it, lr: 1.0e-04 loss: 2.228e-01]hash_cache_v1:  24%|##3       | 708/3000 [37:22<1:42:14,  2.68s/it, lr: 1.0e-04 loss: 2.228e-01]hash_cache_v1:  24%|##3       | 708/3000 [37:22<1:42:14,  2.68s/it, lr: 1.0e-04 loss: 2.228e-01]hash_cache_v1:  24%|##3       | 708/3000 [37:24<1:42:14,  2.68s/it, lr: 1.0e-04 loss: 2.914e-01]hash_cache_v1:  24%|##3       | 708/3000 [37:24<1:42:14,  2.68s/it, lr: 1.0e-04 loss: 2.914e-01]hash_cache_v1:  24%|##3       | 709/3000 [37:24<1:35:56,  2.51s/it, lr: 1.0e-04 loss: 2.914e-01]hash_cache_v1:  24%|##3       | 709/3000 [37:24<1:35:56,  2.51s/it, lr: 1.0e-04 loss: 2.914e-01]hash_cache_v1:  24%|##3       | 709/3000 [37:27<1:35:56,  2.51s/it, lr: 1.0e-04 loss: 2.268e-01]hash_cache_v1:  24%|##3       | 709/3000 [37:27<1:35:56,  2.51s/it, lr: 1.0e-04 loss: 2.268e-01]hash_cache_v1:  24%|##3       | 710/3000 [37:31<1:35:53,  2.51s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  24%|##3       | 710/3000 [37:31<1:35:53,  2.51s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  24%|##3       | 711/3000 [37:31<1:28:34,  2.32s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  24%|##3       | 711/3000 [37:31<1:28:34,  2.32s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  24%|##3       | 711/3000 [37:34<1:28:34,  2.32s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  24%|##3       | 711/3000 [37:34<1:28:34,  2.32s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  24%|##3       | 712/3000 [37:34<1:33:38,  2.46s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  24%|##3       | 712/3000 [37:34<1:33:38,  2.46s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  24%|##3       | 712/3000 [37:36<1:33:38,  2.46s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 712/3000 [37:36<1:33:38,  2.46s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 713/3000 [37:36<1:30:07,  2.36s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 713/3000 [37:36<1:30:07,  2.36s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 713/3000 [37:40<1:30:07,  2.36s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  24%|##3       | 713/3000 [37:40<1:30:07,  2.36s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  24%|##3       | 714/3000 [37:41<1:52:17,  2.95s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  24%|##3       | 714/3000 [37:41<1:52:17,  2.95s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  24%|##3       | 714/3000 [37:43<1:52:17,  2.95s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  24%|##3       | 714/3000 [37:43<1:52:17,  2.95s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  24%|##3       | 715/3000 [37:43<1:51:30,  2.93s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  24%|##3       | 715/3000 [37:43<1:51:30,  2.93s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  24%|##3       | 715/3000 [37:48<1:51:30,  2.93s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 715/3000 [37:48<1:51:30,  2.93s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 716/3000 [37:48<2:05:59,  3.31s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 716/3000 [37:48<2:05:59,  3.31s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  24%|##3       | 716/3000 [37:50<2:05:59,  3.31s/it, lr: 1.0e-04 loss: 1.532e-01]hash_cache_v1:  24%|##3       | 716/3000 [37:50<2:05:59,  3.31s/it, lr: 1.0e-04 loss: 1.532e-01]hash_cache_v1:  24%|##3       | 717/3000 [37:50<1:55:47,  3.04s/it, lr: 1.0e-04 loss: 1.532e-01]hash_cache_v1:  24%|##3       | 717/3000 [37:50<1:55:47,  3.04s/it, lr: 1.0e-04 loss: 1.532e-01]hash_cache_v1:  24%|##3       | 717/3000 [37:53<1:55:47,  3.04s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  24%|##3       | 717/3000 [37:53<1:55:47,  3.04s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  24%|##3       | 718/3000 [37:53<1:53:31,  2.98s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  24%|##3       | 718/3000 [37:53<1:53:31,  2.98s/it, lr: 1.0e-04 loss: 1.749e-01]hash_cache_v1:  24%|##3       | 718/3000 [37:55<1:53:31,  2.98s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##3       | 718/3000 [37:55<1:53:31,  2.98s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##3       | 719/3000 [37:55<1:43:40,  2.73s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##3       | 719/3000 [37:55<1:43:40,  2.73s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##3       | 719/3000 [37:57<1:43:40,  2.73s/it, lr: 1.0e-04 loss: 2.056e-01]hash_cache_v1:  24%|##3       | 719/3000 [37:57<1:43:40,  2.73s/it, lr: 1.0e-04 loss: 2.056e-01]hash_cache_v1:  24%|##4       | 720/3000 [38:01<1:43:37,  2.73s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  24%|##4       | 720/3000 [38:01<1:43:37,  2.73s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  24%|##4       | 721/3000 [38:01<1:24:24,  2.22s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  24%|##4       | 721/3000 [38:01<1:24:24,  2.22s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  24%|##4       | 721/3000 [38:05<1:24:24,  2.22s/it, lr: 1.0e-04 loss: 2.149e-01]hash_cache_v1:  24%|##4       | 721/3000 [38:05<1:24:24,  2.22s/it, lr: 1.0e-04 loss: 2.149e-01]hash_cache_v1:  24%|##4       | 722/3000 [38:05<1:44:05,  2.74s/it, lr: 1.0e-04 loss: 2.149e-01]hash_cache_v1:  24%|##4       | 722/3000 [38:05<1:44:05,  2.74s/it, lr: 1.0e-04 loss: 2.149e-01]hash_cache_v1:  24%|##4       | 722/3000 [38:09<1:44:05,  2.74s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##4       | 722/3000 [38:09<1:44:05,  2.74s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##4       | 723/3000 [38:09<1:59:34,  3.15s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##4       | 723/3000 [38:09<1:59:34,  3.15s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  24%|##4       | 723/3000 [38:14<1:59:34,  3.15s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  24%|##4       | 723/3000 [38:14<1:59:34,  3.15s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  24%|##4       | 724/3000 [38:14<2:12:35,  3.50s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  24%|##4       | 724/3000 [38:14<2:12:35,  3.50s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  24%|##4       | 724/3000 [38:16<2:12:35,  3.50s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:  24%|##4       | 724/3000 [38:16<2:12:35,  3.50s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:  24%|##4       | 725/3000 [38:16<1:57:51,  3.11s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:  24%|##4       | 725/3000 [38:16<1:57:51,  3.11s/it, lr: 1.0e-04 loss: 2.158e-01]hash_cache_v1:  24%|##4       | 725/3000 [38:18<1:57:51,  3.11s/it, lr: 1.0e-04 loss: 7.609e-02]hash_cache_v1:  24%|##4       | 725/3000 [38:18<1:57:51,  3.11s/it, lr: 1.0e-04 loss: 7.609e-02]hash_cache_v1:  24%|##4       | 726/3000 [38:18<1:47:06,  2.83s/it, lr: 1.0e-04 loss: 7.609e-02]hash_cache_v1:  24%|##4       | 726/3000 [38:18<1:47:06,  2.83s/it, lr: 1.0e-04 loss: 7.609e-02]hash_cache_v1:  24%|##4       | 726/3000 [38:20<1:47:06,  2.83s/it, lr: 1.0e-04 loss: 1.925e-01]hash_cache_v1:  24%|##4       | 726/3000 [38:20<1:47:06,  2.83s/it, lr: 1.0e-04 loss: 1.925e-01]hash_cache_v1:  24%|##4       | 727/3000 [38:20<1:39:25,  2.62s/it, lr: 1.0e-04 loss: 1.925e-01]hash_cache_v1:  24%|##4       | 727/3000 [38:20<1:39:25,  2.62s/it, lr: 1.0e-04 loss: 1.925e-01]hash_cache_v1:  24%|##4       | 727/3000 [38:25<1:39:25,  2.62s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  24%|##4       | 727/3000 [38:25<1:39:25,  2.62s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  24%|##4       | 728/3000 [38:25<2:00:02,  3.17s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  24%|##4       | 728/3000 [38:25<2:00:02,  3.17s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  24%|##4       | 728/3000 [38:27<2:00:02,  3.17s/it, lr: 1.0e-04 loss: 5.593e-02]hash_cache_v1:  24%|##4       | 728/3000 [38:27<2:00:02,  3.17s/it, lr: 1.0e-04 loss: 5.593e-02]hash_cache_v1:  24%|##4       | 729/3000 [38:27<1:48:11,  2.86s/it, lr: 1.0e-04 loss: 5.593e-02]hash_cache_v1:  24%|##4       | 729/3000 [38:27<1:48:11,  2.86s/it, lr: 1.0e-04 loss: 5.593e-02]hash_cache_v1:  24%|##4       | 729/3000 [38:30<1:48:11,  2.86s/it, lr: 1.0e-04 loss: 1.119e-01]hash_cache_v1:  24%|##4       | 729/3000 [38:30<1:48:11,  2.86s/it, lr: 1.0e-04 loss: 1.119e-01]hash_cache_v1:  24%|##4       | 730/3000 [38:33<1:48:08,  2.86s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  24%|##4       | 730/3000 [38:33<1:48:08,  2.86s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  24%|##4       | 731/3000 [38:33<1:25:08,  2.25s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  24%|##4       | 731/3000 [38:33<1:25:08,  2.25s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  24%|##4       | 731/3000 [38:37<1:25:08,  2.25s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  24%|##4       | 731/3000 [38:37<1:25:08,  2.25s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  24%|##4       | 732/3000 [38:37<1:44:07,  2.75s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  24%|##4       | 732/3000 [38:37<1:44:07,  2.75s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  24%|##4       | 732/3000 [38:39<1:44:07,  2.75s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  24%|##4       | 732/3000 [38:39<1:44:07,  2.75s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  24%|##4       | 733/3000 [38:39<1:37:49,  2.59s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  24%|##4       | 733/3000 [38:39<1:37:49,  2.59s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  24%|##4       | 733/3000 [38:43<1:37:49,  2.59s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  24%|##4       | 733/3000 [38:43<1:37:49,  2.59s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  24%|##4       | 734/3000 [38:43<1:55:07,  3.05s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  24%|##4       | 734/3000 [38:43<1:55:07,  3.05s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  24%|##4       | 734/3000 [38:46<1:55:07,  3.05s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:  24%|##4       | 734/3000 [38:46<1:55:07,  3.05s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:  24%|##4       | 735/3000 [38:46<1:48:11,  2.87s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:  24%|##4       | 735/3000 [38:46<1:48:11,  2.87s/it, lr: 1.0e-04 loss: 2.042e-01]hash_cache_v1:  24%|##4       | 735/3000 [38:49<1:48:11,  2.87s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  24%|##4       | 735/3000 [38:49<1:48:11,  2.87s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  25%|##4       | 736/3000 [38:49<1:48:12,  2.87s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  25%|##4       | 736/3000 [38:49<1:48:12,  2.87s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  25%|##4       | 736/3000 [38:52<1:48:12,  2.87s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  25%|##4       | 736/3000 [38:52<1:48:12,  2.87s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  25%|##4       | 737/3000 [38:52<1:48:21,  2.87s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  25%|##4       | 737/3000 [38:52<1:48:21,  2.87s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  25%|##4       | 737/3000 [38:54<1:48:21,  2.87s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  25%|##4       | 737/3000 [38:54<1:48:21,  2.87s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  25%|##4       | 738/3000 [38:54<1:39:41,  2.64s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  25%|##4       | 738/3000 [38:54<1:39:41,  2.64s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  25%|##4       | 738/3000 [38:56<1:39:41,  2.64s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  25%|##4       | 738/3000 [38:56<1:39:41,  2.64s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  25%|##4       | 739/3000 [38:56<1:36:37,  2.56s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  25%|##4       | 739/3000 [38:56<1:36:37,  2.56s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  25%|##4       | 739/3000 [38:58<1:36:37,  2.56s/it, lr: 1.0e-04 loss: 5.230e-02]hash_cache_v1:  25%|##4       | 739/3000 [38:58<1:36:37,  2.56s/it, lr: 1.0e-04 loss: 5.230e-02]hash_cache_v1:  25%|##4       | 740/3000 [39:01<1:36:34,  2.56s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  25%|##4       | 740/3000 [39:01<1:36:34,  2.56s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  25%|##4       | 741/3000 [39:01<1:17:05,  2.05s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  25%|##4       | 741/3000 [39:01<1:17:05,  2.05s/it, lr: 1.0e-04 loss: 1.813e-01]hash_cache_v1:  25%|##4       | 741/3000 [39:03<1:17:05,  2.05s/it, lr: 1.0e-04 loss: 2.194e-01]hash_cache_v1:  25%|##4       | 741/3000 [39:03<1:17:05,  2.05s/it, lr: 1.0e-04 loss: 2.194e-01]hash_cache_v1:  25%|##4       | 742/3000 [39:03<1:20:03,  2.13s/it, lr: 1.0e-04 loss: 2.194e-01]hash_cache_v1:  25%|##4       | 742/3000 [39:03<1:20:03,  2.13s/it, lr: 1.0e-04 loss: 2.194e-01]hash_cache_v1:  25%|##4       | 742/3000 [39:06<1:20:03,  2.13s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  25%|##4       | 742/3000 [39:06<1:20:03,  2.13s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  25%|##4       | 743/3000 [39:06<1:27:11,  2.32s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  25%|##4       | 743/3000 [39:06<1:27:11,  2.32s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  25%|##4       | 743/3000 [39:08<1:27:11,  2.32s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  25%|##4       | 743/3000 [39:08<1:27:11,  2.32s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  25%|##4       | 744/3000 [39:08<1:24:56,  2.26s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  25%|##4       | 744/3000 [39:08<1:24:56,  2.26s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  25%|##4       | 744/3000 [39:11<1:24:56,  2.26s/it, lr: 1.0e-04 loss: 6.294e-02]hash_cache_v1:  25%|##4       | 744/3000 [39:11<1:24:56,  2.26s/it, lr: 1.0e-04 loss: 6.294e-02]hash_cache_v1:  25%|##4       | 745/3000 [39:11<1:31:18,  2.43s/it, lr: 1.0e-04 loss: 6.294e-02]hash_cache_v1:  25%|##4       | 745/3000 [39:11<1:31:18,  2.43s/it, lr: 1.0e-04 loss: 6.294e-02]hash_cache_v1:  25%|##4       | 745/3000 [39:16<1:31:18,  2.43s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  25%|##4       | 745/3000 [39:16<1:31:18,  2.43s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  25%|##4       | 746/3000 [39:16<1:52:55,  3.01s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  25%|##4       | 746/3000 [39:16<1:52:55,  3.01s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  25%|##4       | 746/3000 [39:18<1:52:55,  3.01s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  25%|##4       | 746/3000 [39:18<1:52:55,  3.01s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  25%|##4       | 747/3000 [39:18<1:51:15,  2.96s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  25%|##4       | 747/3000 [39:18<1:51:15,  2.96s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  25%|##4       | 747/3000 [39:21<1:51:15,  2.96s/it, lr: 1.0e-04 loss: 2.050e-01]hash_cache_v1:  25%|##4       | 747/3000 [39:21<1:51:15,  2.96s/it, lr: 1.0e-04 loss: 2.050e-01]hash_cache_v1:  25%|##4       | 748/3000 [39:21<1:41:38,  2.71s/it, lr: 1.0e-04 loss: 2.050e-01]hash_cache_v1:  25%|##4       | 748/3000 [39:21<1:41:38,  2.71s/it, lr: 1.0e-04 loss: 2.050e-01]hash_cache_v1:  25%|##4       | 748/3000 [39:24<1:41:38,  2.71s/it, lr: 1.0e-04 loss: 5.554e-02]hash_cache_v1:  25%|##4       | 748/3000 [39:24<1:41:38,  2.71s/it, lr: 1.0e-04 loss: 5.554e-02]hash_cache_v1:  25%|##4       | 749/3000 [39:24<1:45:16,  2.81s/it, lr: 1.0e-04 loss: 5.554e-02]hash_cache_v1:  25%|##4       | 749/3000 [39:24<1:45:16,  2.81s/it, lr: 1.0e-04 loss: 5.554e-02]hash_cache_v1:  25%|##4       | 749/3000 [39:28<1:45:16,  2.81s/it, lr: 1.0e-04 loss: 1.326e-01]hash_cache_v1:  25%|##4       | 749/3000 [39:28<1:45:16,  2.81s/it, lr: 1.0e-04 loss: 1.326e-01]
+Saving at step 750
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000000750.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.92s/it]Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.92s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.11s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.11s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.31s/it]Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.31s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.39s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.39s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  25%|##5       | 750/3000 [39:30<1:45:13,  2.81s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  25%|##5       | 750/3000 [39:30<1:45:13,  2.81s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  25%|##5       | 751/3000 [39:30<1:17:17,  2.06s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  25%|##5       | 751/3000 [39:30<1:17:17,  2.06s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  25%|##5       | 751/3000 [39:35<1:17:17,  2.06s/it, lr: 1.0e-04 loss: 7.344e-02]hash_cache_v1:  25%|##5       | 751/3000 [39:35<1:17:17,  2.06s/it, lr: 1.0e-04 loss: 7.344e-02]hash_cache_v1:  25%|##5       | 752/3000 [39:35<1:37:45,  2.61s/it, lr: 1.0e-04 loss: 7.344e-02]hash_cache_v1:  25%|##5       | 752/3000 [39:35<1:37:45,  2.61s/it, lr: 1.0e-04 loss: 7.344e-02]hash_cache_v1:  25%|##5       | 752/3000 [39:39<1:37:45,  2.61s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  25%|##5       | 752/3000 [39:39<1:37:45,  2.61s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  25%|##5       | 753/3000 [39:39<1:53:57,  3.04s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  25%|##5       | 753/3000 [39:39<1:53:57,  3.04s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  25%|##5       | 753/3000 [39:42<1:53:57,  3.04s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:  25%|##5       | 753/3000 [39:42<1:53:57,  3.04s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:  25%|##5       | 754/3000 [39:42<1:54:22,  3.06s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:  25%|##5       | 754/3000 [39:42<1:54:22,  3.06s/it, lr: 1.0e-04 loss: 1.919e-01]hash_cache_v1:  25%|##5       | 754/3000 [39:45<1:54:22,  3.06s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  25%|##5       | 754/3000 [39:45<1:54:22,  3.06s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  25%|##5       | 755/3000 [39:45<1:52:05,  3.00s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  25%|##5       | 755/3000 [39:45<1:52:05,  3.00s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  25%|##5       | 755/3000 [39:47<1:52:05,  3.00s/it, lr: 1.0e-04 loss: 1.636e-02]hash_cache_v1:  25%|##5       | 755/3000 [39:47<1:52:05,  3.00s/it, lr: 1.0e-04 loss: 1.636e-02]hash_cache_v1:  25%|##5       | 756/3000 [39:47<1:42:25,  2.74s/it, lr: 1.0e-04 loss: 1.636e-02]hash_cache_v1:  25%|##5       | 756/3000 [39:47<1:42:25,  2.74s/it, lr: 1.0e-04 loss: 1.636e-02]hash_cache_v1:  25%|##5       | 756/3000 [39:51<1:42:25,  2.74s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  25%|##5       | 756/3000 [39:51<1:42:25,  2.74s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  25%|##5       | 757/3000 [39:51<2:00:58,  3.24s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  25%|##5       | 757/3000 [39:51<2:00:58,  3.24s/it, lr: 1.0e-04 loss: 1.733e-01]hash_cache_v1:  25%|##5       | 757/3000 [39:53<2:00:58,  3.24s/it, lr: 1.0e-04 loss: 2.432e-01]hash_cache_v1:  25%|##5       | 757/3000 [39:53<2:00:58,  3.24s/it, lr: 1.0e-04 loss: 2.432e-01]hash_cache_v1:  25%|##5       | 758/3000 [39:53<1:48:27,  2.90s/it, lr: 1.0e-04 loss: 2.432e-01]hash_cache_v1:  25%|##5       | 758/3000 [39:53<1:48:27,  2.90s/it, lr: 1.0e-04 loss: 2.432e-01]hash_cache_v1:  25%|##5       | 758/3000 [39:56<1:48:27,  2.90s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  25%|##5       | 758/3000 [39:56<1:48:27,  2.90s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  25%|##5       | 759/3000 [39:56<1:47:56,  2.89s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  25%|##5       | 759/3000 [39:56<1:47:56,  2.89s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  25%|##5       | 759/3000 [40:01<1:47:56,  2.89s/it, lr: 1.0e-04 loss: 1.401e-01]hash_cache_v1:  25%|##5       | 759/3000 [40:01<1:47:56,  2.89s/it, lr: 1.0e-04 loss: 1.401e-01]hash_cache_v1:  25%|##5       | 760/3000 [40:03<1:47:53,  2.89s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  25%|##5       | 760/3000 [40:03<1:47:53,  2.89s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  25%|##5       | 761/3000 [40:03<1:18:49,  2.11s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  25%|##5       | 761/3000 [40:03<1:18:49,  2.11s/it, lr: 1.0e-04 loss: 1.653e-01]hash_cache_v1:  25%|##5       | 761/3000 [40:06<1:18:49,  2.11s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:  25%|##5       | 761/3000 [40:06<1:18:49,  2.11s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:  25%|##5       | 762/3000 [40:06<1:25:56,  2.30s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:  25%|##5       | 762/3000 [40:06<1:25:56,  2.30s/it, lr: 1.0e-04 loss: 1.955e-01]hash_cache_v1:  25%|##5       | 762/3000 [40:09<1:25:56,  2.30s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  25%|##5       | 762/3000 [40:09<1:25:56,  2.30s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  25%|##5       | 763/3000 [40:09<1:31:37,  2.46s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  25%|##5       | 763/3000 [40:09<1:31:37,  2.46s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  25%|##5       | 763/3000 [40:11<1:31:37,  2.46s/it, lr: 1.0e-04 loss: 3.483e-02]hash_cache_v1:  25%|##5       | 763/3000 [40:11<1:31:37,  2.46s/it, lr: 1.0e-04 loss: 3.483e-02]hash_cache_v1:  25%|##5       | 764/3000 [40:11<1:27:58,  2.36s/it, lr: 1.0e-04 loss: 3.483e-02]hash_cache_v1:  25%|##5       | 764/3000 [40:11<1:27:58,  2.36s/it, lr: 1.0e-04 loss: 3.483e-02]hash_cache_v1:  25%|##5       | 764/3000 [40:15<1:27:58,  2.36s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  25%|##5       | 764/3000 [40:15<1:27:58,  2.36s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  26%|##5       | 765/3000 [40:15<1:49:40,  2.94s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  26%|##5       | 765/3000 [40:15<1:49:40,  2.94s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  26%|##5       | 765/3000 [40:18<1:49:40,  2.94s/it, lr: 1.0e-04 loss: 1.605e-01]hash_cache_v1:  26%|##5       | 765/3000 [40:18<1:49:40,  2.94s/it, lr: 1.0e-04 loss: 1.605e-01]hash_cache_v1:  26%|##5       | 766/3000 [40:18<1:48:52,  2.92s/it, lr: 1.0e-04 loss: 1.605e-01]hash_cache_v1:  26%|##5       | 766/3000 [40:18<1:48:52,  2.92s/it, lr: 1.0e-04 loss: 1.605e-01]hash_cache_v1:  26%|##5       | 766/3000 [40:22<1:48:52,  2.92s/it, lr: 1.0e-04 loss: 1.261e-01]hash_cache_v1:  26%|##5       | 766/3000 [40:22<1:48:52,  2.92s/it, lr: 1.0e-04 loss: 1.261e-01]hash_cache_v1:  26%|##5       | 767/3000 [40:22<2:03:38,  3.32s/it, lr: 1.0e-04 loss: 1.261e-01]hash_cache_v1:  26%|##5       | 767/3000 [40:22<2:03:38,  3.32s/it, lr: 1.0e-04 loss: 1.261e-01]hash_cache_v1:  26%|##5       | 767/3000 [40:27<2:03:38,  3.32s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  26%|##5       | 767/3000 [40:27<2:03:38,  3.32s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  26%|##5       | 768/3000 [40:27<2:16:17,  3.66s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  26%|##5       | 768/3000 [40:27<2:16:17,  3.66s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  26%|##5       | 768/3000 [40:30<2:16:17,  3.66s/it, lr: 1.0e-04 loss: 1.527e-01]hash_cache_v1:  26%|##5       | 768/3000 [40:30<2:16:17,  3.66s/it, lr: 1.0e-04 loss: 1.527e-01]hash_cache_v1:  26%|##5       | 769/3000 [40:30<2:07:43,  3.44s/it, lr: 1.0e-04 loss: 1.527e-01]hash_cache_v1:  26%|##5       | 769/3000 [40:30<2:07:43,  3.44s/it, lr: 1.0e-04 loss: 1.527e-01]hash_cache_v1:  26%|##5       | 769/3000 [40:34<2:07:43,  3.44s/it, lr: 1.0e-04 loss: 1.604e-01]hash_cache_v1:  26%|##5       | 769/3000 [40:34<2:07:43,  3.44s/it, lr: 1.0e-04 loss: 1.604e-01]hash_cache_v1:  26%|##5       | 770/3000 [40:36<2:07:40,  3.44s/it, lr: 1.0e-04 loss: 2.323e-01]hash_cache_v1:  26%|##5       | 770/3000 [40:36<2:07:40,  3.44s/it, lr: 1.0e-04 loss: 2.323e-01]hash_cache_v1:  26%|##5       | 771/3000 [40:36<1:27:13,  2.35s/it, lr: 1.0e-04 loss: 2.323e-01]hash_cache_v1:  26%|##5       | 771/3000 [40:36<1:27:13,  2.35s/it, lr: 1.0e-04 loss: 2.323e-01]hash_cache_v1:  26%|##5       | 771/3000 [40:38<1:27:13,  2.35s/it, lr: 1.0e-04 loss: 2.007e-01]hash_cache_v1:  26%|##5       | 771/3000 [40:38<1:27:13,  2.35s/it, lr: 1.0e-04 loss: 2.007e-01]hash_cache_v1:  26%|##5       | 772/3000 [40:38<1:27:24,  2.35s/it, lr: 1.0e-04 loss: 2.007e-01]hash_cache_v1:  26%|##5       | 772/3000 [40:38<1:27:24,  2.35s/it, lr: 1.0e-04 loss: 2.007e-01]hash_cache_v1:  26%|##5       | 772/3000 [40:41<1:27:24,  2.35s/it, lr: 1.0e-04 loss: 7.822e-02]hash_cache_v1:  26%|##5       | 772/3000 [40:41<1:27:24,  2.35s/it, lr: 1.0e-04 loss: 7.822e-02]hash_cache_v1:  26%|##5       | 773/3000 [40:41<1:24:58,  2.29s/it, lr: 1.0e-04 loss: 7.822e-02]hash_cache_v1:  26%|##5       | 773/3000 [40:41<1:24:58,  2.29s/it, lr: 1.0e-04 loss: 7.822e-02]hash_cache_v1:  26%|##5       | 773/3000 [40:43<1:24:58,  2.29s/it, lr: 1.0e-04 loss: 2.213e-01]hash_cache_v1:  26%|##5       | 773/3000 [40:43<1:24:58,  2.29s/it, lr: 1.0e-04 loss: 2.213e-01]hash_cache_v1:  26%|##5       | 774/3000 [40:43<1:30:47,  2.45s/it, lr: 1.0e-04 loss: 2.213e-01]hash_cache_v1:  26%|##5       | 774/3000 [40:43<1:30:47,  2.45s/it, lr: 1.0e-04 loss: 2.213e-01]hash_cache_v1:  26%|##5       | 774/3000 [40:46<1:30:47,  2.45s/it, lr: 1.0e-04 loss: 1.164e-01]hash_cache_v1:  26%|##5       | 774/3000 [40:46<1:30:47,  2.45s/it, lr: 1.0e-04 loss: 1.164e-01]hash_cache_v1:  26%|##5       | 775/3000 [40:46<1:30:08,  2.43s/it, lr: 1.0e-04 loss: 1.164e-01]hash_cache_v1:  26%|##5       | 775/3000 [40:46<1:30:08,  2.43s/it, lr: 1.0e-04 loss: 1.164e-01]hash_cache_v1:  26%|##5       | 775/3000 [40:49<1:30:08,  2.43s/it, lr: 1.0e-04 loss: 1.020e-01]hash_cache_v1:  26%|##5       | 775/3000 [40:49<1:30:08,  2.43s/it, lr: 1.0e-04 loss: 1.020e-01]hash_cache_v1:  26%|##5       | 776/3000 [40:49<1:34:51,  2.56s/it, lr: 1.0e-04 loss: 1.020e-01]hash_cache_v1:  26%|##5       | 776/3000 [40:49<1:34:51,  2.56s/it, lr: 1.0e-04 loss: 1.020e-01]hash_cache_v1:  26%|##5       | 776/3000 [40:51<1:34:51,  2.56s/it, lr: 1.0e-04 loss: 2.605e-02]hash_cache_v1:  26%|##5       | 776/3000 [40:51<1:34:51,  2.56s/it, lr: 1.0e-04 loss: 2.605e-02]hash_cache_v1:  26%|##5       | 777/3000 [40:51<1:29:56,  2.43s/it, lr: 1.0e-04 loss: 2.605e-02]hash_cache_v1:  26%|##5       | 777/3000 [40:51<1:29:56,  2.43s/it, lr: 1.0e-04 loss: 2.605e-02]hash_cache_v1:  26%|##5       | 777/3000 [40:54<1:29:56,  2.43s/it, lr: 1.0e-04 loss: 3.580e-02]hash_cache_v1:  26%|##5       | 777/3000 [40:54<1:29:56,  2.43s/it, lr: 1.0e-04 loss: 3.580e-02]hash_cache_v1:  26%|##5       | 778/3000 [40:54<1:34:48,  2.56s/it, lr: 1.0e-04 loss: 3.580e-02]hash_cache_v1:  26%|##5       | 778/3000 [40:54<1:34:48,  2.56s/it, lr: 1.0e-04 loss: 3.580e-02]hash_cache_v1:  26%|##5       | 778/3000 [40:58<1:34:48,  2.56s/it, lr: 1.0e-04 loss: 8.177e-02]hash_cache_v1:  26%|##5       | 778/3000 [40:58<1:34:48,  2.56s/it, lr: 1.0e-04 loss: 8.177e-02]hash_cache_v1:  26%|##5       | 779/3000 [40:58<1:55:56,  3.13s/it, lr: 1.0e-04 loss: 8.177e-02]hash_cache_v1:  26%|##5       | 779/3000 [40:58<1:55:56,  3.13s/it, lr: 1.0e-04 loss: 8.177e-02]hash_cache_v1:  26%|##5       | 779/3000 [41:03<1:55:56,  3.13s/it, lr: 1.0e-04 loss: 1.019e-01]hash_cache_v1:  26%|##5       | 779/3000 [41:03<1:55:56,  3.13s/it, lr: 1.0e-04 loss: 1.019e-01]hash_cache_v1:  26%|##6       | 780/3000 [41:07<1:55:53,  3.13s/it, lr: 1.0e-04 loss: 9.957e-02]hash_cache_v1:  26%|##6       | 780/3000 [41:07<1:55:53,  3.13s/it, lr: 1.0e-04 loss: 9.957e-02]hash_cache_v1:  26%|##6       | 781/3000 [41:07<1:39:27,  2.69s/it, lr: 1.0e-04 loss: 9.957e-02]hash_cache_v1:  26%|##6       | 781/3000 [41:07<1:39:27,  2.69s/it, lr: 1.0e-04 loss: 9.957e-02]hash_cache_v1:  26%|##6       | 781/3000 [41:09<1:39:27,  2.69s/it, lr: 1.0e-04 loss: 2.429e-01]hash_cache_v1:  26%|##6       | 781/3000 [41:09<1:39:27,  2.69s/it, lr: 1.0e-04 loss: 2.429e-01]hash_cache_v1:  26%|##6       | 782/3000 [41:09<1:36:31,  2.61s/it, lr: 1.0e-04 loss: 2.429e-01]hash_cache_v1:  26%|##6       | 782/3000 [41:09<1:36:31,  2.61s/it, lr: 1.0e-04 loss: 2.429e-01]hash_cache_v1:  26%|##6       | 782/3000 [41:11<1:36:31,  2.61s/it, lr: 1.0e-04 loss: 1.800e-01]hash_cache_v1:  26%|##6       | 782/3000 [41:11<1:36:31,  2.61s/it, lr: 1.0e-04 loss: 1.800e-01]hash_cache_v1:  26%|##6       | 783/3000 [41:11<1:31:36,  2.48s/it, lr: 1.0e-04 loss: 1.800e-01]hash_cache_v1:  26%|##6       | 783/3000 [41:11<1:31:36,  2.48s/it, lr: 1.0e-04 loss: 1.800e-01]hash_cache_v1:  26%|##6       | 783/3000 [41:16<1:31:36,  2.48s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  26%|##6       | 783/3000 [41:16<1:31:36,  2.48s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  26%|##6       | 784/3000 [41:16<1:50:02,  2.98s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  26%|##6       | 784/3000 [41:16<1:50:02,  2.98s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  26%|##6       | 784/3000 [41:19<1:50:02,  2.98s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  26%|##6       | 784/3000 [41:19<1:50:02,  2.98s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  26%|##6       | 785/3000 [41:19<1:48:55,  2.95s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  26%|##6       | 785/3000 [41:19<1:48:55,  2.95s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  26%|##6       | 785/3000 [41:23<1:48:55,  2.95s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  26%|##6       | 785/3000 [41:23<1:48:55,  2.95s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  26%|##6       | 786/3000 [41:23<2:04:01,  3.36s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  26%|##6       | 786/3000 [41:23<2:04:01,  3.36s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  26%|##6       | 786/3000 [41:27<2:04:01,  3.36s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  26%|##6       | 786/3000 [41:27<2:04:01,  3.36s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  26%|##6       | 787/3000 [41:27<2:14:06,  3.64s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  26%|##6       | 787/3000 [41:27<2:14:06,  3.64s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  26%|##6       | 787/3000 [41:30<2:14:06,  3.64s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  26%|##6       | 787/3000 [41:30<2:14:06,  3.64s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  26%|##6       | 788/3000 [41:30<2:05:22,  3.40s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  26%|##6       | 788/3000 [41:30<2:05:22,  3.40s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  26%|##6       | 788/3000 [41:33<2:05:22,  3.40s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  26%|##6       | 788/3000 [41:33<2:05:22,  3.40s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  26%|##6       | 789/3000 [41:33<2:01:30,  3.30s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  26%|##6       | 789/3000 [41:33<2:01:30,  3.30s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  26%|##6       | 789/3000 [41:36<2:01:30,  3.30s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  26%|##6       | 789/3000 [41:36<2:01:30,  3.30s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  26%|##6       | 790/3000 [41:38<2:01:27,  3.30s/it, lr: 1.0e-04 loss: 2.193e-01]hash_cache_v1:  26%|##6       | 790/3000 [41:38<2:01:27,  3.30s/it, lr: 1.0e-04 loss: 2.193e-01]hash_cache_v1:  26%|##6       | 791/3000 [41:38<1:23:31,  2.27s/it, lr: 1.0e-04 loss: 2.193e-01]hash_cache_v1:  26%|##6       | 791/3000 [41:38<1:23:31,  2.27s/it, lr: 1.0e-04 loss: 2.193e-01]hash_cache_v1:  26%|##6       | 791/3000 [41:40<1:23:31,  2.27s/it, lr: 1.0e-04 loss: 2.116e-01]hash_cache_v1:  26%|##6       | 791/3000 [41:40<1:23:31,  2.27s/it, lr: 1.0e-04 loss: 2.116e-01]hash_cache_v1:  26%|##6       | 792/3000 [41:40<1:21:53,  2.23s/it, lr: 1.0e-04 loss: 2.116e-01]hash_cache_v1:  26%|##6       | 792/3000 [41:40<1:21:53,  2.23s/it, lr: 1.0e-04 loss: 2.116e-01]hash_cache_v1:  26%|##6       | 792/3000 [41:45<1:21:53,  2.23s/it, lr: 1.0e-04 loss: 1.768e-01]hash_cache_v1:  26%|##6       | 792/3000 [41:45<1:21:53,  2.23s/it, lr: 1.0e-04 loss: 1.768e-01]hash_cache_v1:  26%|##6       | 793/3000 [41:45<1:42:44,  2.79s/it, lr: 1.0e-04 loss: 1.768e-01]hash_cache_v1:  26%|##6       | 793/3000 [41:45<1:42:44,  2.79s/it, lr: 1.0e-04 loss: 1.768e-01]hash_cache_v1:  26%|##6       | 793/3000 [41:49<1:42:44,  2.79s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  26%|##6       | 793/3000 [41:49<1:42:44,  2.79s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  26%|##6       | 794/3000 [41:49<1:57:43,  3.20s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  26%|##6       | 794/3000 [41:49<1:57:43,  3.20s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  26%|##6       | 794/3000 [41:53<1:57:43,  3.20s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  26%|##6       | 794/3000 [41:53<1:57:43,  3.20s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  26%|##6       | 795/3000 [41:53<2:09:17,  3.52s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  26%|##6       | 795/3000 [41:53<2:09:17,  3.52s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  26%|##6       | 795/3000 [41:55<2:09:17,  3.52s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  26%|##6       | 795/3000 [41:55<2:09:17,  3.52s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  27%|##6       | 796/3000 [41:55<1:54:15,  3.11s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  27%|##6       | 796/3000 [41:55<1:54:15,  3.11s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  27%|##6       | 796/3000 [41:58<1:54:15,  3.11s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  27%|##6       | 796/3000 [41:58<1:54:15,  3.11s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  27%|##6       | 797/3000 [41:58<1:53:10,  3.08s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  27%|##6       | 797/3000 [41:58<1:53:10,  3.08s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  27%|##6       | 797/3000 [42:03<1:53:10,  3.08s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  27%|##6       | 797/3000 [42:03<1:53:10,  3.08s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  27%|##6       | 798/3000 [42:03<2:06:40,  3.45s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  27%|##6       | 798/3000 [42:03<2:06:40,  3.45s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  27%|##6       | 798/3000 [42:07<2:06:40,  3.45s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  27%|##6       | 798/3000 [42:07<2:06:40,  3.45s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  27%|##6       | 799/3000 [42:07<2:15:01,  3.68s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  27%|##6       | 799/3000 [42:07<2:15:01,  3.68s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  27%|##6       | 799/3000 [42:10<2:15:01,  3.68s/it, lr: 1.0e-04 loss: 8.183e-02]hash_cache_v1:  27%|##6       | 799/3000 [42:10<2:15:01,  3.68s/it, lr: 1.0e-04 loss: 8.183e-02]hash_cache_v1:  27%|##6       | 800/3000 [42:13<2:14:57,  3.68s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  27%|##6       | 800/3000 [42:13<2:14:57,  3.68s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  27%|##6       | 801/3000 [42:13<1:37:13,  2.65s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  27%|##6       | 801/3000 [42:13<1:37:13,  2.65s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  27%|##6       | 801/3000 [42:16<1:37:13,  2.65s/it, lr: 1.0e-04 loss: 1.960e-01]hash_cache_v1:  27%|##6       | 801/3000 [42:16<1:37:13,  2.65s/it, lr: 1.0e-04 loss: 1.960e-01]hash_cache_v1:  27%|##6       | 802/3000 [42:16<1:39:12,  2.71s/it, lr: 1.0e-04 loss: 1.960e-01]hash_cache_v1:  27%|##6       | 802/3000 [42:16<1:39:12,  2.71s/it, lr: 1.0e-04 loss: 1.960e-01]hash_cache_v1:  27%|##6       | 802/3000 [42:20<1:39:12,  2.71s/it, lr: 1.0e-04 loss: 2.638e-02]hash_cache_v1:  27%|##6       | 802/3000 [42:20<1:39:12,  2.71s/it, lr: 1.0e-04 loss: 2.638e-02]hash_cache_v1:  27%|##6       | 803/3000 [42:20<1:54:29,  3.13s/it, lr: 1.0e-04 loss: 2.638e-02]hash_cache_v1:  27%|##6       | 803/3000 [42:20<1:54:29,  3.13s/it, lr: 1.0e-04 loss: 2.638e-02]hash_cache_v1:  27%|##6       | 803/3000 [42:24<1:54:29,  3.13s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  27%|##6       | 803/3000 [42:24<1:54:29,  3.13s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  27%|##6       | 804/3000 [42:24<2:08:12,  3.50s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  27%|##6       | 804/3000 [42:24<2:08:12,  3.50s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  27%|##6       | 804/3000 [42:27<2:08:12,  3.50s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  27%|##6       | 804/3000 [42:27<2:08:12,  3.50s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  27%|##6       | 805/3000 [42:27<1:53:42,  3.11s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  27%|##6       | 805/3000 [42:27<1:53:42,  3.11s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  27%|##6       | 805/3000 [42:29<1:53:42,  3.11s/it, lr: 1.0e-04 loss: 8.293e-02]hash_cache_v1:  27%|##6       | 805/3000 [42:29<1:53:42,  3.11s/it, lr: 1.0e-04 loss: 8.293e-02]hash_cache_v1:  27%|##6       | 806/3000 [42:29<1:43:09,  2.82s/it, lr: 1.0e-04 loss: 8.293e-02]hash_cache_v1:  27%|##6       | 806/3000 [42:29<1:43:09,  2.82s/it, lr: 1.0e-04 loss: 8.293e-02]hash_cache_v1:  27%|##6       | 806/3000 [42:33<1:43:09,  2.82s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  27%|##6       | 806/3000 [42:33<1:43:09,  2.82s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  27%|##6       | 807/3000 [42:33<2:00:33,  3.30s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  27%|##6       | 807/3000 [42:33<2:00:33,  3.30s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  27%|##6       | 807/3000 [42:36<2:00:33,  3.30s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  27%|##6       | 807/3000 [42:36<2:00:33,  3.30s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  27%|##6       | 808/3000 [42:36<1:55:37,  3.16s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  27%|##6       | 808/3000 [42:36<1:55:37,  3.16s/it, lr: 1.0e-04 loss: 1.769e-01]hash_cache_v1:  27%|##6       | 808/3000 [42:39<1:55:37,  3.16s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  27%|##6       | 808/3000 [42:39<1:55:37,  3.16s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  27%|##6       | 809/3000 [42:39<1:52:32,  3.08s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  27%|##6       | 809/3000 [42:39<1:52:32,  3.08s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  27%|##6       | 809/3000 [42:41<1:52:32,  3.08s/it, lr: 1.0e-04 loss: 1.100e-01]hash_cache_v1:  27%|##6       | 809/3000 [42:41<1:52:32,  3.08s/it, lr: 1.0e-04 loss: 1.100e-01]hash_cache_v1:  27%|##7       | 810/3000 [42:46<1:52:29,  3.08s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  27%|##7       | 810/3000 [42:46<1:52:29,  3.08s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  27%|##7       | 811/3000 [42:46<1:39:53,  2.74s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  27%|##7       | 811/3000 [42:46<1:39:53,  2.74s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  27%|##7       | 811/3000 [42:49<1:39:53,  2.74s/it, lr: 1.0e-04 loss: 4.403e-02]hash_cache_v1:  27%|##7       | 811/3000 [42:49<1:39:53,  2.74s/it, lr: 1.0e-04 loss: 4.403e-02]hash_cache_v1:  27%|##7       | 812/3000 [42:49<1:40:50,  2.77s/it, lr: 1.0e-04 loss: 4.403e-02]hash_cache_v1:  27%|##7       | 812/3000 [42:49<1:40:50,  2.77s/it, lr: 1.0e-04 loss: 4.403e-02]hash_cache_v1:  27%|##7       | 812/3000 [42:53<1:40:50,  2.77s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  27%|##7       | 812/3000 [42:53<1:40:50,  2.77s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  27%|##7       | 813/3000 [42:53<1:55:47,  3.18s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  27%|##7       | 813/3000 [42:53<1:55:47,  3.18s/it, lr: 1.0e-04 loss: 1.657e-01]hash_cache_v1:  27%|##7       | 813/3000 [42:56<1:55:47,  3.18s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  27%|##7       | 813/3000 [42:56<1:55:47,  3.18s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  27%|##7       | 814/3000 [42:56<1:54:59,  3.16s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  27%|##7       | 814/3000 [42:56<1:54:59,  3.16s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  27%|##7       | 814/3000 [42:58<1:54:59,  3.16s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  27%|##7       | 814/3000 [42:58<1:54:59,  3.16s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  27%|##7       | 815/3000 [42:58<1:44:21,  2.87s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  27%|##7       | 815/3000 [42:58<1:44:21,  2.87s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  27%|##7       | 815/3000 [43:03<1:44:21,  2.87s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  27%|##7       | 815/3000 [43:03<1:44:21,  2.87s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  27%|##7       | 816/3000 [43:03<1:58:59,  3.27s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  27%|##7       | 816/3000 [43:03<1:58:59,  3.27s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  27%|##7       | 816/3000 [43:06<1:58:59,  3.27s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  27%|##7       | 816/3000 [43:06<1:58:59,  3.27s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  27%|##7       | 817/3000 [43:06<1:54:26,  3.15s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  27%|##7       | 817/3000 [43:06<1:54:26,  3.15s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  27%|##7       | 817/3000 [43:09<1:54:26,  3.15s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  27%|##7       | 817/3000 [43:09<1:54:26,  3.15s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  27%|##7       | 818/3000 [43:09<1:53:56,  3.13s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  27%|##7       | 818/3000 [43:09<1:53:56,  3.13s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  27%|##7       | 818/3000 [43:11<1:53:56,  3.13s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  27%|##7       | 818/3000 [43:11<1:53:56,  3.13s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  27%|##7       | 819/3000 [43:11<1:43:03,  2.84s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  27%|##7       | 819/3000 [43:11<1:43:03,  2.84s/it, lr: 1.0e-04 loss: 2.507e-01]hash_cache_v1:  27%|##7       | 819/3000 [43:15<1:43:03,  2.84s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  27%|##7       | 819/3000 [43:15<1:43:03,  2.84s/it, lr: 1.0e-04 loss: 1.756e-01]hash_cache_v1:  27%|##7       | 820/3000 [43:17<1:43:00,  2.84s/it, lr: 1.0e-04 loss: 1.205e-01]hash_cache_v1:  27%|##7       | 820/3000 [43:17<1:43:00,  2.84s/it, lr: 1.0e-04 loss: 1.205e-01]hash_cache_v1:  27%|##7       | 821/3000 [43:17<1:13:14,  2.02s/it, lr: 1.0e-04 loss: 1.205e-01]hash_cache_v1:  27%|##7       | 821/3000 [43:17<1:13:14,  2.02s/it, lr: 1.0e-04 loss: 1.205e-01]hash_cache_v1:  27%|##7       | 821/3000 [43:20<1:13:14,  2.02s/it, lr: 1.0e-04 loss: 7.232e-02]hash_cache_v1:  27%|##7       | 821/3000 [43:20<1:13:14,  2.02s/it, lr: 1.0e-04 loss: 7.232e-02]hash_cache_v1:  27%|##7       | 822/3000 [43:20<1:16:14,  2.10s/it, lr: 1.0e-04 loss: 7.232e-02]hash_cache_v1:  27%|##7       | 822/3000 [43:20<1:16:14,  2.10s/it, lr: 1.0e-04 loss: 7.232e-02]hash_cache_v1:  27%|##7       | 822/3000 [43:24<1:16:14,  2.10s/it, lr: 1.0e-04 loss: 1.570e-01]hash_cache_v1:  27%|##7       | 822/3000 [43:24<1:16:14,  2.10s/it, lr: 1.0e-04 loss: 1.570e-01]hash_cache_v1:  27%|##7       | 823/3000 [43:24<1:37:14,  2.68s/it, lr: 1.0e-04 loss: 1.570e-01]hash_cache_v1:  27%|##7       | 823/3000 [43:24<1:37:14,  2.68s/it, lr: 1.0e-04 loss: 1.570e-01]hash_cache_v1:  27%|##7       | 823/3000 [43:27<1:37:14,  2.68s/it, lr: 1.0e-04 loss: 1.725e-01]hash_cache_v1:  27%|##7       | 823/3000 [43:27<1:37:14,  2.68s/it, lr: 1.0e-04 loss: 1.725e-01]hash_cache_v1:  27%|##7       | 824/3000 [43:27<1:39:01,  2.73s/it, lr: 1.0e-04 loss: 1.725e-01]hash_cache_v1:  27%|##7       | 824/3000 [43:27<1:39:01,  2.73s/it, lr: 1.0e-04 loss: 1.725e-01]hash_cache_v1:  27%|##7       | 824/3000 [43:29<1:39:01,  2.73s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  27%|##7       | 824/3000 [43:29<1:39:01,  2.73s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  28%|##7       | 825/3000 [43:29<1:35:21,  2.63s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  28%|##7       | 825/3000 [43:29<1:35:21,  2.63s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  28%|##7       | 825/3000 [43:31<1:35:21,  2.63s/it, lr: 1.0e-04 loss: 2.037e-02]hash_cache_v1:  28%|##7       | 825/3000 [43:31<1:35:21,  2.63s/it, lr: 1.0e-04 loss: 2.037e-02]hash_cache_v1:  28%|##7       | 826/3000 [43:31<1:29:33,  2.47s/it, lr: 1.0e-04 loss: 2.037e-02]hash_cache_v1:  28%|##7       | 826/3000 [43:31<1:29:33,  2.47s/it, lr: 1.0e-04 loss: 2.037e-02]hash_cache_v1:  28%|##7       | 826/3000 [43:34<1:29:33,  2.47s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  28%|##7       | 826/3000 [43:34<1:29:33,  2.47s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  28%|##7       | 827/3000 [43:34<1:33:21,  2.58s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  28%|##7       | 827/3000 [43:34<1:33:21,  2.58s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  28%|##7       | 827/3000 [43:38<1:33:21,  2.58s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  28%|##7       | 827/3000 [43:38<1:33:21,  2.58s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  28%|##7       | 828/3000 [43:38<1:51:49,  3.09s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  28%|##7       | 828/3000 [43:38<1:51:49,  3.09s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  28%|##7       | 828/3000 [43:41<1:51:49,  3.09s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  28%|##7       | 828/3000 [43:41<1:51:49,  3.09s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  28%|##7       | 829/3000 [43:41<1:43:55,  2.87s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  28%|##7       | 829/3000 [43:41<1:43:55,  2.87s/it, lr: 1.0e-04 loss: 2.198e-01]hash_cache_v1:  28%|##7       | 829/3000 [43:43<1:43:55,  2.87s/it, lr: 1.0e-04 loss: 9.916e-02]hash_cache_v1:  28%|##7       | 829/3000 [43:43<1:43:55,  2.87s/it, lr: 1.0e-04 loss: 9.916e-02]hash_cache_v1:  28%|##7       | 830/3000 [43:46<1:43:52,  2.87s/it, lr: 1.0e-04 loss: 1.672e-01]hash_cache_v1:  28%|##7       | 830/3000 [43:46<1:43:52,  2.87s/it, lr: 1.0e-04 loss: 1.672e-01]hash_cache_v1:  28%|##7       | 831/3000 [43:46<1:20:14,  2.22s/it, lr: 1.0e-04 loss: 1.672e-01]hash_cache_v1:  28%|##7       | 831/3000 [43:46<1:20:14,  2.22s/it, lr: 1.0e-04 loss: 1.672e-01]hash_cache_v1:  28%|##7       | 831/3000 [43:48<1:20:14,  2.22s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:  28%|##7       | 831/3000 [43:48<1:20:14,  2.22s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:  28%|##7       | 832/3000 [43:48<1:21:44,  2.26s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:  28%|##7       | 832/3000 [43:48<1:21:44,  2.26s/it, lr: 1.0e-04 loss: 2.797e-01]hash_cache_v1:  28%|##7       | 832/3000 [43:50<1:21:44,  2.26s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  28%|##7       | 832/3000 [43:50<1:21:44,  2.26s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  28%|##7       | 833/3000 [43:50<1:20:16,  2.22s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  28%|##7       | 833/3000 [43:50<1:20:16,  2.22s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  28%|##7       | 833/3000 [43:52<1:20:16,  2.22s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  28%|##7       | 833/3000 [43:52<1:20:16,  2.22s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  28%|##7       | 834/3000 [43:52<1:19:09,  2.19s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  28%|##7       | 834/3000 [43:52<1:19:09,  2.19s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  28%|##7       | 834/3000 [43:54<1:19:09,  2.19s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  28%|##7       | 834/3000 [43:54<1:19:09,  2.19s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  28%|##7       | 835/3000 [43:54<1:18:27,  2.17s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  28%|##7       | 835/3000 [43:54<1:18:27,  2.17s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  28%|##7       | 835/3000 [43:59<1:18:27,  2.17s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  28%|##7       | 835/3000 [43:59<1:18:27,  2.17s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  28%|##7       | 836/3000 [43:59<1:42:37,  2.85s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  28%|##7       | 836/3000 [43:59<1:42:37,  2.85s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  28%|##7       | 836/3000 [44:03<1:42:37,  2.85s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  28%|##7       | 836/3000 [44:03<1:42:37,  2.85s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  28%|##7       | 837/3000 [44:03<1:57:50,  3.27s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  28%|##7       | 837/3000 [44:03<1:57:50,  3.27s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  28%|##7       | 837/3000 [44:05<1:57:50,  3.27s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  28%|##7       | 837/3000 [44:05<1:57:50,  3.27s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  28%|##7       | 838/3000 [44:05<1:45:20,  2.92s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  28%|##7       | 838/3000 [44:05<1:45:20,  2.92s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  28%|##7       | 838/3000 [44:08<1:45:20,  2.92s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  28%|##7       | 838/3000 [44:08<1:45:20,  2.92s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  28%|##7       | 839/3000 [44:08<1:45:39,  2.93s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  28%|##7       | 839/3000 [44:08<1:45:39,  2.93s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  28%|##7       | 839/3000 [44:10<1:45:39,  2.93s/it, lr: 1.0e-04 loss: 2.084e-01]hash_cache_v1:  28%|##7       | 839/3000 [44:10<1:45:39,  2.93s/it, lr: 1.0e-04 loss: 2.084e-01]hash_cache_v1:  28%|##8       | 840/3000 [44:13<1:45:36,  2.93s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  28%|##8       | 840/3000 [44:13<1:45:36,  2.93s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  28%|##8       | 841/3000 [44:13<1:20:55,  2.25s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  28%|##8       | 841/3000 [44:13<1:20:55,  2.25s/it, lr: 1.0e-04 loss: 1.685e-01]hash_cache_v1:  28%|##8       | 841/3000 [44:18<1:20:55,  2.25s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  28%|##8       | 841/3000 [44:18<1:20:55,  2.25s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  28%|##8       | 842/3000 [44:18<1:38:11,  2.73s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  28%|##8       | 842/3000 [44:18<1:38:11,  2.73s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  28%|##8       | 842/3000 [44:20<1:38:11,  2.73s/it, lr: 1.0e-04 loss: 2.291e-01]hash_cache_v1:  28%|##8       | 842/3000 [44:20<1:38:11,  2.73s/it, lr: 1.0e-04 loss: 2.291e-01]hash_cache_v1:  28%|##8       | 843/3000 [44:20<1:34:56,  2.64s/it, lr: 1.0e-04 loss: 2.291e-01]hash_cache_v1:  28%|##8       | 843/3000 [44:20<1:34:56,  2.64s/it, lr: 1.0e-04 loss: 2.291e-01]hash_cache_v1:  28%|##8       | 843/3000 [44:23<1:34:56,  2.64s/it, lr: 1.0e-04 loss: 1.567e-01]hash_cache_v1:  28%|##8       | 843/3000 [44:23<1:34:56,  2.64s/it, lr: 1.0e-04 loss: 1.567e-01]hash_cache_v1:  28%|##8       | 844/3000 [44:23<1:36:52,  2.70s/it, lr: 1.0e-04 loss: 1.567e-01]hash_cache_v1:  28%|##8       | 844/3000 [44:23<1:36:52,  2.70s/it, lr: 1.0e-04 loss: 1.567e-01]hash_cache_v1:  28%|##8       | 844/3000 [44:26<1:36:52,  2.70s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  28%|##8       | 844/3000 [44:26<1:36:52,  2.70s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  28%|##8       | 845/3000 [44:26<1:38:14,  2.74s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  28%|##8       | 845/3000 [44:26<1:38:14,  2.74s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  28%|##8       | 845/3000 [44:28<1:38:14,  2.74s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:  28%|##8       | 845/3000 [44:28<1:38:14,  2.74s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:  28%|##8       | 846/3000 [44:28<1:34:46,  2.64s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:  28%|##8       | 846/3000 [44:28<1:34:46,  2.64s/it, lr: 1.0e-04 loss: 2.287e-01]hash_cache_v1:  28%|##8       | 846/3000 [44:32<1:34:46,  2.64s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  28%|##8       | 846/3000 [44:32<1:34:46,  2.64s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  28%|##8       | 847/3000 [44:32<1:52:06,  3.12s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  28%|##8       | 847/3000 [44:32<1:52:06,  3.12s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  28%|##8       | 847/3000 [44:35<1:52:06,  3.12s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  28%|##8       | 847/3000 [44:35<1:52:06,  3.12s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  28%|##8       | 848/3000 [44:35<1:49:38,  3.06s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  28%|##8       | 848/3000 [44:35<1:49:38,  3.06s/it, lr: 1.0e-04 loss: 6.198e-02]hash_cache_v1:  28%|##8       | 848/3000 [44:38<1:49:38,  3.06s/it, lr: 1.0e-04 loss: 9.163e-02]hash_cache_v1:  28%|##8       | 848/3000 [44:38<1:49:38,  3.06s/it, lr: 1.0e-04 loss: 9.163e-02]hash_cache_v1:  28%|##8       | 849/3000 [44:38<1:47:33,  3.00s/it, lr: 1.0e-04 loss: 9.163e-02]hash_cache_v1:  28%|##8       | 849/3000 [44:38<1:47:33,  3.00s/it, lr: 1.0e-04 loss: 9.163e-02]hash_cache_v1:  28%|##8       | 849/3000 [44:43<1:47:33,  3.00s/it, lr: 1.0e-04 loss: 5.546e-04]hash_cache_v1:  28%|##8       | 849/3000 [44:43<1:47:33,  3.00s/it, lr: 1.0e-04 loss: 5.546e-04]hash_cache_v1:  28%|##8       | 850/3000 [44:47<1:47:30,  3.00s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  28%|##8       | 850/3000 [44:47<1:47:30,  3.00s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  28%|##8       | 851/3000 [44:47<1:33:41,  2.62s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  28%|##8       | 851/3000 [44:47<1:33:41,  2.62s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  28%|##8       | 851/3000 [44:50<1:33:41,  2.62s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:  28%|##8       | 851/3000 [44:50<1:33:41,  2.62s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:  28%|##8       | 852/3000 [44:50<1:35:39,  2.67s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:  28%|##8       | 852/3000 [44:50<1:35:39,  2.67s/it, lr: 1.0e-04 loss: 1.297e-01]hash_cache_v1:  28%|##8       | 852/3000 [44:54<1:35:39,  2.67s/it, lr: 1.0e-04 loss: 7.282e-02]hash_cache_v1:  28%|##8       | 852/3000 [44:54<1:35:39,  2.67s/it, lr: 1.0e-04 loss: 7.282e-02]hash_cache_v1:  28%|##8       | 853/3000 [44:54<1:52:39,  3.15s/it, lr: 1.0e-04 loss: 7.282e-02]hash_cache_v1:  28%|##8       | 853/3000 [44:54<1:52:39,  3.15s/it, lr: 1.0e-04 loss: 7.282e-02]hash_cache_v1:  28%|##8       | 853/3000 [44:57<1:52:39,  3.15s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  28%|##8       | 853/3000 [44:57<1:52:39,  3.15s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  28%|##8       | 854/3000 [44:57<1:49:59,  3.08s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  28%|##8       | 854/3000 [44:57<1:49:59,  3.08s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  28%|##8       | 854/3000 [45:01<1:49:59,  3.08s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  28%|##8       | 854/3000 [45:01<1:49:59,  3.08s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  28%|##8       | 855/3000 [45:01<2:02:19,  3.42s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  28%|##8       | 855/3000 [45:01<2:02:19,  3.42s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  28%|##8       | 855/3000 [45:04<2:02:19,  3.42s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  28%|##8       | 855/3000 [45:04<2:02:19,  3.42s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  29%|##8       | 856/3000 [45:04<1:56:28,  3.26s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  29%|##8       | 856/3000 [45:04<1:56:28,  3.26s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  29%|##8       | 856/3000 [45:09<1:56:28,  3.26s/it, lr: 1.0e-04 loss: 4.566e-02]hash_cache_v1:  29%|##8       | 856/3000 [45:09<1:56:28,  3.26s/it, lr: 1.0e-04 loss: 4.566e-02]hash_cache_v1:  29%|##8       | 857/3000 [45:09<2:08:56,  3.61s/it, lr: 1.0e-04 loss: 4.566e-02]hash_cache_v1:  29%|##8       | 857/3000 [45:09<2:08:56,  3.61s/it, lr: 1.0e-04 loss: 4.566e-02]hash_cache_v1:  29%|##8       | 857/3000 [45:13<2:08:56,  3.61s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  29%|##8       | 857/3000 [45:13<2:08:56,  3.61s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  29%|##8       | 858/3000 [45:13<2:16:04,  3.81s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  29%|##8       | 858/3000 [45:13<2:16:04,  3.81s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  29%|##8       | 858/3000 [45:17<2:16:04,  3.81s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  29%|##8       | 858/3000 [45:17<2:16:04,  3.81s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  29%|##8       | 859/3000 [45:17<2:21:17,  3.96s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  29%|##8       | 859/3000 [45:17<2:21:17,  3.96s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  29%|##8       | 859/3000 [45:20<2:21:17,  3.96s/it, lr: 1.0e-04 loss: 1.815e-01]hash_cache_v1:  29%|##8       | 859/3000 [45:20<2:21:17,  3.96s/it, lr: 1.0e-04 loss: 1.815e-01]hash_cache_v1:  29%|##8       | 860/3000 [45:23<2:21:13,  3.96s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  29%|##8       | 860/3000 [45:23<2:21:13,  3.96s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  29%|##8       | 861/3000 [45:23<1:40:09,  2.81s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  29%|##8       | 861/3000 [45:23<1:40:09,  2.81s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  29%|##8       | 861/3000 [45:25<1:40:09,  2.81s/it, lr: 1.0e-04 loss: 2.389e-01]hash_cache_v1:  29%|##8       | 861/3000 [45:25<1:40:09,  2.81s/it, lr: 1.0e-04 loss: 2.389e-01]hash_cache_v1:  29%|##8       | 862/3000 [45:25<1:34:01,  2.64s/it, lr: 1.0e-04 loss: 2.389e-01]hash_cache_v1:  29%|##8       | 862/3000 [45:25<1:34:01,  2.64s/it, lr: 1.0e-04 loss: 2.389e-01]hash_cache_v1:  29%|##8       | 862/3000 [45:27<1:34:01,  2.64s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  29%|##8       | 862/3000 [45:27<1:34:01,  2.64s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  29%|##8       | 863/3000 [45:27<1:29:04,  2.50s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  29%|##8       | 863/3000 [45:27<1:29:04,  2.50s/it, lr: 1.0e-04 loss: 1.979e-01]hash_cache_v1:  29%|##8       | 863/3000 [45:31<1:29:04,  2.50s/it, lr: 1.0e-04 loss: 8.374e-02]hash_cache_v1:  29%|##8       | 863/3000 [45:31<1:29:04,  2.50s/it, lr: 1.0e-04 loss: 8.374e-02]hash_cache_v1:  29%|##8       | 864/3000 [45:31<1:48:11,  3.04s/it, lr: 1.0e-04 loss: 8.374e-02]hash_cache_v1:  29%|##8       | 864/3000 [45:31<1:48:11,  3.04s/it, lr: 1.0e-04 loss: 8.374e-02]hash_cache_v1:  29%|##8       | 864/3000 [45:34<1:48:11,  3.04s/it, lr: 1.0e-04 loss: 2.161e-01]hash_cache_v1:  29%|##8       | 864/3000 [45:34<1:48:11,  3.04s/it, lr: 1.0e-04 loss: 2.161e-01]hash_cache_v1:  29%|##8       | 865/3000 [45:34<1:46:29,  2.99s/it, lr: 1.0e-04 loss: 2.161e-01]hash_cache_v1:  29%|##8       | 865/3000 [45:34<1:46:29,  2.99s/it, lr: 1.0e-04 loss: 2.161e-01]hash_cache_v1:  29%|##8       | 865/3000 [45:36<1:46:29,  2.99s/it, lr: 1.0e-04 loss: 2.569e-01]hash_cache_v1:  29%|##8       | 865/3000 [45:36<1:46:29,  2.99s/it, lr: 1.0e-04 loss: 2.569e-01]hash_cache_v1:  29%|##8       | 866/3000 [45:36<1:37:25,  2.74s/it, lr: 1.0e-04 loss: 2.569e-01]hash_cache_v1:  29%|##8       | 866/3000 [45:36<1:37:25,  2.74s/it, lr: 1.0e-04 loss: 2.569e-01]hash_cache_v1:  29%|##8       | 866/3000 [45:39<1:37:25,  2.74s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  29%|##8       | 866/3000 [45:39<1:37:25,  2.74s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  29%|##8       | 867/3000 [45:39<1:38:49,  2.78s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  29%|##8       | 867/3000 [45:39<1:38:49,  2.78s/it, lr: 1.0e-04 loss: 1.087e-01]hash_cache_v1:  29%|##8       | 867/3000 [45:42<1:38:49,  2.78s/it, lr: 1.0e-04 loss: 1.859e-01]hash_cache_v1:  29%|##8       | 867/3000 [45:42<1:38:49,  2.78s/it, lr: 1.0e-04 loss: 1.859e-01]hash_cache_v1:  29%|##8       | 868/3000 [45:42<1:34:24,  2.66s/it, lr: 1.0e-04 loss: 1.859e-01]hash_cache_v1:  29%|##8       | 868/3000 [45:42<1:34:24,  2.66s/it, lr: 1.0e-04 loss: 1.859e-01]hash_cache_v1:  29%|##8       | 868/3000 [45:46<1:34:24,  2.66s/it, lr: 1.0e-04 loss: 1.617e-01]hash_cache_v1:  29%|##8       | 868/3000 [45:46<1:34:24,  2.66s/it, lr: 1.0e-04 loss: 1.617e-01]hash_cache_v1:  29%|##8       | 869/3000 [45:46<1:51:47,  3.15s/it, lr: 1.0e-04 loss: 1.617e-01]hash_cache_v1:  29%|##8       | 869/3000 [45:46<1:51:47,  3.15s/it, lr: 1.0e-04 loss: 1.617e-01]hash_cache_v1:  29%|##8       | 869/3000 [45:49<1:51:47,  3.15s/it, lr: 1.0e-04 loss: 8.101e-02]hash_cache_v1:  29%|##8       | 869/3000 [45:49<1:51:47,  3.15s/it, lr: 1.0e-04 loss: 8.101e-02]hash_cache_v1:  29%|##9       | 870/3000 [45:52<1:51:44,  3.15s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  29%|##9       | 870/3000 [45:52<1:51:44,  3.15s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  29%|##9       | 871/3000 [45:52<1:25:30,  2.41s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  29%|##9       | 871/3000 [45:52<1:25:30,  2.41s/it, lr: 1.0e-04 loss: 1.720e-01]hash_cache_v1:  29%|##9       | 871/3000 [45:56<1:25:30,  2.41s/it, lr: 1.0e-04 loss: 9.251e-02]hash_cache_v1:  29%|##9       | 871/3000 [45:56<1:25:30,  2.41s/it, lr: 1.0e-04 loss: 9.251e-02]hash_cache_v1:  29%|##9       | 872/3000 [45:56<1:42:26,  2.89s/it, lr: 1.0e-04 loss: 9.251e-02]hash_cache_v1:  29%|##9       | 872/3000 [45:56<1:42:26,  2.89s/it, lr: 1.0e-04 loss: 9.251e-02]hash_cache_v1:  29%|##9       | 872/3000 [45:58<1:42:26,  2.89s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  29%|##9       | 872/3000 [45:58<1:42:26,  2.89s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  29%|##9       | 873/3000 [45:58<1:35:09,  2.68s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  29%|##9       | 873/3000 [45:58<1:35:09,  2.68s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  29%|##9       | 873/3000 [46:01<1:35:09,  2.68s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  29%|##9       | 873/3000 [46:01<1:35:09,  2.68s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  29%|##9       | 874/3000 [46:01<1:36:55,  2.74s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  29%|##9       | 874/3000 [46:01<1:36:55,  2.74s/it, lr: 1.0e-04 loss: 1.515e-01]hash_cache_v1:  29%|##9       | 874/3000 [46:04<1:36:55,  2.74s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  29%|##9       | 874/3000 [46:04<1:36:55,  2.74s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  29%|##9       | 875/3000 [46:04<1:40:29,  2.84s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  29%|##9       | 875/3000 [46:04<1:40:29,  2.84s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  29%|##9       | 875/3000 [46:09<1:40:29,  2.84s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  29%|##9       | 875/3000 [46:09<1:40:29,  2.84s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  29%|##9       | 876/3000 [46:09<1:55:21,  3.26s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  29%|##9       | 876/3000 [46:09<1:55:21,  3.26s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  29%|##9       | 876/3000 [46:11<1:55:21,  3.26s/it, lr: 1.0e-04 loss: 8.308e-02]hash_cache_v1:  29%|##9       | 876/3000 [46:11<1:55:21,  3.26s/it, lr: 1.0e-04 loss: 8.308e-02]hash_cache_v1:  29%|##9       | 877/3000 [46:11<1:51:17,  3.15s/it, lr: 1.0e-04 loss: 8.308e-02]hash_cache_v1:  29%|##9       | 877/3000 [46:11<1:51:17,  3.15s/it, lr: 1.0e-04 loss: 8.308e-02]hash_cache_v1:  29%|##9       | 877/3000 [46:14<1:51:17,  3.15s/it, lr: 1.0e-04 loss: 1.753e-01]hash_cache_v1:  29%|##9       | 877/3000 [46:14<1:51:17,  3.15s/it, lr: 1.0e-04 loss: 1.753e-01]hash_cache_v1:  29%|##9       | 878/3000 [46:14<1:43:23,  2.92s/it, lr: 1.0e-04 loss: 1.753e-01]hash_cache_v1:  29%|##9       | 878/3000 [46:14<1:43:23,  2.92s/it, lr: 1.0e-04 loss: 1.753e-01]hash_cache_v1:  29%|##9       | 878/3000 [46:16<1:43:23,  2.92s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  29%|##9       | 878/3000 [46:16<1:43:23,  2.92s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  29%|##9       | 879/3000 [46:16<1:34:53,  2.68s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  29%|##9       | 879/3000 [46:16<1:34:53,  2.68s/it, lr: 1.0e-04 loss: 2.318e-01]hash_cache_v1:  29%|##9       | 879/3000 [46:18<1:34:53,  2.68s/it, lr: 1.0e-04 loss: 2.190e-01]hash_cache_v1:  29%|##9       | 879/3000 [46:18<1:34:53,  2.68s/it, lr: 1.0e-04 loss: 2.190e-01]hash_cache_v1:  29%|##9       | 880/3000 [46:22<1:34:51,  2.68s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  29%|##9       | 880/3000 [46:22<1:34:51,  2.68s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  29%|##9       | 881/3000 [46:22<1:26:00,  2.44s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  29%|##9       | 881/3000 [46:22<1:26:00,  2.44s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  29%|##9       | 881/3000 [46:27<1:26:00,  2.44s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  29%|##9       | 881/3000 [46:27<1:26:00,  2.44s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  29%|##9       | 882/3000 [46:27<1:43:36,  2.93s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  29%|##9       | 882/3000 [46:27<1:43:36,  2.93s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  29%|##9       | 882/3000 [46:30<1:43:36,  2.93s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  29%|##9       | 882/3000 [46:30<1:43:36,  2.93s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  29%|##9       | 883/3000 [46:30<1:43:18,  2.93s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  29%|##9       | 883/3000 [46:30<1:43:18,  2.93s/it, lr: 1.0e-04 loss: 1.339e-01]hash_cache_v1:  29%|##9       | 883/3000 [46:32<1:43:18,  2.93s/it, lr: 1.0e-04 loss: 1.106e-01]hash_cache_v1:  29%|##9       | 883/3000 [46:32<1:43:18,  2.93s/it, lr: 1.0e-04 loss: 1.106e-01]hash_cache_v1:  29%|##9       | 884/3000 [46:32<1:35:09,  2.70s/it, lr: 1.0e-04 loss: 1.106e-01]hash_cache_v1:  29%|##9       | 884/3000 [46:32<1:35:09,  2.70s/it, lr: 1.0e-04 loss: 1.106e-01]hash_cache_v1:  29%|##9       | 884/3000 [46:35<1:35:09,  2.70s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  29%|##9       | 884/3000 [46:35<1:35:09,  2.70s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  30%|##9       | 885/3000 [46:35<1:38:50,  2.80s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  30%|##9       | 885/3000 [46:35<1:38:50,  2.80s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  30%|##9       | 885/3000 [46:39<1:38:50,  2.80s/it, lr: 1.0e-04 loss: 6.767e-02]hash_cache_v1:  30%|##9       | 885/3000 [46:39<1:38:50,  2.80s/it, lr: 1.0e-04 loss: 6.767e-02]hash_cache_v1:  30%|##9       | 886/3000 [46:39<1:53:53,  3.23s/it, lr: 1.0e-04 loss: 6.767e-02]hash_cache_v1:  30%|##9       | 886/3000 [46:39<1:53:53,  3.23s/it, lr: 1.0e-04 loss: 6.767e-02]hash_cache_v1:  30%|##9       | 886/3000 [46:41<1:53:53,  3.23s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  30%|##9       | 886/3000 [46:41<1:53:53,  3.23s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  30%|##9       | 887/3000 [46:41<1:42:29,  2.91s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  30%|##9       | 887/3000 [46:41<1:42:29,  2.91s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  30%|##9       | 887/3000 [46:46<1:42:29,  2.91s/it, lr: 1.0e-04 loss: 3.604e-02]hash_cache_v1:  30%|##9       | 887/3000 [46:46<1:42:29,  2.91s/it, lr: 1.0e-04 loss: 3.604e-02]hash_cache_v1:  30%|##9       | 888/3000 [46:46<1:56:49,  3.32s/it, lr: 1.0e-04 loss: 3.604e-02]hash_cache_v1:  30%|##9       | 888/3000 [46:46<1:56:49,  3.32s/it, lr: 1.0e-04 loss: 3.604e-02]hash_cache_v1:  30%|##9       | 888/3000 [46:49<1:56:49,  3.32s/it, lr: 1.0e-04 loss: 1.953e-01]hash_cache_v1:  30%|##9       | 888/3000 [46:49<1:56:49,  3.32s/it, lr: 1.0e-04 loss: 1.953e-01]hash_cache_v1:  30%|##9       | 889/3000 [46:49<1:54:21,  3.25s/it, lr: 1.0e-04 loss: 1.953e-01]hash_cache_v1:  30%|##9       | 889/3000 [46:49<1:54:21,  3.25s/it, lr: 1.0e-04 loss: 1.953e-01]hash_cache_v1:  30%|##9       | 889/3000 [46:51<1:54:21,  3.25s/it, lr: 1.0e-04 loss: 2.754e-01]hash_cache_v1:  30%|##9       | 889/3000 [46:51<1:54:21,  3.25s/it, lr: 1.0e-04 loss: 2.754e-01]hash_cache_v1:  30%|##9       | 890/3000 [46:55<1:54:18,  3.25s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  30%|##9       | 890/3000 [46:55<1:54:18,  3.25s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  30%|##9       | 891/3000 [46:55<1:36:50,  2.76s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  30%|##9       | 891/3000 [46:55<1:36:50,  2.76s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  30%|##9       | 891/3000 [46:59<1:36:50,  2.76s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  30%|##9       | 891/3000 [46:59<1:36:50,  2.76s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  30%|##9       | 892/3000 [46:59<1:50:40,  3.15s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  30%|##9       | 892/3000 [46:59<1:50:40,  3.15s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  30%|##9       | 892/3000 [47:04<1:50:40,  3.15s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  30%|##9       | 892/3000 [47:04<1:50:40,  3.15s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  30%|##9       | 893/3000 [47:04<2:03:26,  3.52s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  30%|##9       | 893/3000 [47:04<2:03:26,  3.52s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  30%|##9       | 893/3000 [47:07<2:03:26,  3.52s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  30%|##9       | 893/3000 [47:07<2:03:26,  3.52s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  30%|##9       | 894/3000 [47:07<1:57:22,  3.34s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  30%|##9       | 894/3000 [47:07<1:57:22,  3.34s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  30%|##9       | 894/3000 [47:11<1:57:22,  3.34s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  30%|##9       | 894/3000 [47:11<1:57:22,  3.34s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  30%|##9       | 895/3000 [47:11<2:06:55,  3.62s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  30%|##9       | 895/3000 [47:11<2:06:55,  3.62s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  30%|##9       | 895/3000 [47:16<2:06:55,  3.62s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  30%|##9       | 895/3000 [47:16<2:06:55,  3.62s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  30%|##9       | 896/3000 [47:16<2:15:24,  3.86s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  30%|##9       | 896/3000 [47:16<2:15:24,  3.86s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  30%|##9       | 896/3000 [47:19<2:15:24,  3.86s/it, lr: 1.0e-04 loss: 6.481e-02]hash_cache_v1:  30%|##9       | 896/3000 [47:19<2:15:24,  3.86s/it, lr: 1.0e-04 loss: 6.481e-02]hash_cache_v1:  30%|##9       | 897/3000 [47:19<2:05:25,  3.58s/it, lr: 1.0e-04 loss: 6.481e-02]hash_cache_v1:  30%|##9       | 897/3000 [47:19<2:05:25,  3.58s/it, lr: 1.0e-04 loss: 6.481e-02]hash_cache_v1:  30%|##9       | 897/3000 [47:21<2:05:25,  3.58s/it, lr: 1.0e-04 loss: 1.935e-01]hash_cache_v1:  30%|##9       | 897/3000 [47:21<2:05:25,  3.58s/it, lr: 1.0e-04 loss: 1.935e-01]hash_cache_v1:  30%|##9       | 898/3000 [47:21<1:56:57,  3.34s/it, lr: 1.0e-04 loss: 1.935e-01]hash_cache_v1:  30%|##9       | 898/3000 [47:21<1:56:57,  3.34s/it, lr: 1.0e-04 loss: 1.935e-01]hash_cache_v1:  30%|##9       | 898/3000 [47:23<1:56:57,  3.34s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  30%|##9       | 898/3000 [47:23<1:56:57,  3.34s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  30%|##9       | 899/3000 [47:23<1:44:18,  2.98s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  30%|##9       | 899/3000 [47:23<1:44:18,  2.98s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  30%|##9       | 899/3000 [47:26<1:44:18,  2.98s/it, lr: 1.0e-04 loss: 6.664e-02]hash_cache_v1:  30%|##9       | 899/3000 [47:26<1:44:18,  2.98s/it, lr: 1.0e-04 loss: 6.664e-02]hash_cache_v1:  30%|###       | 900/3000 [47:29<1:44:15,  2.98s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  30%|###       | 900/3000 [47:29<1:44:15,  2.98s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  30%|###       | 901/3000 [47:29<1:19:41,  2.28s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  30%|###       | 901/3000 [47:29<1:19:41,  2.28s/it, lr: 1.0e-04 loss: 2.034e-01]hash_cache_v1:  30%|###       | 901/3000 [47:32<1:19:41,  2.28s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  30%|###       | 901/3000 [47:32<1:19:41,  2.28s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  30%|###       | 902/3000 [47:32<1:24:49,  2.43s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  30%|###       | 902/3000 [47:32<1:24:49,  2.43s/it, lr: 1.0e-04 loss: 1.150e-01]hash_cache_v1:  30%|###       | 902/3000 [47:35<1:24:49,  2.43s/it, lr: 1.0e-04 loss: 8.733e-02]hash_cache_v1:  30%|###       | 902/3000 [47:35<1:24:49,  2.43s/it, lr: 1.0e-04 loss: 8.733e-02]hash_cache_v1:  30%|###       | 903/3000 [47:35<1:30:31,  2.59s/it, lr: 1.0e-04 loss: 8.733e-02]hash_cache_v1:  30%|###       | 903/3000 [47:35<1:30:31,  2.59s/it, lr: 1.0e-04 loss: 8.733e-02]hash_cache_v1:  30%|###       | 903/3000 [47:38<1:30:31,  2.59s/it, lr: 1.0e-04 loss: 1.744e-01]hash_cache_v1:  30%|###       | 903/3000 [47:38<1:30:31,  2.59s/it, lr: 1.0e-04 loss: 1.744e-01]hash_cache_v1:  30%|###       | 904/3000 [47:38<1:33:07,  2.67s/it, lr: 1.0e-04 loss: 1.744e-01]hash_cache_v1:  30%|###       | 904/3000 [47:38<1:33:07,  2.67s/it, lr: 1.0e-04 loss: 1.744e-01]hash_cache_v1:  30%|###       | 904/3000 [47:42<1:33:07,  2.67s/it, lr: 1.0e-04 loss: 1.612e-01]hash_cache_v1:  30%|###       | 904/3000 [47:42<1:33:07,  2.67s/it, lr: 1.0e-04 loss: 1.612e-01]hash_cache_v1:  30%|###       | 905/3000 [47:42<1:49:09,  3.13s/it, lr: 1.0e-04 loss: 1.612e-01]hash_cache_v1:  30%|###       | 905/3000 [47:42<1:49:09,  3.13s/it, lr: 1.0e-04 loss: 1.612e-01]hash_cache_v1:  30%|###       | 905/3000 [47:44<1:49:09,  3.13s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:  30%|###       | 905/3000 [47:44<1:49:09,  3.13s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:  30%|###       | 906/3000 [47:44<1:39:07,  2.84s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:  30%|###       | 906/3000 [47:44<1:39:07,  2.84s/it, lr: 1.0e-04 loss: 2.447e-01]hash_cache_v1:  30%|###       | 906/3000 [47:49<1:39:07,  2.84s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  30%|###       | 906/3000 [47:49<1:39:07,  2.84s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  30%|###       | 907/3000 [47:49<1:55:48,  3.32s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  30%|###       | 907/3000 [47:49<1:55:48,  3.32s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  30%|###       | 907/3000 [47:52<1:55:48,  3.32s/it, lr: 1.0e-04 loss: 9.283e-02]hash_cache_v1:  30%|###       | 907/3000 [47:52<1:55:48,  3.32s/it, lr: 1.0e-04 loss: 9.283e-02]hash_cache_v1:  30%|###       | 908/3000 [47:52<1:51:19,  3.19s/it, lr: 1.0e-04 loss: 9.283e-02]hash_cache_v1:  30%|###       | 908/3000 [47:52<1:51:19,  3.19s/it, lr: 1.0e-04 loss: 9.283e-02]hash_cache_v1:  30%|###       | 908/3000 [47:55<1:51:19,  3.19s/it, lr: 1.0e-04 loss: 3.406e-02]hash_cache_v1:  30%|###       | 908/3000 [47:55<1:51:19,  3.19s/it, lr: 1.0e-04 loss: 3.406e-02]hash_cache_v1:  30%|###       | 909/3000 [47:55<1:47:53,  3.10s/it, lr: 1.0e-04 loss: 3.406e-02]hash_cache_v1:  30%|###       | 909/3000 [47:55<1:47:53,  3.10s/it, lr: 1.0e-04 loss: 3.406e-02]hash_cache_v1:  30%|###       | 909/3000 [47:57<1:47:53,  3.10s/it, lr: 1.0e-04 loss: 1.856e-01]hash_cache_v1:  30%|###       | 909/3000 [47:57<1:47:53,  3.10s/it, lr: 1.0e-04 loss: 1.856e-01]hash_cache_v1:  30%|###       | 910/3000 [48:00<1:47:50,  3.10s/it, lr: 1.0e-04 loss: 8.323e-02]hash_cache_v1:  30%|###       | 910/3000 [48:00<1:47:50,  3.10s/it, lr: 1.0e-04 loss: 8.323e-02]hash_cache_v1:  30%|###       | 911/3000 [48:00<1:23:20,  2.39s/it, lr: 1.0e-04 loss: 8.323e-02]hash_cache_v1:  30%|###       | 911/3000 [48:00<1:23:20,  2.39s/it, lr: 1.0e-04 loss: 8.323e-02]hash_cache_v1:  30%|###       | 911/3000 [48:03<1:23:20,  2.39s/it, lr: 1.0e-04 loss: 1.944e-01]hash_cache_v1:  30%|###       | 911/3000 [48:03<1:23:20,  2.39s/it, lr: 1.0e-04 loss: 1.944e-01]hash_cache_v1:  30%|###       | 912/3000 [48:03<1:27:27,  2.51s/it, lr: 1.0e-04 loss: 1.944e-01]hash_cache_v1:  30%|###       | 912/3000 [48:03<1:27:27,  2.51s/it, lr: 1.0e-04 loss: 1.944e-01]hash_cache_v1:  30%|###       | 912/3000 [48:07<1:27:27,  2.51s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  30%|###       | 912/3000 [48:07<1:27:27,  2.51s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  30%|###       | 913/3000 [48:07<1:43:20,  2.97s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  30%|###       | 913/3000 [48:07<1:43:20,  2.97s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  30%|###       | 913/3000 [48:09<1:43:20,  2.97s/it, lr: 1.0e-04 loss: 1.058e-01]hash_cache_v1:  30%|###       | 913/3000 [48:09<1:43:20,  2.97s/it, lr: 1.0e-04 loss: 1.058e-01]hash_cache_v1:  30%|###       | 914/3000 [48:09<1:37:50,  2.81s/it, lr: 1.0e-04 loss: 1.058e-01]hash_cache_v1:  30%|###       | 914/3000 [48:09<1:37:50,  2.81s/it, lr: 1.0e-04 loss: 1.058e-01]hash_cache_v1:  30%|###       | 914/3000 [48:14<1:37:50,  2.81s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  30%|###       | 914/3000 [48:14<1:37:50,  2.81s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  30%|###       | 915/3000 [48:14<1:52:01,  3.22s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  30%|###       | 915/3000 [48:14<1:52:01,  3.22s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  30%|###       | 915/3000 [48:16<1:52:01,  3.22s/it, lr: 1.0e-04 loss: 4.853e-02]hash_cache_v1:  30%|###       | 915/3000 [48:16<1:52:01,  3.22s/it, lr: 1.0e-04 loss: 4.853e-02]hash_cache_v1:  31%|###       | 916/3000 [48:16<1:41:02,  2.91s/it, lr: 1.0e-04 loss: 4.853e-02]hash_cache_v1:  31%|###       | 916/3000 [48:16<1:41:02,  2.91s/it, lr: 1.0e-04 loss: 4.853e-02]hash_cache_v1:  31%|###       | 916/3000 [48:20<1:41:02,  2.91s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  31%|###       | 916/3000 [48:20<1:41:02,  2.91s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  31%|###       | 917/3000 [48:20<1:54:56,  3.31s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  31%|###       | 917/3000 [48:20<1:54:56,  3.31s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  31%|###       | 917/3000 [48:25<1:54:56,  3.31s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  31%|###       | 917/3000 [48:25<1:54:56,  3.31s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  31%|###       | 918/3000 [48:25<2:07:17,  3.67s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  31%|###       | 918/3000 [48:25<2:07:17,  3.67s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  31%|###       | 918/3000 [48:27<2:07:17,  3.67s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  31%|###       | 918/3000 [48:27<2:07:17,  3.67s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  31%|###       | 919/3000 [48:27<1:51:15,  3.21s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  31%|###       | 919/3000 [48:27<1:51:15,  3.21s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  31%|###       | 919/3000 [48:29<1:51:15,  3.21s/it, lr: 1.0e-04 loss: 2.216e-01]hash_cache_v1:  31%|###       | 919/3000 [48:29<1:51:15,  3.21s/it, lr: 1.0e-04 loss: 2.216e-01]hash_cache_v1:  31%|###       | 920/3000 [48:33<1:51:12,  3.21s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  31%|###       | 920/3000 [48:33<1:51:12,  3.21s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  31%|###       | 921/3000 [48:33<1:36:03,  2.77s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  31%|###       | 921/3000 [48:33<1:36:03,  2.77s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  31%|###       | 921/3000 [48:38<1:36:03,  2.77s/it, lr: 1.0e-04 loss: 8.749e-02]hash_cache_v1:  31%|###       | 921/3000 [48:38<1:36:03,  2.77s/it, lr: 1.0e-04 loss: 8.749e-02]hash_cache_v1:  31%|###       | 922/3000 [48:38<1:49:13,  3.15s/it, lr: 1.0e-04 loss: 8.749e-02]hash_cache_v1:  31%|###       | 922/3000 [48:38<1:49:13,  3.15s/it, lr: 1.0e-04 loss: 8.749e-02]hash_cache_v1:  31%|###       | 922/3000 [48:41<1:49:13,  3.15s/it, lr: 1.0e-04 loss: 1.914e-01]hash_cache_v1:  31%|###       | 922/3000 [48:41<1:49:13,  3.15s/it, lr: 1.0e-04 loss: 1.914e-01]hash_cache_v1:  31%|###       | 923/3000 [48:41<1:46:42,  3.08s/it, lr: 1.0e-04 loss: 1.914e-01]hash_cache_v1:  31%|###       | 923/3000 [48:41<1:46:42,  3.08s/it, lr: 1.0e-04 loss: 1.914e-01]hash_cache_v1:  31%|###       | 923/3000 [48:45<1:46:42,  3.08s/it, lr: 1.0e-04 loss: 1.187e-01]hash_cache_v1:  31%|###       | 923/3000 [48:45<1:46:42,  3.08s/it, lr: 1.0e-04 loss: 1.187e-01]hash_cache_v1:  31%|###       | 924/3000 [48:45<1:58:16,  3.42s/it, lr: 1.0e-04 loss: 1.187e-01]hash_cache_v1:  31%|###       | 924/3000 [48:45<1:58:16,  3.42s/it, lr: 1.0e-04 loss: 1.187e-01]hash_cache_v1:  31%|###       | 924/3000 [48:49<1:58:16,  3.42s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  31%|###       | 924/3000 [48:49<1:58:16,  3.42s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  31%|###       | 925/3000 [48:49<2:08:28,  3.72s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  31%|###       | 925/3000 [48:49<2:08:28,  3.72s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  31%|###       | 925/3000 [48:54<2:08:28,  3.72s/it, lr: 1.0e-04 loss: 2.152e-02]hash_cache_v1:  31%|###       | 925/3000 [48:54<2:08:28,  3.72s/it, lr: 1.0e-04 loss: 2.152e-02]hash_cache_v1:  31%|###       | 926/3000 [48:54<2:14:01,  3.88s/it, lr: 1.0e-04 loss: 2.152e-02]hash_cache_v1:  31%|###       | 926/3000 [48:54<2:14:01,  3.88s/it, lr: 1.0e-04 loss: 2.152e-02]hash_cache_v1:  31%|###       | 926/3000 [48:57<2:14:01,  3.88s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  31%|###       | 926/3000 [48:57<2:14:01,  3.88s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  31%|###       | 927/3000 [48:57<2:04:08,  3.59s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  31%|###       | 927/3000 [48:57<2:04:08,  3.59s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  31%|###       | 927/3000 [49:00<2:04:08,  3.59s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  31%|###       | 927/3000 [49:00<2:04:08,  3.59s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  31%|###       | 928/3000 [49:00<1:58:47,  3.44s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  31%|###       | 928/3000 [49:00<1:58:47,  3.44s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  31%|###       | 928/3000 [49:02<1:58:47,  3.44s/it, lr: 1.0e-04 loss: 8.745e-02]hash_cache_v1:  31%|###       | 928/3000 [49:02<1:58:47,  3.44s/it, lr: 1.0e-04 loss: 8.745e-02]hash_cache_v1:  31%|###       | 929/3000 [49:02<1:45:13,  3.05s/it, lr: 1.0e-04 loss: 8.745e-02]hash_cache_v1:  31%|###       | 929/3000 [49:02<1:45:13,  3.05s/it, lr: 1.0e-04 loss: 8.745e-02]hash_cache_v1:  31%|###       | 929/3000 [49:05<1:45:13,  3.05s/it, lr: 1.0e-04 loss: 4.520e-02]hash_cache_v1:  31%|###       | 929/3000 [49:05<1:45:13,  3.05s/it, lr: 1.0e-04 loss: 4.520e-02]hash_cache_v1:  31%|###1      | 930/3000 [49:08<1:45:10,  3.05s/it, lr: 1.0e-04 loss: 6.262e-02]hash_cache_v1:  31%|###1      | 930/3000 [49:08<1:45:10,  3.05s/it, lr: 1.0e-04 loss: 6.262e-02]hash_cache_v1:  31%|###1      | 931/3000 [49:08<1:19:42,  2.31s/it, lr: 1.0e-04 loss: 6.262e-02]hash_cache_v1:  31%|###1      | 931/3000 [49:08<1:19:42,  2.31s/it, lr: 1.0e-04 loss: 6.262e-02]hash_cache_v1:  31%|###1      | 931/3000 [49:12<1:19:42,  2.31s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  31%|###1      | 931/3000 [49:12<1:19:42,  2.31s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  31%|###1      | 932/3000 [49:12<1:38:12,  2.85s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  31%|###1      | 932/3000 [49:12<1:38:12,  2.85s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  31%|###1      | 932/3000 [49:16<1:38:12,  2.85s/it, lr: 1.0e-04 loss: 1.344e-01]hash_cache_v1:  31%|###1      | 932/3000 [49:16<1:38:12,  2.85s/it, lr: 1.0e-04 loss: 1.344e-01]hash_cache_v1:  31%|###1      | 933/3000 [49:16<1:51:10,  3.23s/it, lr: 1.0e-04 loss: 1.344e-01]hash_cache_v1:  31%|###1      | 933/3000 [49:16<1:51:10,  3.23s/it, lr: 1.0e-04 loss: 1.344e-01]hash_cache_v1:  31%|###1      | 933/3000 [49:19<1:51:10,  3.23s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  31%|###1      | 933/3000 [49:19<1:51:10,  3.23s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  31%|###1      | 934/3000 [49:19<1:48:02,  3.14s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  31%|###1      | 934/3000 [49:19<1:48:02,  3.14s/it, lr: 1.0e-04 loss: 1.884e-01]hash_cache_v1:  31%|###1      | 934/3000 [49:24<1:48:02,  3.14s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  31%|###1      | 934/3000 [49:24<1:48:02,  3.14s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  31%|###1      | 935/3000 [49:24<1:59:19,  3.47s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  31%|###1      | 935/3000 [49:24<1:59:19,  3.47s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  31%|###1      | 935/3000 [49:28<1:59:19,  3.47s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  31%|###1      | 935/3000 [49:28<1:59:19,  3.47s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  31%|###1      | 936/3000 [49:28<2:09:16,  3.76s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  31%|###1      | 936/3000 [49:28<2:09:16,  3.76s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  31%|###1      | 936/3000 [49:32<2:09:16,  3.76s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  31%|###1      | 936/3000 [49:32<2:09:16,  3.76s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  31%|###1      | 937/3000 [49:32<2:14:53,  3.92s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  31%|###1      | 937/3000 [49:32<2:14:53,  3.92s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  31%|###1      | 937/3000 [49:35<2:14:53,  3.92s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  31%|###1      | 937/3000 [49:35<2:14:53,  3.92s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  31%|###1      | 938/3000 [49:35<2:04:16,  3.62s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  31%|###1      | 938/3000 [49:35<2:04:16,  3.62s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  31%|###1      | 938/3000 [49:40<2:04:16,  3.62s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  31%|###1      | 938/3000 [49:40<2:04:16,  3.62s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  31%|###1      | 939/3000 [49:40<2:13:15,  3.88s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  31%|###1      | 939/3000 [49:40<2:13:15,  3.88s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  31%|###1      | 939/3000 [49:42<2:13:15,  3.88s/it, lr: 1.0e-04 loss: 1.661e-01]hash_cache_v1:  31%|###1      | 939/3000 [49:42<2:13:15,  3.88s/it, lr: 1.0e-04 loss: 1.661e-01]hash_cache_v1:  31%|###1      | 940/3000 [49:44<2:13:12,  3.88s/it, lr: 1.0e-04 loss: 2.268e-01]hash_cache_v1:  31%|###1      | 940/3000 [49:44<2:13:12,  3.88s/it, lr: 1.0e-04 loss: 2.268e-01]hash_cache_v1:  31%|###1      | 941/3000 [49:44<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 2.268e-01]hash_cache_v1:  31%|###1      | 941/3000 [49:44<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 2.268e-01]hash_cache_v1:  31%|###1      | 941/3000 [49:47<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 8.922e-02]hash_cache_v1:  31%|###1      | 941/3000 [49:47<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 8.922e-02]hash_cache_v1:  31%|###1      | 942/3000 [49:47<1:31:13,  2.66s/it, lr: 1.0e-04 loss: 8.922e-02]hash_cache_v1:  31%|###1      | 942/3000 [49:47<1:31:13,  2.66s/it, lr: 1.0e-04 loss: 8.922e-02]hash_cache_v1:  31%|###1      | 942/3000 [49:49<1:31:13,  2.66s/it, lr: 1.0e-04 loss: 8.771e-02]hash_cache_v1:  31%|###1      | 942/3000 [49:49<1:31:13,  2.66s/it, lr: 1.0e-04 loss: 8.771e-02]hash_cache_v1:  31%|###1      | 943/3000 [49:49<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 8.771e-02]hash_cache_v1:  31%|###1      | 943/3000 [49:49<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 8.771e-02]hash_cache_v1:  31%|###1      | 943/3000 [49:51<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 2.590e-01]hash_cache_v1:  31%|###1      | 943/3000 [49:51<1:28:46,  2.59s/it, lr: 1.0e-04 loss: 2.590e-01]hash_cache_v1:  31%|###1      | 944/3000 [49:51<1:24:12,  2.46s/it, lr: 1.0e-04 loss: 2.590e-01]hash_cache_v1:  31%|###1      | 944/3000 [49:51<1:24:12,  2.46s/it, lr: 1.0e-04 loss: 2.590e-01]hash_cache_v1:  31%|###1      | 944/3000 [49:56<1:24:12,  2.46s/it, lr: 1.0e-04 loss: 5.653e-02]hash_cache_v1:  31%|###1      | 944/3000 [49:56<1:24:12,  2.46s/it, lr: 1.0e-04 loss: 5.653e-02]hash_cache_v1:  32%|###1      | 945/3000 [49:56<1:41:34,  2.97s/it, lr: 1.0e-04 loss: 5.653e-02]hash_cache_v1:  32%|###1      | 945/3000 [49:56<1:41:34,  2.97s/it, lr: 1.0e-04 loss: 5.653e-02]hash_cache_v1:  32%|###1      | 945/3000 [49:59<1:41:34,  2.97s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  32%|###1      | 945/3000 [49:59<1:41:34,  2.97s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  32%|###1      | 946/3000 [49:59<1:42:47,  3.00s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  32%|###1      | 946/3000 [49:59<1:42:47,  3.00s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  32%|###1      | 946/3000 [50:01<1:42:47,  3.00s/it, lr: 1.0e-04 loss: 2.000e-01]hash_cache_v1:  32%|###1      | 946/3000 [50:01<1:42:47,  3.00s/it, lr: 1.0e-04 loss: 2.000e-01]hash_cache_v1:  32%|###1      | 947/3000 [50:01<1:40:18,  2.93s/it, lr: 1.0e-04 loss: 2.000e-01]hash_cache_v1:  32%|###1      | 947/3000 [50:01<1:40:18,  2.93s/it, lr: 1.0e-04 loss: 2.000e-01]hash_cache_v1:  32%|###1      | 947/3000 [50:04<1:40:18,  2.93s/it, lr: 1.0e-04 loss: 1.638e-02]hash_cache_v1:  32%|###1      | 947/3000 [50:04<1:40:18,  2.93s/it, lr: 1.0e-04 loss: 1.638e-02]hash_cache_v1:  32%|###1      | 948/3000 [50:04<1:32:02,  2.69s/it, lr: 1.0e-04 loss: 1.638e-02]hash_cache_v1:  32%|###1      | 948/3000 [50:04<1:32:02,  2.69s/it, lr: 1.0e-04 loss: 1.638e-02]hash_cache_v1:  32%|###1      | 948/3000 [50:06<1:32:02,  2.69s/it, lr: 1.0e-04 loss: 1.709e-01]hash_cache_v1:  32%|###1      | 948/3000 [50:06<1:32:02,  2.69s/it, lr: 1.0e-04 loss: 1.709e-01]hash_cache_v1:  32%|###1      | 949/3000 [50:06<1:33:32,  2.74s/it, lr: 1.0e-04 loss: 1.709e-01]hash_cache_v1:  32%|###1      | 949/3000 [50:06<1:33:32,  2.74s/it, lr: 1.0e-04 loss: 1.709e-01]hash_cache_v1:  32%|###1      | 949/3000 [50:09<1:33:32,  2.74s/it, lr: 1.0e-04 loss: 5.780e-02]hash_cache_v1:  32%|###1      | 949/3000 [50:09<1:33:32,  2.74s/it, lr: 1.0e-04 loss: 5.780e-02]hash_cache_v1:  32%|###1      | 950/3000 [50:12<1:33:29,  2.74s/it, lr: 1.0e-04 loss: 8.102e-02]hash_cache_v1:  32%|###1      | 950/3000 [50:12<1:33:29,  2.74s/it, lr: 1.0e-04 loss: 8.102e-02]hash_cache_v1:  32%|###1      | 951/3000 [50:12<1:13:07,  2.14s/it, lr: 1.0e-04 loss: 8.102e-02]hash_cache_v1:  32%|###1      | 951/3000 [50:12<1:13:07,  2.14s/it, lr: 1.0e-04 loss: 8.102e-02]hash_cache_v1:  32%|###1      | 951/3000 [50:14<1:13:07,  2.14s/it, lr: 1.0e-04 loss: 7.803e-02]hash_cache_v1:  32%|###1      | 951/3000 [50:14<1:13:07,  2.14s/it, lr: 1.0e-04 loss: 7.803e-02]hash_cache_v1:  32%|###1      | 952/3000 [50:14<1:12:45,  2.13s/it, lr: 1.0e-04 loss: 7.803e-02]hash_cache_v1:  32%|###1      | 952/3000 [50:14<1:12:45,  2.13s/it, lr: 1.0e-04 loss: 7.803e-02]hash_cache_v1:  32%|###1      | 952/3000 [50:18<1:12:45,  2.13s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  32%|###1      | 952/3000 [50:18<1:12:45,  2.13s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  32%|###1      | 953/3000 [50:18<1:33:43,  2.75s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  32%|###1      | 953/3000 [50:18<1:33:43,  2.75s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  32%|###1      | 953/3000 [50:20<1:33:43,  2.75s/it, lr: 1.0e-04 loss: 2.677e-03]hash_cache_v1:  32%|###1      | 953/3000 [50:20<1:33:43,  2.75s/it, lr: 1.0e-04 loss: 2.677e-03]hash_cache_v1:  32%|###1      | 954/3000 [50:20<1:27:44,  2.57s/it, lr: 1.0e-04 loss: 2.677e-03]hash_cache_v1:  32%|###1      | 954/3000 [50:20<1:27:44,  2.57s/it, lr: 1.0e-04 loss: 2.677e-03]hash_cache_v1:  32%|###1      | 954/3000 [50:23<1:27:44,  2.57s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  32%|###1      | 954/3000 [50:23<1:27:44,  2.57s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  32%|###1      | 955/3000 [50:23<1:23:27,  2.45s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  32%|###1      | 955/3000 [50:23<1:23:27,  2.45s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  32%|###1      | 955/3000 [50:27<1:23:27,  2.45s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:  32%|###1      | 955/3000 [50:27<1:23:27,  2.45s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:  32%|###1      | 956/3000 [50:27<1:41:15,  2.97s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:  32%|###1      | 956/3000 [50:27<1:41:15,  2.97s/it, lr: 1.0e-04 loss: 1.407e-01]hash_cache_v1:  32%|###1      | 956/3000 [50:31<1:41:15,  2.97s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  32%|###1      | 956/3000 [50:31<1:41:15,  2.97s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  32%|###1      | 957/3000 [50:31<1:56:21,  3.42s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  32%|###1      | 957/3000 [50:31<1:56:21,  3.42s/it, lr: 1.0e-04 loss: 1.303e-01]hash_cache_v1:  32%|###1      | 957/3000 [50:33<1:56:21,  3.42s/it, lr: 1.0e-04 loss: 2.316e-01]hash_cache_v1:  32%|###1      | 957/3000 [50:33<1:56:21,  3.42s/it, lr: 1.0e-04 loss: 2.316e-01]hash_cache_v1:  32%|###1      | 958/3000 [50:33<1:43:05,  3.03s/it, lr: 1.0e-04 loss: 2.316e-01]hash_cache_v1:  32%|###1      | 958/3000 [50:33<1:43:05,  3.03s/it, lr: 1.0e-04 loss: 2.316e-01]hash_cache_v1:  32%|###1      | 958/3000 [50:36<1:43:05,  3.03s/it, lr: 1.0e-04 loss: 1.917e-01]hash_cache_v1:  32%|###1      | 958/3000 [50:36<1:43:05,  3.03s/it, lr: 1.0e-04 loss: 1.917e-01]hash_cache_v1:  32%|###1      | 959/3000 [50:36<1:33:45,  2.76s/it, lr: 1.0e-04 loss: 1.917e-01]hash_cache_v1:  32%|###1      | 959/3000 [50:36<1:33:45,  2.76s/it, lr: 1.0e-04 loss: 1.917e-01]hash_cache_v1:  32%|###1      | 959/3000 [50:40<1:33:45,  2.76s/it, lr: 1.0e-04 loss: 1.647e-01]hash_cache_v1:  32%|###1      | 959/3000 [50:40<1:33:45,  2.76s/it, lr: 1.0e-04 loss: 1.647e-01]hash_cache_v1:  32%|###2      | 960/3000 [50:42<1:33:42,  2.76s/it, lr: 1.0e-04 loss: 2.060e-01]hash_cache_v1:  32%|###2      | 960/3000 [50:42<1:33:42,  2.76s/it, lr: 1.0e-04 loss: 2.060e-01]hash_cache_v1:  32%|###2      | 961/3000 [50:42<1:09:26,  2.04s/it, lr: 1.0e-04 loss: 2.060e-01]hash_cache_v1:  32%|###2      | 961/3000 [50:42<1:09:26,  2.04s/it, lr: 1.0e-04 loss: 2.060e-01]hash_cache_v1:  32%|###2      | 961/3000 [50:44<1:09:26,  2.04s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  32%|###2      | 961/3000 [50:44<1:09:26,  2.04s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  32%|###2      | 962/3000 [50:44<1:09:53,  2.06s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  32%|###2      | 962/3000 [50:44<1:09:53,  2.06s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  32%|###2      | 962/3000 [50:49<1:09:53,  2.06s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  32%|###2      | 962/3000 [50:49<1:09:53,  2.06s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  32%|###2      | 963/3000 [50:49<1:28:46,  2.61s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  32%|###2      | 963/3000 [50:49<1:28:46,  2.61s/it, lr: 1.0e-04 loss: 1.008e-01]hash_cache_v1:  32%|###2      | 963/3000 [50:53<1:28:46,  2.61s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  32%|###2      | 963/3000 [50:53<1:28:46,  2.61s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  32%|###2      | 964/3000 [50:53<1:45:58,  3.12s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  32%|###2      | 964/3000 [50:53<1:45:58,  3.12s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  32%|###2      | 964/3000 [50:57<1:45:58,  3.12s/it, lr: 1.0e-04 loss: 2.875e-02]hash_cache_v1:  32%|###2      | 964/3000 [50:57<1:45:58,  3.12s/it, lr: 1.0e-04 loss: 2.875e-02]hash_cache_v1:  32%|###2      | 965/3000 [50:57<1:57:09,  3.45s/it, lr: 1.0e-04 loss: 2.875e-02]hash_cache_v1:  32%|###2      | 965/3000 [50:57<1:57:09,  3.45s/it, lr: 1.0e-04 loss: 2.875e-02]hash_cache_v1:  32%|###2      | 965/3000 [51:02<1:57:09,  3.45s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  32%|###2      | 965/3000 [51:02<1:57:09,  3.45s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  32%|###2      | 966/3000 [51:02<2:05:26,  3.70s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  32%|###2      | 966/3000 [51:02<2:05:26,  3.70s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  32%|###2      | 966/3000 [51:05<2:05:26,  3.70s/it, lr: 1.0e-04 loss: 1.478e-01]hash_cache_v1:  32%|###2      | 966/3000 [51:05<2:05:26,  3.70s/it, lr: 1.0e-04 loss: 1.478e-01]hash_cache_v1:  32%|###2      | 967/3000 [51:05<1:57:13,  3.46s/it, lr: 1.0e-04 loss: 1.478e-01]hash_cache_v1:  32%|###2      | 967/3000 [51:05<1:57:13,  3.46s/it, lr: 1.0e-04 loss: 1.478e-01]hash_cache_v1:  32%|###2      | 967/3000 [51:07<1:57:13,  3.46s/it, lr: 1.0e-04 loss: 1.798e-01]hash_cache_v1:  32%|###2      | 967/3000 [51:07<1:57:13,  3.46s/it, lr: 1.0e-04 loss: 1.798e-01]hash_cache_v1:  32%|###2      | 968/3000 [51:07<1:46:25,  3.14s/it, lr: 1.0e-04 loss: 1.798e-01]hash_cache_v1:  32%|###2      | 968/3000 [51:07<1:46:25,  3.14s/it, lr: 1.0e-04 loss: 1.798e-01]hash_cache_v1:  32%|###2      | 968/3000 [51:10<1:46:25,  3.14s/it, lr: 1.0e-04 loss: 1.747e-01]hash_cache_v1:  32%|###2      | 968/3000 [51:10<1:46:25,  3.14s/it, lr: 1.0e-04 loss: 1.747e-01]hash_cache_v1:  32%|###2      | 969/3000 [51:10<1:43:21,  3.05s/it, lr: 1.0e-04 loss: 1.747e-01]hash_cache_v1:  32%|###2      | 969/3000 [51:10<1:43:21,  3.05s/it, lr: 1.0e-04 loss: 1.747e-01]hash_cache_v1:  32%|###2      | 969/3000 [51:13<1:43:21,  3.05s/it, lr: 1.0e-04 loss: 6.735e-02]hash_cache_v1:  32%|###2      | 969/3000 [51:13<1:43:21,  3.05s/it, lr: 1.0e-04 loss: 6.735e-02]hash_cache_v1:  32%|###2      | 970/3000 [51:15<1:43:18,  3.05s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  32%|###2      | 970/3000 [51:15<1:43:18,  3.05s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  32%|###2      | 971/3000 [51:15<1:18:14,  2.31s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  32%|###2      | 971/3000 [51:15<1:18:14,  2.31s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  32%|###2      | 971/3000 [51:18<1:18:14,  2.31s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:  32%|###2      | 971/3000 [51:18<1:18:14,  2.31s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:  32%|###2      | 972/3000 [51:18<1:24:17,  2.49s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:  32%|###2      | 972/3000 [51:18<1:24:17,  2.49s/it, lr: 1.0e-04 loss: 1.560e-01]hash_cache_v1:  32%|###2      | 972/3000 [51:21<1:24:17,  2.49s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  32%|###2      | 972/3000 [51:21<1:24:17,  2.49s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  32%|###2      | 973/3000 [51:21<1:20:54,  2.39s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  32%|###2      | 973/3000 [51:21<1:20:54,  2.39s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  32%|###2      | 973/3000 [51:23<1:20:54,  2.39s/it, lr: 1.0e-04 loss: 1.578e-01]hash_cache_v1:  32%|###2      | 973/3000 [51:23<1:20:54,  2.39s/it, lr: 1.0e-04 loss: 1.578e-01]hash_cache_v1:  32%|###2      | 974/3000 [51:23<1:25:13,  2.52s/it, lr: 1.0e-04 loss: 1.578e-01]hash_cache_v1:  32%|###2      | 974/3000 [51:23<1:25:13,  2.52s/it, lr: 1.0e-04 loss: 1.578e-01]hash_cache_v1:  32%|###2      | 974/3000 [51:26<1:25:13,  2.52s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  32%|###2      | 974/3000 [51:26<1:25:13,  2.52s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  32%|###2      | 975/3000 [51:26<1:23:56,  2.49s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  32%|###2      | 975/3000 [51:26<1:23:56,  2.49s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  32%|###2      | 975/3000 [51:30<1:23:56,  2.49s/it, lr: 1.0e-04 loss: 7.716e-02]hash_cache_v1:  32%|###2      | 975/3000 [51:30<1:23:56,  2.49s/it, lr: 1.0e-04 loss: 7.716e-02]hash_cache_v1:  33%|###2      | 976/3000 [51:30<1:41:56,  3.02s/it, lr: 1.0e-04 loss: 7.716e-02]hash_cache_v1:  33%|###2      | 976/3000 [51:30<1:41:56,  3.02s/it, lr: 1.0e-04 loss: 7.716e-02]hash_cache_v1:  33%|###2      | 976/3000 [51:33<1:41:56,  3.02s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  33%|###2      | 976/3000 [51:33<1:41:56,  3.02s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  33%|###2      | 977/3000 [51:33<1:40:34,  2.98s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  33%|###2      | 977/3000 [51:33<1:40:34,  2.98s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  33%|###2      | 977/3000 [51:36<1:40:34,  2.98s/it, lr: 1.0e-04 loss: 1.533e-01]hash_cache_v1:  33%|###2      | 977/3000 [51:36<1:40:34,  2.98s/it, lr: 1.0e-04 loss: 1.533e-01]hash_cache_v1:  33%|###2      | 978/3000 [51:36<1:39:06,  2.94s/it, lr: 1.0e-04 loss: 1.533e-01]hash_cache_v1:  33%|###2      | 978/3000 [51:36<1:39:06,  2.94s/it, lr: 1.0e-04 loss: 1.533e-01]hash_cache_v1:  33%|###2      | 978/3000 [51:38<1:39:06,  2.94s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  33%|###2      | 978/3000 [51:38<1:39:06,  2.94s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  33%|###2      | 979/3000 [51:38<1:33:38,  2.78s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  33%|###2      | 979/3000 [51:38<1:33:38,  2.78s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  33%|###2      | 979/3000 [51:41<1:33:38,  2.78s/it, lr: 1.0e-04 loss: 1.704e-02]hash_cache_v1:  33%|###2      | 979/3000 [51:41<1:33:38,  2.78s/it, lr: 1.0e-04 loss: 1.704e-02]hash_cache_v1:  33%|###2      | 980/3000 [51:45<1:33:35,  2.78s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  33%|###2      | 980/3000 [51:45<1:33:35,  2.78s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  33%|###2      | 981/3000 [51:46<1:23:58,  2.50s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  33%|###2      | 981/3000 [51:46<1:23:58,  2.50s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  33%|###2      | 981/3000 [51:50<1:23:58,  2.50s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  33%|###2      | 981/3000 [51:50<1:23:58,  2.50s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  33%|###2      | 982/3000 [51:50<1:39:02,  2.94s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  33%|###2      | 982/3000 [51:50<1:39:02,  2.94s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  33%|###2      | 982/3000 [51:52<1:39:02,  2.94s/it, lr: 1.0e-04 loss: 2.025e-01]hash_cache_v1:  33%|###2      | 982/3000 [51:52<1:39:02,  2.94s/it, lr: 1.0e-04 loss: 2.025e-01]hash_cache_v1:  33%|###2      | 983/3000 [51:52<1:34:09,  2.80s/it, lr: 1.0e-04 loss: 2.025e-01]hash_cache_v1:  33%|###2      | 983/3000 [51:52<1:34:09,  2.80s/it, lr: 1.0e-04 loss: 2.025e-01]hash_cache_v1:  33%|###2      | 983/3000 [51:54<1:34:09,  2.80s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  33%|###2      | 983/3000 [51:54<1:34:09,  2.80s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  33%|###2      | 984/3000 [51:54<1:27:42,  2.61s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  33%|###2      | 984/3000 [51:54<1:27:42,  2.61s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  33%|###2      | 984/3000 [51:59<1:27:42,  2.61s/it, lr: 1.0e-04 loss: 8.238e-02]hash_cache_v1:  33%|###2      | 984/3000 [51:59<1:27:42,  2.61s/it, lr: 1.0e-04 loss: 8.238e-02]hash_cache_v1:  33%|###2      | 985/3000 [51:59<1:43:42,  3.09s/it, lr: 1.0e-04 loss: 8.238e-02]hash_cache_v1:  33%|###2      | 985/3000 [51:59<1:43:42,  3.09s/it, lr: 1.0e-04 loss: 8.238e-02]hash_cache_v1:  33%|###2      | 985/3000 [52:01<1:43:42,  3.09s/it, lr: 1.0e-04 loss: 7.380e-02]hash_cache_v1:  33%|###2      | 985/3000 [52:01<1:43:42,  3.09s/it, lr: 1.0e-04 loss: 7.380e-02]hash_cache_v1:  33%|###2      | 986/3000 [52:01<1:36:54,  2.89s/it, lr: 1.0e-04 loss: 7.380e-02]hash_cache_v1:  33%|###2      | 986/3000 [52:01<1:36:54,  2.89s/it, lr: 1.0e-04 loss: 7.380e-02]hash_cache_v1:  33%|###2      | 986/3000 [52:04<1:36:54,  2.89s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  33%|###2      | 986/3000 [52:04<1:36:54,  2.89s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  33%|###2      | 987/3000 [52:04<1:36:42,  2.88s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  33%|###2      | 987/3000 [52:04<1:36:42,  2.88s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  33%|###2      | 987/3000 [52:06<1:36:42,  2.88s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  33%|###2      | 987/3000 [52:06<1:36:42,  2.88s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  33%|###2      | 988/3000 [52:06<1:29:09,  2.66s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  33%|###2      | 988/3000 [52:06<1:29:09,  2.66s/it, lr: 1.0e-04 loss: 2.020e-01]hash_cache_v1:  33%|###2      | 988/3000 [52:08<1:29:09,  2.66s/it, lr: 1.0e-04 loss: 2.786e-01]hash_cache_v1:  33%|###2      | 988/3000 [52:08<1:29:09,  2.66s/it, lr: 1.0e-04 loss: 2.786e-01]hash_cache_v1:  33%|###2      | 989/3000 [52:08<1:23:52,  2.50s/it, lr: 1.0e-04 loss: 2.786e-01]hash_cache_v1:  33%|###2      | 989/3000 [52:08<1:23:52,  2.50s/it, lr: 1.0e-04 loss: 2.786e-01]hash_cache_v1:  33%|###2      | 989/3000 [52:13<1:23:52,  2.50s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  33%|###2      | 989/3000 [52:13<1:23:52,  2.50s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  33%|###3      | 990/3000 [52:17<1:23:49,  2.50s/it, lr: 1.0e-04 loss: 5.870e-03]hash_cache_v1:  33%|###3      | 990/3000 [52:17<1:23:49,  2.50s/it, lr: 1.0e-04 loss: 5.870e-03]hash_cache_v1:  33%|###3      | 991/3000 [52:17<1:18:44,  2.35s/it, lr: 1.0e-04 loss: 5.870e-03]hash_cache_v1:  33%|###3      | 991/3000 [52:17<1:18:44,  2.35s/it, lr: 1.0e-04 loss: 5.870e-03]hash_cache_v1:  33%|###3      | 991/3000 [52:20<1:18:44,  2.35s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  33%|###3      | 991/3000 [52:20<1:18:44,  2.35s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  33%|###3      | 992/3000 [52:20<1:22:53,  2.48s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  33%|###3      | 992/3000 [52:20<1:22:53,  2.48s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  33%|###3      | 992/3000 [52:25<1:22:53,  2.48s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  33%|###3      | 992/3000 [52:25<1:22:53,  2.48s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  33%|###3      | 993/3000 [52:25<1:40:43,  3.01s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  33%|###3      | 993/3000 [52:25<1:40:43,  3.01s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  33%|###3      | 993/3000 [52:27<1:40:43,  3.01s/it, lr: 1.0e-04 loss: 9.027e-02]hash_cache_v1:  33%|###3      | 993/3000 [52:27<1:40:43,  3.01s/it, lr: 1.0e-04 loss: 9.027e-02]hash_cache_v1:  33%|###3      | 994/3000 [52:27<1:32:30,  2.77s/it, lr: 1.0e-04 loss: 9.027e-02]hash_cache_v1:  33%|###3      | 994/3000 [52:27<1:32:30,  2.77s/it, lr: 1.0e-04 loss: 9.027e-02]hash_cache_v1:  33%|###3      | 994/3000 [52:30<1:32:30,  2.77s/it, lr: 1.0e-04 loss: 9.230e-02]hash_cache_v1:  33%|###3      | 994/3000 [52:30<1:32:30,  2.77s/it, lr: 1.0e-04 loss: 9.230e-02]hash_cache_v1:  33%|###3      | 995/3000 [52:30<1:33:43,  2.80s/it, lr: 1.0e-04 loss: 9.230e-02]hash_cache_v1:  33%|###3      | 995/3000 [52:30<1:33:43,  2.80s/it, lr: 1.0e-04 loss: 9.230e-02]hash_cache_v1:  33%|###3      | 995/3000 [52:33<1:33:43,  2.80s/it, lr: 1.0e-04 loss: 1.663e-01]hash_cache_v1:  33%|###3      | 995/3000 [52:33<1:33:43,  2.80s/it, lr: 1.0e-04 loss: 1.663e-01]hash_cache_v1:  33%|###3      | 996/3000 [52:33<1:34:06,  2.82s/it, lr: 1.0e-04 loss: 1.663e-01]hash_cache_v1:  33%|###3      | 996/3000 [52:33<1:34:06,  2.82s/it, lr: 1.0e-04 loss: 1.663e-01]hash_cache_v1:  33%|###3      | 996/3000 [52:36<1:34:06,  2.82s/it, lr: 1.0e-04 loss: 6.485e-02]hash_cache_v1:  33%|###3      | 996/3000 [52:36<1:34:06,  2.82s/it, lr: 1.0e-04 loss: 6.485e-02]hash_cache_v1:  33%|###3      | 997/3000 [52:36<1:35:32,  2.86s/it, lr: 1.0e-04 loss: 6.485e-02]hash_cache_v1:  33%|###3      | 997/3000 [52:36<1:35:32,  2.86s/it, lr: 1.0e-04 loss: 6.485e-02]hash_cache_v1:  33%|###3      | 997/3000 [52:40<1:35:32,  2.86s/it, lr: 1.0e-04 loss: 3.471e-02]hash_cache_v1:  33%|###3      | 997/3000 [52:40<1:35:32,  2.86s/it, lr: 1.0e-04 loss: 3.471e-02]hash_cache_v1:  33%|###3      | 998/3000 [52:40<1:49:32,  3.28s/it, lr: 1.0e-04 loss: 3.471e-02]hash_cache_v1:  33%|###3      | 998/3000 [52:40<1:49:32,  3.28s/it, lr: 1.0e-04 loss: 3.471e-02]hash_cache_v1:  33%|###3      | 998/3000 [52:42<1:49:32,  3.28s/it, lr: 1.0e-04 loss: 3.265e-02]hash_cache_v1:  33%|###3      | 998/3000 [52:42<1:49:32,  3.28s/it, lr: 1.0e-04 loss: 3.265e-02]hash_cache_v1:  33%|###3      | 999/3000 [52:42<1:37:59,  2.94s/it, lr: 1.0e-04 loss: 3.265e-02]hash_cache_v1:  33%|###3      | 999/3000 [52:42<1:37:59,  2.94s/it, lr: 1.0e-04 loss: 3.265e-02]hash_cache_v1:  33%|###3      | 999/3000 [52:45<1:37:59,  2.94s/it, lr: 1.0e-04 loss: 8.305e-02]hash_cache_v1:  33%|###3      | 999/3000 [52:45<1:37:59,  2.94s/it, lr: 1.0e-04 loss: 8.305e-02]
+Saving at step 1000
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001000.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.91s/it]Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.91s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.25s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.25s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.40s/it]Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.40s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.39s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.39s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  33%|###3      | 1000/3000 [52:48<1:37:56,  2.94s/it, lr: 1.0e-04 loss: 1.291e-01]hash_cache_v1:  33%|###3      | 1000/3000 [52:48<1:37:56,  2.94s/it, lr: 1.0e-04 loss: 1.291e-01]hash_cache_v1:  33%|###3      | 1001/3000 [52:48<1:16:59,  2.31s/it, lr: 1.0e-04 loss: 1.291e-01]hash_cache_v1:  33%|###3      | 1001/3000 [52:48<1:16:59,  2.31s/it, lr: 1.0e-04 loss: 1.291e-01]hash_cache_v1:  33%|###3      | 1001/3000 [52:51<1:16:59,  2.31s/it, lr: 1.0e-04 loss: 1.308e-01]hash_cache_v1:  33%|###3      | 1001/3000 [52:51<1:16:59,  2.31s/it, lr: 1.0e-04 loss: 1.308e-01]hash_cache_v1:  33%|###3      | 1002/3000 [52:51<1:20:37,  2.42s/it, lr: 1.0e-04 loss: 1.308e-01]hash_cache_v1:  33%|###3      | 1002/3000 [52:51<1:20:37,  2.42s/it, lr: 1.0e-04 loss: 1.308e-01]hash_cache_v1:  33%|###3      | 1002/3000 [52:53<1:20:37,  2.42s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  33%|###3      | 1002/3000 [52:53<1:20:37,  2.42s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  33%|###3      | 1003/3000 [52:53<1:17:53,  2.34s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  33%|###3      | 1003/3000 [52:53<1:17:53,  2.34s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  33%|###3      | 1003/3000 [52:58<1:17:53,  2.34s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  33%|###3      | 1003/3000 [52:58<1:17:53,  2.34s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  33%|###3      | 1004/3000 [52:58<1:37:26,  2.93s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  33%|###3      | 1004/3000 [52:58<1:37:26,  2.93s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  33%|###3      | 1004/3000 [53:01<1:37:26,  2.93s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  33%|###3      | 1004/3000 [53:01<1:37:26,  2.93s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  34%|###3      | 1005/3000 [53:01<1:36:48,  2.91s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  34%|###3      | 1005/3000 [53:01<1:36:48,  2.91s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  34%|###3      | 1005/3000 [53:03<1:36:48,  2.91s/it, lr: 1.0e-04 loss: 1.873e-01]hash_cache_v1:  34%|###3      | 1005/3000 [53:03<1:36:48,  2.91s/it, lr: 1.0e-04 loss: 1.873e-01]hash_cache_v1:  34%|###3      | 1006/3000 [53:03<1:36:28,  2.90s/it, lr: 1.0e-04 loss: 1.873e-01]hash_cache_v1:  34%|###3      | 1006/3000 [53:03<1:36:28,  2.90s/it, lr: 1.0e-04 loss: 1.873e-01]hash_cache_v1:  34%|###3      | 1006/3000 [53:06<1:36:28,  2.90s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  34%|###3      | 1006/3000 [53:06<1:36:28,  2.90s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  34%|###3      | 1007/3000 [53:06<1:37:49,  2.95s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  34%|###3      | 1007/3000 [53:06<1:37:49,  2.95s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  34%|###3      | 1007/3000 [53:11<1:37:49,  2.95s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  34%|###3      | 1007/3000 [53:11<1:37:49,  2.95s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  34%|###3      | 1008/3000 [53:11<1:51:13,  3.35s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  34%|###3      | 1008/3000 [53:11<1:51:13,  3.35s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  34%|###3      | 1008/3000 [53:14<1:51:13,  3.35s/it, lr: 1.0e-04 loss: 1.809e-01]hash_cache_v1:  34%|###3      | 1008/3000 [53:14<1:51:13,  3.35s/it, lr: 1.0e-04 loss: 1.809e-01]hash_cache_v1:  34%|###3      | 1009/3000 [53:14<1:46:14,  3.20s/it, lr: 1.0e-04 loss: 1.809e-01]hash_cache_v1:  34%|###3      | 1009/3000 [53:14<1:46:14,  3.20s/it, lr: 1.0e-04 loss: 1.809e-01]hash_cache_v1:  34%|###3      | 1009/3000 [53:18<1:46:14,  3.20s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  34%|###3      | 1009/3000 [53:18<1:46:14,  3.20s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  34%|###3      | 1010/3000 [53:22<1:46:11,  3.20s/it, lr: 1.0e-04 loss: 8.227e-02]hash_cache_v1:  34%|###3      | 1010/3000 [53:22<1:46:11,  3.20s/it, lr: 1.0e-04 loss: 8.227e-02]hash_cache_v1:  34%|###3      | 1011/3000 [53:22<1:31:44,  2.77s/it, lr: 1.0e-04 loss: 8.227e-02]hash_cache_v1:  34%|###3      | 1011/3000 [53:22<1:31:44,  2.77s/it, lr: 1.0e-04 loss: 8.227e-02]hash_cache_v1:  34%|###3      | 1011/3000 [53:25<1:31:44,  2.77s/it, lr: 1.0e-04 loss: 5.502e-02]hash_cache_v1:  34%|###3      | 1011/3000 [53:25<1:31:44,  2.77s/it, lr: 1.0e-04 loss: 5.502e-02]hash_cache_v1:  34%|###3      | 1012/3000 [53:25<1:32:16,  2.79s/it, lr: 1.0e-04 loss: 5.502e-02]hash_cache_v1:  34%|###3      | 1012/3000 [53:25<1:32:16,  2.79s/it, lr: 1.0e-04 loss: 5.502e-02]hash_cache_v1:  34%|###3      | 1012/3000 [53:30<1:32:16,  2.79s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  34%|###3      | 1012/3000 [53:30<1:32:16,  2.79s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  34%|###3      | 1013/3000 [53:30<1:45:14,  3.18s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  34%|###3      | 1013/3000 [53:30<1:45:14,  3.18s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  34%|###3      | 1013/3000 [53:32<1:45:14,  3.18s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  34%|###3      | 1013/3000 [53:32<1:45:14,  3.18s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  34%|###3      | 1014/3000 [53:32<1:35:27,  2.88s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  34%|###3      | 1014/3000 [53:32<1:35:27,  2.88s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  34%|###3      | 1014/3000 [53:34<1:35:27,  2.88s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  34%|###3      | 1014/3000 [53:34<1:35:27,  2.88s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  34%|###3      | 1015/3000 [53:34<1:30:43,  2.74s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  34%|###3      | 1015/3000 [53:34<1:30:43,  2.74s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  34%|###3      | 1015/3000 [53:37<1:30:43,  2.74s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  34%|###3      | 1015/3000 [53:37<1:30:43,  2.74s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  34%|###3      | 1016/3000 [53:37<1:31:51,  2.78s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  34%|###3      | 1016/3000 [53:37<1:31:51,  2.78s/it, lr: 1.0e-04 loss: 2.012e-01]hash_cache_v1:  34%|###3      | 1016/3000 [53:40<1:31:51,  2.78s/it, lr: 1.0e-04 loss: 1.094e-01]hash_cache_v1:  34%|###3      | 1016/3000 [53:40<1:31:51,  2.78s/it, lr: 1.0e-04 loss: 1.094e-01]hash_cache_v1:  34%|###3      | 1017/3000 [53:40<1:32:44,  2.81s/it, lr: 1.0e-04 loss: 1.094e-01]hash_cache_v1:  34%|###3      | 1017/3000 [53:40<1:32:44,  2.81s/it, lr: 1.0e-04 loss: 1.094e-01]hash_cache_v1:  34%|###3      | 1017/3000 [53:44<1:32:44,  2.81s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  34%|###3      | 1017/3000 [53:44<1:32:44,  2.81s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  34%|###3      | 1018/3000 [53:44<1:48:41,  3.29s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  34%|###3      | 1018/3000 [53:44<1:48:41,  3.29s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  34%|###3      | 1018/3000 [53:49<1:48:41,  3.29s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  34%|###3      | 1018/3000 [53:49<1:48:41,  3.29s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  34%|###3      | 1019/3000 [53:49<1:58:38,  3.59s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  34%|###3      | 1019/3000 [53:49<1:58:38,  3.59s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  34%|###3      | 1019/3000 [53:51<1:58:38,  3.59s/it, lr: 1.0e-04 loss: 2.266e-01]hash_cache_v1:  34%|###3      | 1019/3000 [53:51<1:58:38,  3.59s/it, lr: 1.0e-04 loss: 2.266e-01]hash_cache_v1:  34%|###4      | 1020/3000 [53:55<1:58:35,  3.59s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  34%|###4      | 1020/3000 [53:55<1:58:35,  3.59s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  34%|###4      | 1021/3000 [53:55<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  34%|###4      | 1021/3000 [53:55<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  34%|###4      | 1021/3000 [53:58<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.713e-02]hash_cache_v1:  34%|###4      | 1021/3000 [53:58<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.713e-02]hash_cache_v1:  34%|###4      | 1022/3000 [53:58<1:38:07,  2.98s/it, lr: 1.0e-04 loss: 1.713e-02]hash_cache_v1:  34%|###4      | 1022/3000 [53:58<1:38:07,  2.98s/it, lr: 1.0e-04 loss: 1.713e-02]hash_cache_v1:  34%|###4      | 1022/3000 [54:01<1:38:07,  2.98s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  34%|###4      | 1022/3000 [54:01<1:38:07,  2.98s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  34%|###4      | 1023/3000 [54:01<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  34%|###4      | 1023/3000 [54:01<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  34%|###4      | 1023/3000 [54:05<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:  34%|###4      | 1023/3000 [54:05<1:36:56,  2.94s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:  34%|###4      | 1024/3000 [54:05<1:49:12,  3.32s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:  34%|###4      | 1024/3000 [54:05<1:49:12,  3.32s/it, lr: 1.0e-04 loss: 1.408e-01]hash_cache_v1:  34%|###4      | 1024/3000 [54:10<1:49:12,  3.32s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  34%|###4      | 1024/3000 [54:10<1:49:12,  3.32s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  34%|###4      | 1025/3000 [54:10<2:00:03,  3.65s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  34%|###4      | 1025/3000 [54:10<2:00:03,  3.65s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  34%|###4      | 1025/3000 [54:12<2:00:03,  3.65s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  34%|###4      | 1025/3000 [54:12<2:00:03,  3.65s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  34%|###4      | 1026/3000 [54:12<1:45:32,  3.21s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  34%|###4      | 1026/3000 [54:12<1:45:32,  3.21s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  34%|###4      | 1026/3000 [54:16<1:45:32,  3.21s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  34%|###4      | 1026/3000 [54:16<1:45:32,  3.21s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  34%|###4      | 1027/3000 [54:16<1:55:43,  3.52s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  34%|###4      | 1027/3000 [54:16<1:55:43,  3.52s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  34%|###4      | 1027/3000 [54:18<1:55:43,  3.52s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  34%|###4      | 1027/3000 [54:18<1:55:43,  3.52s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  34%|###4      | 1028/3000 [54:18<1:42:03,  3.11s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  34%|###4      | 1028/3000 [54:18<1:42:03,  3.11s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  34%|###4      | 1028/3000 [54:21<1:42:03,  3.11s/it, lr: 1.0e-04 loss: 2.104e-01]hash_cache_v1:  34%|###4      | 1028/3000 [54:21<1:42:03,  3.11s/it, lr: 1.0e-04 loss: 2.104e-01]hash_cache_v1:  34%|###4      | 1029/3000 [54:21<1:34:57,  2.89s/it, lr: 1.0e-04 loss: 2.104e-01]hash_cache_v1:  34%|###4      | 1029/3000 [54:21<1:34:57,  2.89s/it, lr: 1.0e-04 loss: 2.104e-01]hash_cache_v1:  34%|###4      | 1029/3000 [54:25<1:34:57,  2.89s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  34%|###4      | 1029/3000 [54:25<1:34:57,  2.89s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  34%|###4      | 1030/3000 [54:27<1:34:54,  2.89s/it, lr: 1.0e-04 loss: 2.353e-01]hash_cache_v1:  34%|###4      | 1030/3000 [54:27<1:34:54,  2.89s/it, lr: 1.0e-04 loss: 2.353e-01]hash_cache_v1:  34%|###4      | 1031/3000 [54:27<1:07:20,  2.05s/it, lr: 1.0e-04 loss: 2.353e-01]hash_cache_v1:  34%|###4      | 1031/3000 [54:27<1:07:20,  2.05s/it, lr: 1.0e-04 loss: 2.353e-01]hash_cache_v1:  34%|###4      | 1031/3000 [54:30<1:07:20,  2.05s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  34%|###4      | 1031/3000 [54:30<1:07:20,  2.05s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  34%|###4      | 1032/3000 [54:30<1:15:14,  2.29s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  34%|###4      | 1032/3000 [54:30<1:15:14,  2.29s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  34%|###4      | 1032/3000 [54:33<1:15:14,  2.29s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  34%|###4      | 1032/3000 [54:33<1:15:14,  2.29s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  34%|###4      | 1033/3000 [54:33<1:19:49,  2.43s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  34%|###4      | 1033/3000 [54:33<1:19:49,  2.43s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  34%|###4      | 1033/3000 [54:35<1:19:49,  2.43s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  34%|###4      | 1033/3000 [54:35<1:19:49,  2.43s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  34%|###4      | 1034/3000 [54:35<1:16:52,  2.35s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  34%|###4      | 1034/3000 [54:35<1:16:52,  2.35s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  34%|###4      | 1034/3000 [54:38<1:16:52,  2.35s/it, lr: 1.0e-04 loss: 1.962e-01]hash_cache_v1:  34%|###4      | 1034/3000 [54:38<1:16:52,  2.35s/it, lr: 1.0e-04 loss: 1.962e-01]hash_cache_v1:  34%|###4      | 1035/3000 [54:38<1:21:42,  2.50s/it, lr: 1.0e-04 loss: 1.962e-01]hash_cache_v1:  34%|###4      | 1035/3000 [54:38<1:21:42,  2.50s/it, lr: 1.0e-04 loss: 1.962e-01]hash_cache_v1:  34%|###4      | 1035/3000 [54:40<1:21:42,  2.50s/it, lr: 1.0e-04 loss: 2.203e-01]hash_cache_v1:  34%|###4      | 1035/3000 [54:40<1:21:42,  2.50s/it, lr: 1.0e-04 loss: 2.203e-01]hash_cache_v1:  35%|###4      | 1036/3000 [54:40<1:20:27,  2.46s/it, lr: 1.0e-04 loss: 2.203e-01]hash_cache_v1:  35%|###4      | 1036/3000 [54:40<1:20:27,  2.46s/it, lr: 1.0e-04 loss: 2.203e-01]hash_cache_v1:  35%|###4      | 1036/3000 [54:42<1:20:27,  2.46s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  35%|###4      | 1036/3000 [54:42<1:20:27,  2.46s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  35%|###4      | 1037/3000 [54:42<1:17:06,  2.36s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  35%|###4      | 1037/3000 [54:42<1:17:06,  2.36s/it, lr: 1.0e-04 loss: 1.682e-01]hash_cache_v1:  35%|###4      | 1037/3000 [54:44<1:17:06,  2.36s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  35%|###4      | 1037/3000 [54:44<1:17:06,  2.36s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  35%|###4      | 1038/3000 [54:44<1:14:39,  2.28s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  35%|###4      | 1038/3000 [54:44<1:14:39,  2.28s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  35%|###4      | 1038/3000 [54:48<1:14:39,  2.28s/it, lr: 1.0e-04 loss: 2.005e-01]hash_cache_v1:  35%|###4      | 1038/3000 [54:48<1:14:39,  2.28s/it, lr: 1.0e-04 loss: 2.005e-01]hash_cache_v1:  35%|###4      | 1039/3000 [54:48<1:22:49,  2.53s/it, lr: 1.0e-04 loss: 2.005e-01]hash_cache_v1:  35%|###4      | 1039/3000 [54:48<1:22:49,  2.53s/it, lr: 1.0e-04 loss: 2.005e-01]hash_cache_v1:  35%|###4      | 1039/3000 [54:50<1:22:49,  2.53s/it, lr: 1.0e-04 loss: 7.807e-02]hash_cache_v1:  35%|###4      | 1039/3000 [54:50<1:22:49,  2.53s/it, lr: 1.0e-04 loss: 7.807e-02]hash_cache_v1:  35%|###4      | 1040/3000 [54:52<1:22:47,  2.53s/it, lr: 1.0e-04 loss: 8.508e-02]hash_cache_v1:  35%|###4      | 1040/3000 [54:52<1:22:47,  2.53s/it, lr: 1.0e-04 loss: 8.508e-02]hash_cache_v1:  35%|###4      | 1041/3000 [54:52<1:00:36,  1.86s/it, lr: 1.0e-04 loss: 8.508e-02]hash_cache_v1:  35%|###4      | 1041/3000 [54:52<1:00:36,  1.86s/it, lr: 1.0e-04 loss: 8.508e-02]hash_cache_v1:  35%|###4      | 1041/3000 [54:54<1:00:36,  1.86s/it, lr: 1.0e-04 loss: 1.849e-01]hash_cache_v1:  35%|###4      | 1041/3000 [54:54<1:00:36,  1.86s/it, lr: 1.0e-04 loss: 1.849e-01]hash_cache_v1:  35%|###4      | 1042/3000 [54:54<1:02:33,  1.92s/it, lr: 1.0e-04 loss: 1.849e-01]hash_cache_v1:  35%|###4      | 1042/3000 [54:54<1:02:33,  1.92s/it, lr: 1.0e-04 loss: 1.849e-01]hash_cache_v1:  35%|###4      | 1042/3000 [54:58<1:02:33,  1.92s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  35%|###4      | 1042/3000 [54:58<1:02:33,  1.92s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  35%|###4      | 1043/3000 [54:58<1:23:21,  2.56s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  35%|###4      | 1043/3000 [54:58<1:23:21,  2.56s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  35%|###4      | 1043/3000 [55:01<1:23:21,  2.56s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  35%|###4      | 1043/3000 [55:01<1:23:21,  2.56s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  35%|###4      | 1044/3000 [55:01<1:26:08,  2.64s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  35%|###4      | 1044/3000 [55:01<1:26:08,  2.64s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  35%|###4      | 1044/3000 [55:03<1:26:08,  2.64s/it, lr: 1.0e-04 loss: 1.739e-01]hash_cache_v1:  35%|###4      | 1044/3000 [55:03<1:26:08,  2.64s/it, lr: 1.0e-04 loss: 1.739e-01]hash_cache_v1:  35%|###4      | 1045/3000 [55:03<1:20:59,  2.49s/it, lr: 1.0e-04 loss: 1.739e-01]hash_cache_v1:  35%|###4      | 1045/3000 [55:03<1:20:59,  2.49s/it, lr: 1.0e-04 loss: 1.739e-01]hash_cache_v1:  35%|###4      | 1045/3000 [55:08<1:20:59,  2.49s/it, lr: 1.0e-04 loss: 2.529e-02]hash_cache_v1:  35%|###4      | 1045/3000 [55:08<1:20:59,  2.49s/it, lr: 1.0e-04 loss: 2.529e-02]hash_cache_v1:  35%|###4      | 1046/3000 [55:08<1:39:47,  3.06s/it, lr: 1.0e-04 loss: 2.529e-02]hash_cache_v1:  35%|###4      | 1046/3000 [55:08<1:39:47,  3.06s/it, lr: 1.0e-04 loss: 2.529e-02]hash_cache_v1:  35%|###4      | 1046/3000 [55:10<1:39:47,  3.06s/it, lr: 1.0e-04 loss: 2.606e-01]hash_cache_v1:  35%|###4      | 1046/3000 [55:10<1:39:47,  3.06s/it, lr: 1.0e-04 loss: 2.606e-01]hash_cache_v1:  35%|###4      | 1047/3000 [55:10<1:30:41,  2.79s/it, lr: 1.0e-04 loss: 2.606e-01]hash_cache_v1:  35%|###4      | 1047/3000 [55:10<1:30:41,  2.79s/it, lr: 1.0e-04 loss: 2.606e-01]hash_cache_v1:  35%|###4      | 1047/3000 [55:12<1:30:41,  2.79s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  35%|###4      | 1047/3000 [55:12<1:30:41,  2.79s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  35%|###4      | 1048/3000 [55:12<1:24:06,  2.59s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  35%|###4      | 1048/3000 [55:12<1:24:06,  2.59s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  35%|###4      | 1048/3000 [55:14<1:24:06,  2.59s/it, lr: 1.0e-04 loss: 2.196e-01]hash_cache_v1:  35%|###4      | 1048/3000 [55:14<1:24:06,  2.59s/it, lr: 1.0e-04 loss: 2.196e-01]hash_cache_v1:  35%|###4      | 1049/3000 [55:14<1:19:24,  2.44s/it, lr: 1.0e-04 loss: 2.196e-01]hash_cache_v1:  35%|###4      | 1049/3000 [55:14<1:19:24,  2.44s/it, lr: 1.0e-04 loss: 2.196e-01]hash_cache_v1:  35%|###4      | 1049/3000 [55:16<1:19:24,  2.44s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  35%|###4      | 1049/3000 [55:16<1:19:24,  2.44s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  35%|###5      | 1050/3000 [55:21<1:19:22,  2.44s/it, lr: 1.0e-04 loss: 7.692e-02]hash_cache_v1:  35%|###5      | 1050/3000 [55:21<1:19:22,  2.44s/it, lr: 1.0e-04 loss: 7.692e-02]hash_cache_v1:  35%|###5      | 1051/3000 [55:21<1:14:50,  2.30s/it, lr: 1.0e-04 loss: 7.692e-02]hash_cache_v1:  35%|###5      | 1051/3000 [55:21<1:14:50,  2.30s/it, lr: 1.0e-04 loss: 7.692e-02]hash_cache_v1:  35%|###5      | 1051/3000 [55:23<1:14:50,  2.30s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  35%|###5      | 1051/3000 [55:23<1:14:50,  2.30s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  35%|###5      | 1052/3000 [55:23<1:13:11,  2.25s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  35%|###5      | 1052/3000 [55:23<1:13:11,  2.25s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  35%|###5      | 1052/3000 [55:27<1:13:11,  2.25s/it, lr: 1.0e-04 loss: 1.583e-01]hash_cache_v1:  35%|###5      | 1052/3000 [55:27<1:13:11,  2.25s/it, lr: 1.0e-04 loss: 1.583e-01]hash_cache_v1:  35%|###5      | 1053/3000 [55:27<1:30:10,  2.78s/it, lr: 1.0e-04 loss: 1.583e-01]hash_cache_v1:  35%|###5      | 1053/3000 [55:27<1:30:10,  2.78s/it, lr: 1.0e-04 loss: 1.583e-01]hash_cache_v1:  35%|###5      | 1053/3000 [55:30<1:30:10,  2.78s/it, lr: 1.0e-04 loss: 1.472e-01]hash_cache_v1:  35%|###5      | 1053/3000 [55:30<1:30:10,  2.78s/it, lr: 1.0e-04 loss: 1.472e-01]hash_cache_v1:  35%|###5      | 1054/3000 [55:30<1:32:46,  2.86s/it, lr: 1.0e-04 loss: 1.472e-01]hash_cache_v1:  35%|###5      | 1054/3000 [55:30<1:32:46,  2.86s/it, lr: 1.0e-04 loss: 1.472e-01]hash_cache_v1:  35%|###5      | 1054/3000 [55:32<1:32:46,  2.86s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  35%|###5      | 1054/3000 [55:32<1:32:46,  2.86s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  35%|###5      | 1055/3000 [55:32<1:25:50,  2.65s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  35%|###5      | 1055/3000 [55:32<1:25:50,  2.65s/it, lr: 1.0e-04 loss: 1.840e-01]hash_cache_v1:  35%|###5      | 1055/3000 [55:37<1:25:50,  2.65s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  35%|###5      | 1055/3000 [55:37<1:25:50,  2.65s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  35%|###5      | 1056/3000 [55:37<1:41:09,  3.12s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  35%|###5      | 1056/3000 [55:37<1:41:09,  3.12s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  35%|###5      | 1056/3000 [55:41<1:41:09,  3.12s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  35%|###5      | 1056/3000 [55:41<1:41:09,  3.12s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  35%|###5      | 1057/3000 [55:41<1:53:34,  3.51s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  35%|###5      | 1057/3000 [55:41<1:53:34,  3.51s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  35%|###5      | 1057/3000 [55:43<1:53:34,  3.51s/it, lr: 1.0e-04 loss: 6.336e-02]hash_cache_v1:  35%|###5      | 1057/3000 [55:43<1:53:34,  3.51s/it, lr: 1.0e-04 loss: 6.336e-02]hash_cache_v1:  35%|###5      | 1058/3000 [55:43<1:40:13,  3.10s/it, lr: 1.0e-04 loss: 6.336e-02]hash_cache_v1:  35%|###5      | 1058/3000 [55:43<1:40:13,  3.10s/it, lr: 1.0e-04 loss: 6.336e-02]hash_cache_v1:  35%|###5      | 1058/3000 [55:45<1:40:13,  3.10s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  35%|###5      | 1058/3000 [55:45<1:40:13,  3.10s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  35%|###5      | 1059/3000 [55:45<1:30:42,  2.80s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  35%|###5      | 1059/3000 [55:45<1:30:42,  2.80s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  35%|###5      | 1059/3000 [55:48<1:30:42,  2.80s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  35%|###5      | 1059/3000 [55:48<1:30:42,  2.80s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  35%|###5      | 1060/3000 [55:53<1:30:39,  2.80s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  35%|###5      | 1060/3000 [55:53<1:30:39,  2.80s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  35%|###5      | 1061/3000 [55:53<1:22:21,  2.55s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  35%|###5      | 1061/3000 [55:53<1:22:21,  2.55s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  35%|###5      | 1061/3000 [55:55<1:22:21,  2.55s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  35%|###5      | 1061/3000 [55:55<1:22:21,  2.55s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  35%|###5      | 1062/3000 [55:55<1:18:32,  2.43s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  35%|###5      | 1062/3000 [55:55<1:18:32,  2.43s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  35%|###5      | 1062/3000 [55:57<1:18:32,  2.43s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  35%|###5      | 1062/3000 [55:57<1:18:32,  2.43s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  35%|###5      | 1063/3000 [55:57<1:15:28,  2.34s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  35%|###5      | 1063/3000 [55:57<1:15:28,  2.34s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  35%|###5      | 1063/3000 [56:00<1:15:28,  2.34s/it, lr: 1.0e-04 loss: 1.985e-01]hash_cache_v1:  35%|###5      | 1063/3000 [56:00<1:15:28,  2.34s/it, lr: 1.0e-04 loss: 1.985e-01]hash_cache_v1:  35%|###5      | 1064/3000 [56:00<1:20:00,  2.48s/it, lr: 1.0e-04 loss: 1.985e-01]hash_cache_v1:  35%|###5      | 1064/3000 [56:00<1:20:00,  2.48s/it, lr: 1.0e-04 loss: 1.985e-01]hash_cache_v1:  35%|###5      | 1064/3000 [56:02<1:20:00,  2.48s/it, lr: 1.0e-04 loss: 2.024e-01]hash_cache_v1:  35%|###5      | 1064/3000 [56:02<1:20:00,  2.48s/it, lr: 1.0e-04 loss: 2.024e-01]hash_cache_v1:  36%|###5      | 1065/3000 [56:02<1:18:35,  2.44s/it, lr: 1.0e-04 loss: 2.024e-01]hash_cache_v1:  36%|###5      | 1065/3000 [56:02<1:18:35,  2.44s/it, lr: 1.0e-04 loss: 2.024e-01]hash_cache_v1:  36%|###5      | 1065/3000 [56:06<1:18:35,  2.44s/it, lr: 1.0e-04 loss: 8.740e-02]hash_cache_v1:  36%|###5      | 1065/3000 [56:06<1:18:35,  2.44s/it, lr: 1.0e-04 loss: 8.740e-02]hash_cache_v1:  36%|###5      | 1066/3000 [56:06<1:35:18,  2.96s/it, lr: 1.0e-04 loss: 8.740e-02]hash_cache_v1:  36%|###5      | 1066/3000 [56:06<1:35:18,  2.96s/it, lr: 1.0e-04 loss: 8.740e-02]hash_cache_v1:  36%|###5      | 1066/3000 [56:11<1:35:18,  2.96s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  36%|###5      | 1066/3000 [56:11<1:35:18,  2.96s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  36%|###5      | 1067/3000 [56:11<1:47:40,  3.34s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  36%|###5      | 1067/3000 [56:11<1:47:40,  3.34s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  36%|###5      | 1067/3000 [56:14<1:47:40,  3.34s/it, lr: 1.0e-04 loss: 4.633e-02]hash_cache_v1:  36%|###5      | 1067/3000 [56:14<1:47:40,  3.34s/it, lr: 1.0e-04 loss: 4.633e-02]hash_cache_v1:  36%|###5      | 1068/3000 [56:14<1:44:52,  3.26s/it, lr: 1.0e-04 loss: 4.633e-02]hash_cache_v1:  36%|###5      | 1068/3000 [56:14<1:44:52,  3.26s/it, lr: 1.0e-04 loss: 4.633e-02]hash_cache_v1:  36%|###5      | 1068/3000 [56:16<1:44:52,  3.26s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  36%|###5      | 1068/3000 [56:16<1:44:52,  3.26s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  36%|###5      | 1069/3000 [56:16<1:41:07,  3.14s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  36%|###5      | 1069/3000 [56:16<1:41:07,  3.14s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  36%|###5      | 1069/3000 [56:19<1:41:07,  3.14s/it, lr: 1.0e-04 loss: 1.753e-01]hash_cache_v1:  36%|###5      | 1069/3000 [56:19<1:41:07,  3.14s/it, lr: 1.0e-04 loss: 1.753e-01]hash_cache_v1:  36%|###5      | 1070/3000 [56:21<1:41:04,  3.14s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:  36%|###5      | 1070/3000 [56:21<1:41:04,  3.14s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:  36%|###5      | 1071/3000 [56:21<1:10:09,  2.18s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:  36%|###5      | 1071/3000 [56:21<1:10:09,  2.18s/it, lr: 1.0e-04 loss: 2.045e-01]hash_cache_v1:  36%|###5      | 1071/3000 [56:26<1:10:09,  2.18s/it, lr: 1.0e-04 loss: 7.695e-02]hash_cache_v1:  36%|###5      | 1071/3000 [56:26<1:10:09,  2.18s/it, lr: 1.0e-04 loss: 7.695e-02]hash_cache_v1:  36%|###5      | 1072/3000 [56:26<1:28:23,  2.75s/it, lr: 1.0e-04 loss: 7.695e-02]hash_cache_v1:  36%|###5      | 1072/3000 [56:26<1:28:23,  2.75s/it, lr: 1.0e-04 loss: 7.695e-02]hash_cache_v1:  36%|###5      | 1072/3000 [56:30<1:28:23,  2.75s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  36%|###5      | 1072/3000 [56:30<1:28:23,  2.75s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  36%|###5      | 1073/3000 [56:30<1:41:03,  3.15s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  36%|###5      | 1073/3000 [56:30<1:41:03,  3.15s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  36%|###5      | 1073/3000 [56:34<1:41:03,  3.15s/it, lr: 1.0e-04 loss: 7.813e-02]hash_cache_v1:  36%|###5      | 1073/3000 [56:34<1:41:03,  3.15s/it, lr: 1.0e-04 loss: 7.813e-02]hash_cache_v1:  36%|###5      | 1074/3000 [56:34<1:51:06,  3.46s/it, lr: 1.0e-04 loss: 7.813e-02]hash_cache_v1:  36%|###5      | 1074/3000 [56:34<1:51:06,  3.46s/it, lr: 1.0e-04 loss: 7.813e-02]hash_cache_v1:  36%|###5      | 1074/3000 [56:37<1:51:06,  3.46s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:  36%|###5      | 1074/3000 [56:37<1:51:06,  3.46s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:  36%|###5      | 1075/3000 [56:37<1:45:42,  3.29s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:  36%|###5      | 1075/3000 [56:37<1:45:42,  3.29s/it, lr: 1.0e-04 loss: 1.182e-01]hash_cache_v1:  36%|###5      | 1075/3000 [56:42<1:45:42,  3.29s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  36%|###5      | 1075/3000 [56:42<1:45:42,  3.29s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  36%|###5      | 1076/3000 [56:42<1:57:08,  3.65s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  36%|###5      | 1076/3000 [56:42<1:57:08,  3.65s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  36%|###5      | 1076/3000 [56:45<1:57:08,  3.65s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  36%|###5      | 1076/3000 [56:45<1:57:08,  3.65s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  36%|###5      | 1077/3000 [56:45<1:49:45,  3.42s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  36%|###5      | 1077/3000 [56:45<1:49:45,  3.42s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  36%|###5      | 1077/3000 [56:49<1:49:45,  3.42s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  36%|###5      | 1077/3000 [56:49<1:49:45,  3.42s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  36%|###5      | 1078/3000 [56:49<1:57:44,  3.68s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  36%|###5      | 1078/3000 [56:49<1:57:44,  3.68s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  36%|###5      | 1078/3000 [56:52<1:57:44,  3.68s/it, lr: 1.0e-04 loss: 2.919e-02]hash_cache_v1:  36%|###5      | 1078/3000 [56:52<1:57:44,  3.68s/it, lr: 1.0e-04 loss: 2.919e-02]hash_cache_v1:  36%|###5      | 1079/3000 [56:52<1:52:13,  3.50s/it, lr: 1.0e-04 loss: 2.919e-02]hash_cache_v1:  36%|###5      | 1079/3000 [56:52<1:52:13,  3.50s/it, lr: 1.0e-04 loss: 2.919e-02]hash_cache_v1:  36%|###5      | 1079/3000 [56:54<1:52:13,  3.50s/it, lr: 1.0e-04 loss: 5.989e-02]hash_cache_v1:  36%|###5      | 1079/3000 [56:54<1:52:13,  3.50s/it, lr: 1.0e-04 loss: 5.989e-02]hash_cache_v1:  36%|###6      | 1080/3000 [56:57<1:52:09,  3.50s/it, lr: 1.0e-04 loss: 2.627e-02]hash_cache_v1:  36%|###6      | 1080/3000 [56:57<1:52:09,  3.50s/it, lr: 1.0e-04 loss: 2.627e-02]hash_cache_v1:  36%|###6      | 1081/3000 [56:57<1:21:35,  2.55s/it, lr: 1.0e-04 loss: 2.627e-02]hash_cache_v1:  36%|###6      | 1081/3000 [56:57<1:21:35,  2.55s/it, lr: 1.0e-04 loss: 2.627e-02]hash_cache_v1:  36%|###6      | 1081/3000 [57:02<1:21:35,  2.55s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  36%|###6      | 1081/3000 [57:02<1:21:35,  2.55s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  36%|###6      | 1082/3000 [57:02<1:35:32,  2.99s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  36%|###6      | 1082/3000 [57:02<1:35:32,  2.99s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  36%|###6      | 1082/3000 [57:05<1:35:32,  2.99s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  36%|###6      | 1082/3000 [57:05<1:35:32,  2.99s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  36%|###6      | 1083/3000 [57:05<1:37:31,  3.05s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  36%|###6      | 1083/3000 [57:05<1:37:31,  3.05s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  36%|###6      | 1083/3000 [57:09<1:37:31,  3.05s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  36%|###6      | 1083/3000 [57:09<1:37:31,  3.05s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  36%|###6      | 1084/3000 [57:09<1:48:23,  3.39s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  36%|###6      | 1084/3000 [57:09<1:48:23,  3.39s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  36%|###6      | 1084/3000 [57:11<1:48:23,  3.39s/it, lr: 1.0e-04 loss: 2.186e-01]hash_cache_v1:  36%|###6      | 1084/3000 [57:11<1:48:23,  3.39s/it, lr: 1.0e-04 loss: 2.186e-01]hash_cache_v1:  36%|###6      | 1085/3000 [57:11<1:36:54,  3.04s/it, lr: 1.0e-04 loss: 2.186e-01]hash_cache_v1:  36%|###6      | 1085/3000 [57:11<1:36:54,  3.04s/it, lr: 1.0e-04 loss: 2.186e-01]hash_cache_v1:  36%|###6      | 1085/3000 [57:14<1:36:54,  3.04s/it, lr: 1.0e-04 loss: 1.641e-01]hash_cache_v1:  36%|###6      | 1085/3000 [57:14<1:36:54,  3.04s/it, lr: 1.0e-04 loss: 1.641e-01]hash_cache_v1:  36%|###6      | 1086/3000 [57:14<1:37:17,  3.05s/it, lr: 1.0e-04 loss: 1.641e-01]hash_cache_v1:  36%|###6      | 1086/3000 [57:14<1:37:17,  3.05s/it, lr: 1.0e-04 loss: 1.641e-01]hash_cache_v1:  36%|###6      | 1086/3000 [57:17<1:37:17,  3.05s/it, lr: 1.0e-04 loss: 1.158e-01]hash_cache_v1:  36%|###6      | 1086/3000 [57:17<1:37:17,  3.05s/it, lr: 1.0e-04 loss: 1.158e-01]hash_cache_v1:  36%|###6      | 1087/3000 [57:17<1:28:38,  2.78s/it, lr: 1.0e-04 loss: 1.158e-01]hash_cache_v1:  36%|###6      | 1087/3000 [57:17<1:28:38,  2.78s/it, lr: 1.0e-04 loss: 1.158e-01]hash_cache_v1:  36%|###6      | 1087/3000 [57:19<1:28:38,  2.78s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  36%|###6      | 1087/3000 [57:19<1:28:38,  2.78s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  36%|###6      | 1088/3000 [57:19<1:29:10,  2.80s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  36%|###6      | 1088/3000 [57:19<1:29:10,  2.80s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  36%|###6      | 1088/3000 [57:22<1:29:10,  2.80s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  36%|###6      | 1088/3000 [57:22<1:29:10,  2.80s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  36%|###6      | 1089/3000 [57:22<1:29:49,  2.82s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  36%|###6      | 1089/3000 [57:22<1:29:49,  2.82s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  36%|###6      | 1089/3000 [57:25<1:29:49,  2.82s/it, lr: 1.0e-04 loss: 3.120e-02]hash_cache_v1:  36%|###6      | 1089/3000 [57:25<1:29:49,  2.82s/it, lr: 1.0e-04 loss: 3.120e-02]hash_cache_v1:  36%|###6      | 1090/3000 [57:28<1:29:46,  2.82s/it, lr: 1.0e-04 loss: 1.584e-02]hash_cache_v1:  36%|###6      | 1090/3000 [57:28<1:29:46,  2.82s/it, lr: 1.0e-04 loss: 1.584e-02]hash_cache_v1:  36%|###6      | 1091/3000 [57:28<1:09:18,  2.18s/it, lr: 1.0e-04 loss: 1.584e-02]hash_cache_v1:  36%|###6      | 1091/3000 [57:28<1:09:18,  2.18s/it, lr: 1.0e-04 loss: 1.584e-02]hash_cache_v1:  36%|###6      | 1091/3000 [57:31<1:09:18,  2.18s/it, lr: 1.0e-04 loss: 9.003e-02]hash_cache_v1:  36%|###6      | 1091/3000 [57:31<1:09:18,  2.18s/it, lr: 1.0e-04 loss: 9.003e-02]hash_cache_v1:  36%|###6      | 1092/3000 [57:31<1:14:36,  2.35s/it, lr: 1.0e-04 loss: 9.003e-02]hash_cache_v1:  36%|###6      | 1092/3000 [57:31<1:14:36,  2.35s/it, lr: 1.0e-04 loss: 9.003e-02]hash_cache_v1:  36%|###6      | 1092/3000 [57:35<1:14:36,  2.35s/it, lr: 1.0e-04 loss: 1.628e-02]hash_cache_v1:  36%|###6      | 1092/3000 [57:35<1:14:36,  2.35s/it, lr: 1.0e-04 loss: 1.628e-02]hash_cache_v1:  36%|###6      | 1093/3000 [57:35<1:32:01,  2.90s/it, lr: 1.0e-04 loss: 1.628e-02]hash_cache_v1:  36%|###6      | 1093/3000 [57:35<1:32:01,  2.90s/it, lr: 1.0e-04 loss: 1.628e-02]hash_cache_v1:  36%|###6      | 1093/3000 [57:38<1:32:01,  2.90s/it, lr: 1.0e-04 loss: 4.620e-02]hash_cache_v1:  36%|###6      | 1093/3000 [57:38<1:32:01,  2.90s/it, lr: 1.0e-04 loss: 4.620e-02]hash_cache_v1:  36%|###6      | 1094/3000 [57:38<1:31:25,  2.88s/it, lr: 1.0e-04 loss: 4.620e-02]hash_cache_v1:  36%|###6      | 1094/3000 [57:38<1:31:25,  2.88s/it, lr: 1.0e-04 loss: 4.620e-02]hash_cache_v1:  36%|###6      | 1094/3000 [57:40<1:31:25,  2.88s/it, lr: 1.0e-04 loss: 2.790e-01]hash_cache_v1:  36%|###6      | 1094/3000 [57:40<1:31:25,  2.88s/it, lr: 1.0e-04 loss: 2.790e-01]hash_cache_v1:  36%|###6      | 1095/3000 [57:40<1:24:34,  2.66s/it, lr: 1.0e-04 loss: 2.790e-01]hash_cache_v1:  36%|###6      | 1095/3000 [57:40<1:24:34,  2.66s/it, lr: 1.0e-04 loss: 2.790e-01]hash_cache_v1:  36%|###6      | 1095/3000 [57:45<1:24:34,  2.66s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  36%|###6      | 1095/3000 [57:45<1:24:34,  2.66s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  37%|###6      | 1096/3000 [57:45<1:39:30,  3.14s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  37%|###6      | 1096/3000 [57:45<1:39:30,  3.14s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  37%|###6      | 1096/3000 [57:47<1:39:30,  3.14s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  37%|###6      | 1096/3000 [57:47<1:39:30,  3.14s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  37%|###6      | 1097/3000 [57:47<1:32:43,  2.92s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  37%|###6      | 1097/3000 [57:47<1:32:43,  2.92s/it, lr: 1.0e-04 loss: 1.554e-01]hash_cache_v1:  37%|###6      | 1097/3000 [57:49<1:32:43,  2.92s/it, lr: 1.0e-04 loss: 2.043e-01]hash_cache_v1:  37%|###6      | 1097/3000 [57:49<1:32:43,  2.92s/it, lr: 1.0e-04 loss: 2.043e-01]hash_cache_v1:  37%|###6      | 1098/3000 [57:49<1:25:10,  2.69s/it, lr: 1.0e-04 loss: 2.043e-01]hash_cache_v1:  37%|###6      | 1098/3000 [57:49<1:25:10,  2.69s/it, lr: 1.0e-04 loss: 2.043e-01]hash_cache_v1:  37%|###6      | 1098/3000 [57:51<1:25:10,  2.69s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  37%|###6      | 1098/3000 [57:51<1:25:10,  2.69s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  37%|###6      | 1099/3000 [57:51<1:19:46,  2.52s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  37%|###6      | 1099/3000 [57:51<1:19:46,  2.52s/it, lr: 1.0e-04 loss: 1.980e-01]hash_cache_v1:  37%|###6      | 1099/3000 [57:53<1:19:46,  2.52s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  37%|###6      | 1099/3000 [57:53<1:19:46,  2.52s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  37%|###6      | 1100/3000 [57:56<1:19:43,  2.52s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  37%|###6      | 1100/3000 [57:56<1:19:43,  2.52s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  37%|###6      | 1101/3000 [57:56<1:00:30,  1.91s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  37%|###6      | 1101/3000 [57:56<1:00:30,  1.91s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  37%|###6      | 1101/3000 [58:00<1:00:30,  1.91s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  37%|###6      | 1101/3000 [58:00<1:00:30,  1.91s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  37%|###6      | 1102/3000 [58:00<1:19:11,  2.50s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  37%|###6      | 1102/3000 [58:00<1:19:11,  2.50s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  37%|###6      | 1102/3000 [58:03<1:19:11,  2.50s/it, lr: 1.0e-04 loss: 1.444e-01]hash_cache_v1:  37%|###6      | 1102/3000 [58:03<1:19:11,  2.50s/it, lr: 1.0e-04 loss: 1.444e-01]hash_cache_v1:  37%|###6      | 1103/3000 [58:03<1:22:10,  2.60s/it, lr: 1.0e-04 loss: 1.444e-01]hash_cache_v1:  37%|###6      | 1103/3000 [58:03<1:22:10,  2.60s/it, lr: 1.0e-04 loss: 1.444e-01]hash_cache_v1:  37%|###6      | 1103/3000 [58:06<1:22:10,  2.60s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  37%|###6      | 1103/3000 [58:06<1:22:10,  2.60s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  37%|###6      | 1104/3000 [58:06<1:26:18,  2.73s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  37%|###6      | 1104/3000 [58:06<1:26:18,  2.73s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  37%|###6      | 1104/3000 [58:10<1:26:18,  2.73s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  37%|###6      | 1104/3000 [58:10<1:26:18,  2.73s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  37%|###6      | 1105/3000 [58:10<1:40:10,  3.17s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  37%|###6      | 1105/3000 [58:10<1:40:10,  3.17s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  37%|###6      | 1105/3000 [58:12<1:40:10,  3.17s/it, lr: 1.0e-04 loss: 6.594e-02]hash_cache_v1:  37%|###6      | 1105/3000 [58:12<1:40:10,  3.17s/it, lr: 1.0e-04 loss: 6.594e-02]hash_cache_v1:  37%|###6      | 1106/3000 [58:12<1:30:30,  2.87s/it, lr: 1.0e-04 loss: 6.594e-02]hash_cache_v1:  37%|###6      | 1106/3000 [58:12<1:30:30,  2.87s/it, lr: 1.0e-04 loss: 6.594e-02]hash_cache_v1:  37%|###6      | 1106/3000 [58:15<1:30:30,  2.87s/it, lr: 1.0e-04 loss: 1.895e-01]hash_cache_v1:  37%|###6      | 1106/3000 [58:15<1:30:30,  2.87s/it, lr: 1.0e-04 loss: 1.895e-01]hash_cache_v1:  37%|###6      | 1107/3000 [58:15<1:23:37,  2.65s/it, lr: 1.0e-04 loss: 1.895e-01]hash_cache_v1:  37%|###6      | 1107/3000 [58:15<1:23:37,  2.65s/it, lr: 1.0e-04 loss: 1.895e-01]hash_cache_v1:  37%|###6      | 1107/3000 [58:19<1:23:37,  2.65s/it, lr: 1.0e-04 loss: 9.090e-02]hash_cache_v1:  37%|###6      | 1107/3000 [58:19<1:23:37,  2.65s/it, lr: 1.0e-04 loss: 9.090e-02]hash_cache_v1:  37%|###6      | 1108/3000 [58:19<1:40:27,  3.19s/it, lr: 1.0e-04 loss: 9.090e-02]hash_cache_v1:  37%|###6      | 1108/3000 [58:19<1:40:27,  3.19s/it, lr: 1.0e-04 loss: 9.090e-02]hash_cache_v1:  37%|###6      | 1108/3000 [58:22<1:40:27,  3.19s/it, lr: 1.0e-04 loss: 8.376e-02]hash_cache_v1:  37%|###6      | 1108/3000 [58:22<1:40:27,  3.19s/it, lr: 1.0e-04 loss: 8.376e-02]hash_cache_v1:  37%|###6      | 1109/3000 [58:22<1:37:29,  3.09s/it, lr: 1.0e-04 loss: 8.376e-02]hash_cache_v1:  37%|###6      | 1109/3000 [58:22<1:37:29,  3.09s/it, lr: 1.0e-04 loss: 8.376e-02]hash_cache_v1:  37%|###6      | 1109/3000 [58:24<1:37:29,  3.09s/it, lr: 1.0e-04 loss: 1.950e-01]hash_cache_v1:  37%|###6      | 1109/3000 [58:24<1:37:29,  3.09s/it, lr: 1.0e-04 loss: 1.950e-01]hash_cache_v1:  37%|###7      | 1110/3000 [58:29<1:37:26,  3.09s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  37%|###7      | 1110/3000 [58:29<1:37:26,  3.09s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  37%|###7      | 1111/3000 [58:29<1:25:03,  2.70s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  37%|###7      | 1111/3000 [58:29<1:25:03,  2.70s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  37%|###7      | 1111/3000 [58:31<1:25:03,  2.70s/it, lr: 1.0e-04 loss: 1.247e-01]hash_cache_v1:  37%|###7      | 1111/3000 [58:31<1:25:03,  2.70s/it, lr: 1.0e-04 loss: 1.247e-01]hash_cache_v1:  37%|###7      | 1112/3000 [58:31<1:26:21,  2.74s/it, lr: 1.0e-04 loss: 1.247e-01]hash_cache_v1:  37%|###7      | 1112/3000 [58:31<1:26:21,  2.74s/it, lr: 1.0e-04 loss: 1.247e-01]hash_cache_v1:  37%|###7      | 1112/3000 [58:34<1:26:21,  2.74s/it, lr: 1.0e-04 loss: 1.860e-01]hash_cache_v1:  37%|###7      | 1112/3000 [58:34<1:26:21,  2.74s/it, lr: 1.0e-04 loss: 1.860e-01]hash_cache_v1:  37%|###7      | 1113/3000 [58:34<1:26:29,  2.75s/it, lr: 1.0e-04 loss: 1.860e-01]hash_cache_v1:  37%|###7      | 1113/3000 [58:34<1:26:29,  2.75s/it, lr: 1.0e-04 loss: 1.860e-01]hash_cache_v1:  37%|###7      | 1113/3000 [58:37<1:26:29,  2.75s/it, lr: 1.0e-04 loss: 1.465e-02]hash_cache_v1:  37%|###7      | 1113/3000 [58:37<1:26:29,  2.75s/it, lr: 1.0e-04 loss: 1.465e-02]hash_cache_v1:  37%|###7      | 1114/3000 [58:37<1:27:27,  2.78s/it, lr: 1.0e-04 loss: 1.465e-02]hash_cache_v1:  37%|###7      | 1114/3000 [58:37<1:27:27,  2.78s/it, lr: 1.0e-04 loss: 1.465e-02]hash_cache_v1:  37%|###7      | 1114/3000 [58:39<1:27:27,  2.78s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  37%|###7      | 1114/3000 [58:39<1:27:27,  2.78s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  37%|###7      | 1115/3000 [58:39<1:24:10,  2.68s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  37%|###7      | 1115/3000 [58:39<1:24:10,  2.68s/it, lr: 1.0e-04 loss: 1.970e-01]hash_cache_v1:  37%|###7      | 1115/3000 [58:42<1:24:10,  2.68s/it, lr: 1.0e-04 loss: 5.879e-02]hash_cache_v1:  37%|###7      | 1115/3000 [58:42<1:24:10,  2.68s/it, lr: 1.0e-04 loss: 5.879e-02]hash_cache_v1:  37%|###7      | 1116/3000 [58:42<1:25:53,  2.74s/it, lr: 1.0e-04 loss: 5.879e-02]hash_cache_v1:  37%|###7      | 1116/3000 [58:42<1:25:53,  2.74s/it, lr: 1.0e-04 loss: 5.879e-02]hash_cache_v1:  37%|###7      | 1116/3000 [58:44<1:25:53,  2.74s/it, lr: 1.0e-04 loss: 9.603e-02]hash_cache_v1:  37%|###7      | 1116/3000 [58:44<1:25:53,  2.74s/it, lr: 1.0e-04 loss: 9.603e-02]hash_cache_v1:  37%|###7      | 1117/3000 [58:44<1:20:12,  2.56s/it, lr: 1.0e-04 loss: 9.603e-02]hash_cache_v1:  37%|###7      | 1117/3000 [58:44<1:20:12,  2.56s/it, lr: 1.0e-04 loss: 9.603e-02]hash_cache_v1:  37%|###7      | 1117/3000 [58:48<1:20:12,  2.56s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  37%|###7      | 1117/3000 [58:48<1:20:12,  2.56s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  37%|###7      | 1118/3000 [58:48<1:24:53,  2.71s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  37%|###7      | 1118/3000 [58:48<1:24:53,  2.71s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  37%|###7      | 1118/3000 [58:50<1:24:53,  2.71s/it, lr: 1.0e-04 loss: 2.509e-02]hash_cache_v1:  37%|###7      | 1118/3000 [58:50<1:24:53,  2.71s/it, lr: 1.0e-04 loss: 2.509e-02]hash_cache_v1:  37%|###7      | 1119/3000 [58:50<1:19:17,  2.53s/it, lr: 1.0e-04 loss: 2.509e-02]hash_cache_v1:  37%|###7      | 1119/3000 [58:50<1:19:17,  2.53s/it, lr: 1.0e-04 loss: 2.509e-02]hash_cache_v1:  37%|###7      | 1119/3000 [58:54<1:19:17,  2.53s/it, lr: 1.0e-04 loss: 9.832e-02]hash_cache_v1:  37%|###7      | 1119/3000 [58:54<1:19:17,  2.53s/it, lr: 1.0e-04 loss: 9.832e-02]hash_cache_v1:  37%|###7      | 1120/3000 [58:58<1:19:15,  2.53s/it, lr: 1.0e-04 loss: 2.817e-02]hash_cache_v1:  37%|###7      | 1120/3000 [58:58<1:19:15,  2.53s/it, lr: 1.0e-04 loss: 2.817e-02]hash_cache_v1:  37%|###7      | 1121/3000 [58:58<1:13:05,  2.33s/it, lr: 1.0e-04 loss: 2.817e-02]hash_cache_v1:  37%|###7      | 1121/3000 [58:58<1:13:05,  2.33s/it, lr: 1.0e-04 loss: 2.817e-02]hash_cache_v1:  37%|###7      | 1121/3000 [59:01<1:13:05,  2.33s/it, lr: 1.0e-04 loss: 1.208e-01]hash_cache_v1:  37%|###7      | 1121/3000 [59:01<1:13:05,  2.33s/it, lr: 1.0e-04 loss: 1.208e-01]hash_cache_v1:  37%|###7      | 1122/3000 [59:01<1:13:20,  2.34s/it, lr: 1.0e-04 loss: 1.208e-01]hash_cache_v1:  37%|###7      | 1122/3000 [59:01<1:13:20,  2.34s/it, lr: 1.0e-04 loss: 1.208e-01]hash_cache_v1:  37%|###7      | 1122/3000 [59:05<1:13:20,  2.34s/it, lr: 1.0e-04 loss: 1.069e-01]hash_cache_v1:  37%|###7      | 1122/3000 [59:05<1:13:20,  2.34s/it, lr: 1.0e-04 loss: 1.069e-01]hash_cache_v1:  37%|###7      | 1123/3000 [59:05<1:29:20,  2.86s/it, lr: 1.0e-04 loss: 1.069e-01]hash_cache_v1:  37%|###7      | 1123/3000 [59:05<1:29:20,  2.86s/it, lr: 1.0e-04 loss: 1.069e-01]hash_cache_v1:  37%|###7      | 1123/3000 [59:07<1:29:20,  2.86s/it, lr: 1.0e-04 loss: 1.509e-02]hash_cache_v1:  37%|###7      | 1123/3000 [59:07<1:29:20,  2.86s/it, lr: 1.0e-04 loss: 1.509e-02]hash_cache_v1:  37%|###7      | 1124/3000 [59:07<1:22:54,  2.65s/it, lr: 1.0e-04 loss: 1.509e-02]hash_cache_v1:  37%|###7      | 1124/3000 [59:07<1:22:54,  2.65s/it, lr: 1.0e-04 loss: 1.509e-02]hash_cache_v1:  37%|###7      | 1124/3000 [59:11<1:22:54,  2.65s/it, lr: 1.0e-04 loss: 9.942e-02]hash_cache_v1:  37%|###7      | 1124/3000 [59:11<1:22:54,  2.65s/it, lr: 1.0e-04 loss: 9.942e-02]hash_cache_v1:  38%|###7      | 1125/3000 [59:11<1:39:13,  3.18s/it, lr: 1.0e-04 loss: 9.942e-02]hash_cache_v1:  38%|###7      | 1125/3000 [59:11<1:39:13,  3.18s/it, lr: 1.0e-04 loss: 9.942e-02]hash_cache_v1:  38%|###7      | 1125/3000 [59:16<1:39:13,  3.18s/it, lr: 1.0e-04 loss: 1.552e-02]hash_cache_v1:  38%|###7      | 1125/3000 [59:16<1:39:13,  3.18s/it, lr: 1.0e-04 loss: 1.552e-02]hash_cache_v1:  38%|###7      | 1126/3000 [59:16<1:49:30,  3.51s/it, lr: 1.0e-04 loss: 1.552e-02]hash_cache_v1:  38%|###7      | 1126/3000 [59:16<1:49:30,  3.51s/it, lr: 1.0e-04 loss: 1.552e-02]hash_cache_v1:  38%|###7      | 1126/3000 [59:19<1:49:30,  3.51s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  38%|###7      | 1126/3000 [59:19<1:49:30,  3.51s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  38%|###7      | 1127/3000 [59:19<1:43:50,  3.33s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  38%|###7      | 1127/3000 [59:19<1:43:50,  3.33s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  38%|###7      | 1127/3000 [59:23<1:43:50,  3.33s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  38%|###7      | 1127/3000 [59:23<1:43:50,  3.33s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  38%|###7      | 1128/3000 [59:23<1:52:56,  3.62s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  38%|###7      | 1128/3000 [59:23<1:52:56,  3.62s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  38%|###7      | 1128/3000 [59:25<1:52:56,  3.62s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:  38%|###7      | 1128/3000 [59:25<1:52:56,  3.62s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:  38%|###7      | 1129/3000 [59:25<1:41:38,  3.26s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:  38%|###7      | 1129/3000 [59:25<1:41:38,  3.26s/it, lr: 1.0e-04 loss: 1.987e-01]hash_cache_v1:  38%|###7      | 1129/3000 [59:28<1:41:38,  3.26s/it, lr: 1.0e-04 loss: 5.114e-02]hash_cache_v1:  38%|###7      | 1129/3000 [59:28<1:41:38,  3.26s/it, lr: 1.0e-04 loss: 5.114e-02]hash_cache_v1:  38%|###7      | 1130/3000 [59:31<1:41:35,  3.26s/it, lr: 1.0e-04 loss: 1.543e-01]hash_cache_v1:  38%|###7      | 1130/3000 [59:31<1:41:35,  3.26s/it, lr: 1.0e-04 loss: 1.543e-01]hash_cache_v1:  38%|###7      | 1131/3000 [59:31<1:15:17,  2.42s/it, lr: 1.0e-04 loss: 1.543e-01]hash_cache_v1:  38%|###7      | 1131/3000 [59:31<1:15:17,  2.42s/it, lr: 1.0e-04 loss: 1.543e-01]hash_cache_v1:  38%|###7      | 1131/3000 [59:36<1:15:17,  2.42s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  38%|###7      | 1131/3000 [59:36<1:15:17,  2.42s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  38%|###7      | 1132/3000 [59:36<1:31:07,  2.93s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  38%|###7      | 1132/3000 [59:36<1:31:07,  2.93s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  38%|###7      | 1132/3000 [59:38<1:31:07,  2.93s/it, lr: 1.0e-04 loss: 2.017e-01]hash_cache_v1:  38%|###7      | 1132/3000 [59:38<1:31:07,  2.93s/it, lr: 1.0e-04 loss: 2.017e-01]hash_cache_v1:  38%|###7      | 1133/3000 [59:38<1:24:22,  2.71s/it, lr: 1.0e-04 loss: 2.017e-01]hash_cache_v1:  38%|###7      | 1133/3000 [59:38<1:24:22,  2.71s/it, lr: 1.0e-04 loss: 2.017e-01]hash_cache_v1:  38%|###7      | 1133/3000 [59:40<1:24:22,  2.71s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  38%|###7      | 1133/3000 [59:40<1:24:22,  2.71s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  38%|###7      | 1134/3000 [59:40<1:19:18,  2.55s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  38%|###7      | 1134/3000 [59:40<1:19:18,  2.55s/it, lr: 1.0e-04 loss: 1.667e-01]hash_cache_v1:  38%|###7      | 1134/3000 [59:44<1:19:18,  2.55s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  38%|###7      | 1134/3000 [59:44<1:19:18,  2.55s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  38%|###7      | 1135/3000 [59:44<1:34:17,  3.03s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  38%|###7      | 1135/3000 [59:44<1:34:17,  3.03s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  38%|###7      | 1135/3000 [59:47<1:34:17,  3.03s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  38%|###7      | 1135/3000 [59:47<1:34:17,  3.03s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  38%|###7      | 1136/3000 [59:47<1:34:42,  3.05s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  38%|###7      | 1136/3000 [59:47<1:34:42,  3.05s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  38%|###7      | 1136/3000 [59:51<1:34:42,  3.05s/it, lr: 1.0e-04 loss: 1.024e-01]hash_cache_v1:  38%|###7      | 1136/3000 [59:51<1:34:42,  3.05s/it, lr: 1.0e-04 loss: 1.024e-01]hash_cache_v1:  38%|###7      | 1137/3000 [59:51<1:46:08,  3.42s/it, lr: 1.0e-04 loss: 1.024e-01]hash_cache_v1:  38%|###7      | 1137/3000 [59:51<1:46:08,  3.42s/it, lr: 1.0e-04 loss: 1.024e-01]hash_cache_v1:  38%|###7      | 1137/3000 [59:54<1:46:08,  3.42s/it, lr: 1.0e-04 loss: 8.986e-02]hash_cache_v1:  38%|###7      | 1137/3000 [59:54<1:46:08,  3.42s/it, lr: 1.0e-04 loss: 8.986e-02]hash_cache_v1:  38%|###7      | 1138/3000 [59:54<1:34:13,  3.04s/it, lr: 1.0e-04 loss: 8.986e-02]hash_cache_v1:  38%|###7      | 1138/3000 [59:54<1:34:13,  3.04s/it, lr: 1.0e-04 loss: 8.986e-02]hash_cache_v1:  38%|###7      | 1138/3000 [59:58<1:34:13,  3.04s/it, lr: 1.0e-04 loss: 4.846e-02]hash_cache_v1:  38%|###7      | 1138/3000 [59:58<1:34:13,  3.04s/it, lr: 1.0e-04 loss: 4.846e-02]hash_cache_v1:  38%|###7      | 1139/3000 [59:58<1:45:27,  3.40s/it, lr: 1.0e-04 loss: 4.846e-02]hash_cache_v1:  38%|###7      | 1139/3000 [59:58<1:45:27,  3.40s/it, lr: 1.0e-04 loss: 4.846e-02]hash_cache_v1:  38%|###7      | 1139/3000 [1:00:01<1:45:27,  3.40s/it, lr: 1.0e-04 loss: 3.635e-02]hash_cache_v1:  38%|###7      | 1139/3000 [1:00:01<1:45:27,  3.40s/it, lr: 1.0e-04 loss: 3.635e-02]hash_cache_v1:  38%|###8      | 1140/3000 [1:00:05<1:45:24,  3.40s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  38%|###8      | 1140/3000 [1:00:05<1:45:24,  3.40s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  38%|###8      | 1141/3000 [1:00:05<1:27:44,  2.83s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  38%|###8      | 1141/3000 [1:00:05<1:27:44,  2.83s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  38%|###8      | 1141/3000 [1:00:08<1:27:44,  2.83s/it, lr: 1.0e-04 loss: 8.427e-02]hash_cache_v1:  38%|###8      | 1141/3000 [1:00:08<1:27:44,  2.83s/it, lr: 1.0e-04 loss: 8.427e-02]hash_cache_v1:  38%|###8      | 1142/3000 [1:00:08<1:27:46,  2.83s/it, lr: 1.0e-04 loss: 8.427e-02]hash_cache_v1:  38%|###8      | 1142/3000 [1:00:08<1:27:46,  2.83s/it, lr: 1.0e-04 loss: 8.427e-02]hash_cache_v1:  38%|###8      | 1142/3000 [1:00:11<1:27:46,  2.83s/it, lr: 1.0e-04 loss: 1.875e-01]hash_cache_v1:  38%|###8      | 1142/3000 [1:00:11<1:27:46,  2.83s/it, lr: 1.0e-04 loss: 1.875e-01]hash_cache_v1:  38%|###8      | 1143/3000 [1:00:11<1:24:15,  2.72s/it, lr: 1.0e-04 loss: 1.875e-01]hash_cache_v1:  38%|###8      | 1143/3000 [1:00:11<1:24:15,  2.72s/it, lr: 1.0e-04 loss: 1.875e-01]hash_cache_v1:  38%|###8      | 1143/3000 [1:00:13<1:24:15,  2.72s/it, lr: 1.0e-04 loss: 1.833e-01]hash_cache_v1:  38%|###8      | 1143/3000 [1:00:13<1:24:15,  2.72s/it, lr: 1.0e-04 loss: 1.833e-01]hash_cache_v1:  38%|###8      | 1144/3000 [1:00:13<1:19:01,  2.55s/it, lr: 1.0e-04 loss: 1.833e-01]hash_cache_v1:  38%|###8      | 1144/3000 [1:00:13<1:19:01,  2.55s/it, lr: 1.0e-04 loss: 1.833e-01]hash_cache_v1:  38%|###8      | 1144/3000 [1:00:16<1:19:01,  2.55s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  38%|###8      | 1144/3000 [1:00:16<1:19:01,  2.55s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  38%|###8      | 1145/3000 [1:00:16<1:21:40,  2.64s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  38%|###8      | 1145/3000 [1:00:16<1:21:40,  2.64s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  38%|###8      | 1145/3000 [1:00:18<1:21:40,  2.64s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  38%|###8      | 1145/3000 [1:00:18<1:21:40,  2.64s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  38%|###8      | 1146/3000 [1:00:18<1:16:56,  2.49s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  38%|###8      | 1146/3000 [1:00:18<1:16:56,  2.49s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  38%|###8      | 1146/3000 [1:00:20<1:16:56,  2.49s/it, lr: 1.0e-04 loss: 1.958e-01]hash_cache_v1:  38%|###8      | 1146/3000 [1:00:20<1:16:56,  2.49s/it, lr: 1.0e-04 loss: 1.958e-01]hash_cache_v1:  38%|###8      | 1147/3000 [1:00:20<1:16:05,  2.46s/it, lr: 1.0e-04 loss: 1.958e-01]hash_cache_v1:  38%|###8      | 1147/3000 [1:00:20<1:16:05,  2.46s/it, lr: 1.0e-04 loss: 1.958e-01]hash_cache_v1:  38%|###8      | 1147/3000 [1:00:22<1:16:05,  2.46s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  38%|###8      | 1147/3000 [1:00:22<1:16:05,  2.46s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  38%|###8      | 1148/3000 [1:00:22<1:12:50,  2.36s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  38%|###8      | 1148/3000 [1:00:22<1:12:50,  2.36s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  38%|###8      | 1148/3000 [1:00:26<1:12:50,  2.36s/it, lr: 1.0e-04 loss: 7.844e-02]hash_cache_v1:  38%|###8      | 1148/3000 [1:00:26<1:12:50,  2.36s/it, lr: 1.0e-04 loss: 7.844e-02]hash_cache_v1:  38%|###8      | 1149/3000 [1:00:26<1:30:49,  2.94s/it, lr: 1.0e-04 loss: 7.844e-02]hash_cache_v1:  38%|###8      | 1149/3000 [1:00:26<1:30:49,  2.94s/it, lr: 1.0e-04 loss: 7.844e-02]hash_cache_v1:  38%|###8      | 1149/3000 [1:00:29<1:30:49,  2.94s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  38%|###8      | 1149/3000 [1:00:29<1:30:49,  2.94s/it, lr: 1.0e-04 loss: 1.828e-01]hash_cache_v1:  38%|###8      | 1150/3000 [1:00:33<1:30:46,  2.94s/it, lr: 1.0e-04 loss: 1.210e-01]hash_cache_v1:  38%|###8      | 1150/3000 [1:00:33<1:30:46,  2.94s/it, lr: 1.0e-04 loss: 1.210e-01]hash_cache_v1:  38%|###8      | 1151/3000 [1:00:33<1:20:48,  2.62s/it, lr: 1.0e-04 loss: 1.210e-01]hash_cache_v1:  38%|###8      | 1151/3000 [1:00:33<1:20:48,  2.62s/it, lr: 1.0e-04 loss: 1.210e-01]hash_cache_v1:  38%|###8      | 1151/3000 [1:00:35<1:20:48,  2.62s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  38%|###8      | 1151/3000 [1:00:35<1:20:48,  2.62s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  38%|###8      | 1152/3000 [1:00:35<1:16:59,  2.50s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  38%|###8      | 1152/3000 [1:00:35<1:16:59,  2.50s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  38%|###8      | 1152/3000 [1:00:39<1:16:59,  2.50s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  38%|###8      | 1152/3000 [1:00:39<1:16:59,  2.50s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  38%|###8      | 1153/3000 [1:00:39<1:31:23,  2.97s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  38%|###8      | 1153/3000 [1:00:39<1:31:23,  2.97s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  38%|###8      | 1153/3000 [1:00:44<1:31:23,  2.97s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  38%|###8      | 1153/3000 [1:00:44<1:31:23,  2.97s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  38%|###8      | 1154/3000 [1:00:44<1:43:59,  3.38s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  38%|###8      | 1154/3000 [1:00:44<1:43:59,  3.38s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  38%|###8      | 1154/3000 [1:00:48<1:43:59,  3.38s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  38%|###8      | 1154/3000 [1:00:48<1:43:59,  3.38s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  38%|###8      | 1155/3000 [1:00:48<1:51:40,  3.63s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  38%|###8      | 1155/3000 [1:00:48<1:51:40,  3.63s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  38%|###8      | 1155/3000 [1:00:51<1:51:40,  3.63s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  38%|###8      | 1155/3000 [1:00:51<1:51:40,  3.63s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  39%|###8      | 1156/3000 [1:00:51<1:44:00,  3.38s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  39%|###8      | 1156/3000 [1:00:51<1:44:00,  3.38s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  39%|###8      | 1156/3000 [1:00:55<1:44:00,  3.38s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  39%|###8      | 1156/3000 [1:00:55<1:44:00,  3.38s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  39%|###8      | 1157/3000 [1:00:55<1:51:17,  3.62s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  39%|###8      | 1157/3000 [1:00:55<1:51:17,  3.62s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  39%|###8      | 1157/3000 [1:00:58<1:51:17,  3.62s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  39%|###8      | 1157/3000 [1:00:58<1:51:17,  3.62s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  39%|###8      | 1158/3000 [1:00:58<1:46:31,  3.47s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  39%|###8      | 1158/3000 [1:00:58<1:46:31,  3.47s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  39%|###8      | 1158/3000 [1:01:03<1:46:31,  3.47s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  39%|###8      | 1158/3000 [1:01:03<1:46:31,  3.47s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  39%|###8      | 1159/3000 [1:01:03<1:54:13,  3.72s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  39%|###8      | 1159/3000 [1:01:03<1:54:13,  3.72s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  39%|###8      | 1159/3000 [1:01:07<1:54:13,  3.72s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  39%|###8      | 1159/3000 [1:01:07<1:54:13,  3.72s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  39%|###8      | 1160/3000 [1:01:11<1:54:09,  3.72s/it, lr: 1.0e-04 loss: 3.305e-02]hash_cache_v1:  39%|###8      | 1160/3000 [1:01:11<1:54:09,  3.72s/it, lr: 1.0e-04 loss: 3.305e-02]hash_cache_v1:  39%|###8      | 1161/3000 [1:01:11<1:32:19,  3.01s/it, lr: 1.0e-04 loss: 3.305e-02]hash_cache_v1:  39%|###8      | 1161/3000 [1:01:11<1:32:19,  3.01s/it, lr: 1.0e-04 loss: 3.305e-02]hash_cache_v1:  39%|###8      | 1161/3000 [1:01:14<1:32:19,  3.01s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  39%|###8      | 1161/3000 [1:01:14<1:32:19,  3.01s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  39%|###8      | 1162/3000 [1:01:14<1:33:05,  3.04s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  39%|###8      | 1162/3000 [1:01:14<1:33:05,  3.04s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  39%|###8      | 1162/3000 [1:01:19<1:33:05,  3.04s/it, lr: 1.0e-04 loss: 1.080e-01]hash_cache_v1:  39%|###8      | 1162/3000 [1:01:19<1:33:05,  3.04s/it, lr: 1.0e-04 loss: 1.080e-01]hash_cache_v1:  39%|###8      | 1163/3000 [1:01:19<1:43:09,  3.37s/it, lr: 1.0e-04 loss: 1.080e-01]hash_cache_v1:  39%|###8      | 1163/3000 [1:01:19<1:43:09,  3.37s/it, lr: 1.0e-04 loss: 1.080e-01]hash_cache_v1:  39%|###8      | 1163/3000 [1:01:21<1:43:09,  3.37s/it, lr: 1.0e-04 loss: 2.451e-01]hash_cache_v1:  39%|###8      | 1163/3000 [1:01:21<1:43:09,  3.37s/it, lr: 1.0e-04 loss: 2.451e-01]hash_cache_v1:  39%|###8      | 1164/3000 [1:01:21<1:32:42,  3.03s/it, lr: 1.0e-04 loss: 2.451e-01]hash_cache_v1:  39%|###8      | 1164/3000 [1:01:21<1:32:42,  3.03s/it, lr: 1.0e-04 loss: 2.451e-01]hash_cache_v1:  39%|###8      | 1164/3000 [1:01:24<1:32:42,  3.03s/it, lr: 1.0e-04 loss: 9.721e-02]hash_cache_v1:  39%|###8      | 1164/3000 [1:01:24<1:32:42,  3.03s/it, lr: 1.0e-04 loss: 9.721e-02]hash_cache_v1:  39%|###8      | 1165/3000 [1:01:24<1:32:58,  3.04s/it, lr: 1.0e-04 loss: 9.721e-02]hash_cache_v1:  39%|###8      | 1165/3000 [1:01:24<1:32:58,  3.04s/it, lr: 1.0e-04 loss: 9.721e-02]hash_cache_v1:  39%|###8      | 1165/3000 [1:01:28<1:32:58,  3.04s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  39%|###8      | 1165/3000 [1:01:28<1:32:58,  3.04s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  39%|###8      | 1166/3000 [1:01:28<1:43:21,  3.38s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  39%|###8      | 1166/3000 [1:01:28<1:43:21,  3.38s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  39%|###8      | 1166/3000 [1:01:31<1:43:21,  3.38s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  39%|###8      | 1166/3000 [1:01:31<1:43:21,  3.38s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  39%|###8      | 1167/3000 [1:01:31<1:38:51,  3.24s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  39%|###8      | 1167/3000 [1:01:31<1:38:51,  3.24s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  39%|###8      | 1167/3000 [1:01:34<1:38:51,  3.24s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  39%|###8      | 1167/3000 [1:01:34<1:38:51,  3.24s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  39%|###8      | 1168/3000 [1:01:34<1:35:33,  3.13s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  39%|###8      | 1168/3000 [1:01:34<1:35:33,  3.13s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  39%|###8      | 1168/3000 [1:01:36<1:35:33,  3.13s/it, lr: 1.0e-04 loss: 2.422e-02]hash_cache_v1:  39%|###8      | 1168/3000 [1:01:36<1:35:33,  3.13s/it, lr: 1.0e-04 loss: 2.422e-02]hash_cache_v1:  39%|###8      | 1169/3000 [1:01:36<1:28:51,  2.91s/it, lr: 1.0e-04 loss: 2.422e-02]hash_cache_v1:  39%|###8      | 1169/3000 [1:01:36<1:28:51,  2.91s/it, lr: 1.0e-04 loss: 2.422e-02]hash_cache_v1:  39%|###8      | 1169/3000 [1:01:41<1:28:51,  2.91s/it, lr: 1.0e-04 loss: 8.650e-04]hash_cache_v1:  39%|###8      | 1169/3000 [1:01:41<1:28:51,  2.91s/it, lr: 1.0e-04 loss: 8.650e-04]hash_cache_v1:  39%|###9      | 1170/3000 [1:01:45<1:28:48,  2.91s/it, lr: 1.0e-04 loss: 1.042e-01]hash_cache_v1:  39%|###9      | 1170/3000 [1:01:45<1:28:48,  2.91s/it, lr: 1.0e-04 loss: 1.042e-01]hash_cache_v1:  39%|###9      | 1171/3000 [1:01:45<1:18:01,  2.56s/it, lr: 1.0e-04 loss: 1.042e-01]hash_cache_v1:  39%|###9      | 1171/3000 [1:01:45<1:18:01,  2.56s/it, lr: 1.0e-04 loss: 1.042e-01]hash_cache_v1:  39%|###9      | 1171/3000 [1:01:50<1:18:01,  2.56s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  39%|###9      | 1171/3000 [1:01:50<1:18:01,  2.56s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  39%|###9      | 1172/3000 [1:01:50<1:33:28,  3.07s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  39%|###9      | 1172/3000 [1:01:50<1:33:28,  3.07s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  39%|###9      | 1172/3000 [1:01:52<1:33:28,  3.07s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  39%|###9      | 1172/3000 [1:01:52<1:33:28,  3.07s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  39%|###9      | 1173/3000 [1:01:52<1:25:48,  2.82s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  39%|###9      | 1173/3000 [1:01:52<1:25:48,  2.82s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  39%|###9      | 1173/3000 [1:01:54<1:25:48,  2.82s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  39%|###9      | 1173/3000 [1:01:54<1:25:48,  2.82s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  39%|###9      | 1174/3000 [1:01:54<1:19:59,  2.63s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  39%|###9      | 1174/3000 [1:01:54<1:19:59,  2.63s/it, lr: 1.0e-04 loss: 8.258e-02]hash_cache_v1:  39%|###9      | 1174/3000 [1:01:56<1:19:59,  2.63s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  39%|###9      | 1174/3000 [1:01:56<1:19:59,  2.63s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  39%|###9      | 1175/3000 [1:01:56<1:15:41,  2.49s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  39%|###9      | 1175/3000 [1:01:56<1:15:41,  2.49s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  39%|###9      | 1175/3000 [1:02:01<1:15:41,  2.49s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  39%|###9      | 1175/3000 [1:02:01<1:15:41,  2.49s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  39%|###9      | 1176/3000 [1:02:01<1:33:11,  3.07s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  39%|###9      | 1176/3000 [1:02:01<1:33:11,  3.07s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  39%|###9      | 1176/3000 [1:02:03<1:33:11,  3.07s/it, lr: 1.0e-04 loss: 1.966e-01]hash_cache_v1:  39%|###9      | 1176/3000 [1:02:03<1:33:11,  3.07s/it, lr: 1.0e-04 loss: 1.966e-01]hash_cache_v1:  39%|###9      | 1177/3000 [1:02:03<1:24:39,  2.79s/it, lr: 1.0e-04 loss: 1.966e-01]hash_cache_v1:  39%|###9      | 1177/3000 [1:02:03<1:24:39,  2.79s/it, lr: 1.0e-04 loss: 1.966e-01]hash_cache_v1:  39%|###9      | 1177/3000 [1:02:07<1:24:39,  2.79s/it, lr: 1.0e-04 loss: 7.286e-02]hash_cache_v1:  39%|###9      | 1177/3000 [1:02:07<1:24:39,  2.79s/it, lr: 1.0e-04 loss: 7.286e-02]hash_cache_v1:  39%|###9      | 1178/3000 [1:02:07<1:38:13,  3.23s/it, lr: 1.0e-04 loss: 7.286e-02]hash_cache_v1:  39%|###9      | 1178/3000 [1:02:07<1:38:13,  3.23s/it, lr: 1.0e-04 loss: 7.286e-02]hash_cache_v1:  39%|###9      | 1178/3000 [1:02:10<1:38:13,  3.23s/it, lr: 1.0e-04 loss: 3.581e-02]hash_cache_v1:  39%|###9      | 1178/3000 [1:02:10<1:38:13,  3.23s/it, lr: 1.0e-04 loss: 3.581e-02]hash_cache_v1:  39%|###9      | 1179/3000 [1:02:10<1:34:53,  3.13s/it, lr: 1.0e-04 loss: 3.581e-02]hash_cache_v1:  39%|###9      | 1179/3000 [1:02:10<1:34:53,  3.13s/it, lr: 1.0e-04 loss: 3.581e-02]hash_cache_v1:  39%|###9      | 1179/3000 [1:02:13<1:34:53,  3.13s/it, lr: 1.0e-04 loss: 7.309e-02]hash_cache_v1:  39%|###9      | 1179/3000 [1:02:13<1:34:53,  3.13s/it, lr: 1.0e-04 loss: 7.309e-02]hash_cache_v1:  39%|###9      | 1180/3000 [1:02:16<1:34:50,  3.13s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  39%|###9      | 1180/3000 [1:02:16<1:34:50,  3.13s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  39%|###9      | 1181/3000 [1:02:16<1:11:06,  2.35s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  39%|###9      | 1181/3000 [1:02:16<1:11:06,  2.35s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  39%|###9      | 1181/3000 [1:02:20<1:11:06,  2.35s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  39%|###9      | 1181/3000 [1:02:20<1:11:06,  2.35s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  39%|###9      | 1182/3000 [1:02:20<1:25:29,  2.82s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  39%|###9      | 1182/3000 [1:02:20<1:25:29,  2.82s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  39%|###9      | 1182/3000 [1:02:23<1:25:29,  2.82s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  39%|###9      | 1182/3000 [1:02:23<1:25:29,  2.82s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  39%|###9      | 1183/3000 [1:02:23<1:27:34,  2.89s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  39%|###9      | 1183/3000 [1:02:23<1:27:34,  2.89s/it, lr: 1.0e-04 loss: 1.891e-01]hash_cache_v1:  39%|###9      | 1183/3000 [1:02:25<1:27:34,  2.89s/it, lr: 1.0e-04 loss: 2.607e-01]hash_cache_v1:  39%|###9      | 1183/3000 [1:02:25<1:27:34,  2.89s/it, lr: 1.0e-04 loss: 2.607e-01]hash_cache_v1:  39%|###9      | 1184/3000 [1:02:25<1:21:13,  2.68s/it, lr: 1.0e-04 loss: 2.607e-01]hash_cache_v1:  39%|###9      | 1184/3000 [1:02:25<1:21:13,  2.68s/it, lr: 1.0e-04 loss: 2.607e-01]hash_cache_v1:  39%|###9      | 1184/3000 [1:02:30<1:21:13,  2.68s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  39%|###9      | 1184/3000 [1:02:30<1:21:13,  2.68s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  40%|###9      | 1185/3000 [1:02:30<1:34:42,  3.13s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  40%|###9      | 1185/3000 [1:02:30<1:34:42,  3.13s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  40%|###9      | 1185/3000 [1:02:33<1:34:42,  3.13s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  40%|###9      | 1185/3000 [1:02:33<1:34:42,  3.13s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  40%|###9      | 1186/3000 [1:02:33<1:32:31,  3.06s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  40%|###9      | 1186/3000 [1:02:33<1:32:31,  3.06s/it, lr: 1.0e-04 loss: 2.071e-01]hash_cache_v1:  40%|###9      | 1186/3000 [1:02:35<1:32:31,  3.06s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  40%|###9      | 1186/3000 [1:02:35<1:32:31,  3.06s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  40%|###9      | 1187/3000 [1:02:35<1:26:42,  2.87s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  40%|###9      | 1187/3000 [1:02:35<1:26:42,  2.87s/it, lr: 1.0e-04 loss: 2.018e-01]hash_cache_v1:  40%|###9      | 1187/3000 [1:02:37<1:26:42,  2.87s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  40%|###9      | 1187/3000 [1:02:37<1:26:42,  2.87s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  40%|###9      | 1188/3000 [1:02:37<1:19:56,  2.65s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  40%|###9      | 1188/3000 [1:02:37<1:19:56,  2.65s/it, lr: 1.0e-04 loss: 1.133e-01]hash_cache_v1:  40%|###9      | 1188/3000 [1:02:41<1:19:56,  2.65s/it, lr: 1.0e-04 loss: 3.641e-02]hash_cache_v1:  40%|###9      | 1188/3000 [1:02:41<1:19:56,  2.65s/it, lr: 1.0e-04 loss: 3.641e-02]hash_cache_v1:  40%|###9      | 1189/3000 [1:02:41<1:34:20,  3.13s/it, lr: 1.0e-04 loss: 3.641e-02]hash_cache_v1:  40%|###9      | 1189/3000 [1:02:41<1:34:20,  3.13s/it, lr: 1.0e-04 loss: 3.641e-02]hash_cache_v1:  40%|###9      | 1189/3000 [1:02:44<1:34:20,  3.13s/it, lr: 1.0e-04 loss: 7.095e-02]hash_cache_v1:  40%|###9      | 1189/3000 [1:02:44<1:34:20,  3.13s/it, lr: 1.0e-04 loss: 7.095e-02]hash_cache_v1:  40%|###9      | 1190/3000 [1:02:47<1:34:17,  3.13s/it, lr: 1.0e-04 loss: 7.647e-02]hash_cache_v1:  40%|###9      | 1190/3000 [1:02:47<1:34:17,  3.13s/it, lr: 1.0e-04 loss: 7.647e-02]hash_cache_v1:  40%|###9      | 1191/3000 [1:02:47<1:11:01,  2.36s/it, lr: 1.0e-04 loss: 7.647e-02]hash_cache_v1:  40%|###9      | 1191/3000 [1:02:47<1:11:01,  2.36s/it, lr: 1.0e-04 loss: 7.647e-02]hash_cache_v1:  40%|###9      | 1191/3000 [1:02:49<1:11:01,  2.36s/it, lr: 1.0e-04 loss: 2.026e-01]hash_cache_v1:  40%|###9      | 1191/3000 [1:02:49<1:11:01,  2.36s/it, lr: 1.0e-04 loss: 2.026e-01]hash_cache_v1:  40%|###9      | 1192/3000 [1:02:49<1:09:04,  2.29s/it, lr: 1.0e-04 loss: 2.026e-01]hash_cache_v1:  40%|###9      | 1192/3000 [1:02:49<1:09:04,  2.29s/it, lr: 1.0e-04 loss: 2.026e-01]hash_cache_v1:  40%|###9      | 1192/3000 [1:02:52<1:09:04,  2.29s/it, lr: 1.0e-04 loss: 5.728e-02]hash_cache_v1:  40%|###9      | 1192/3000 [1:02:52<1:09:04,  2.29s/it, lr: 1.0e-04 loss: 5.728e-02]hash_cache_v1:  40%|###9      | 1193/3000 [1:02:52<1:13:16,  2.43s/it, lr: 1.0e-04 loss: 5.728e-02]hash_cache_v1:  40%|###9      | 1193/3000 [1:02:52<1:13:16,  2.43s/it, lr: 1.0e-04 loss: 5.728e-02]hash_cache_v1:  40%|###9      | 1193/3000 [1:02:57<1:13:16,  2.43s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  40%|###9      | 1193/3000 [1:02:57<1:13:16,  2.43s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  40%|###9      | 1194/3000 [1:02:57<1:29:37,  2.98s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  40%|###9      | 1194/3000 [1:02:57<1:29:37,  2.98s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  40%|###9      | 1194/3000 [1:02:59<1:29:37,  2.98s/it, lr: 1.0e-04 loss: 7.358e-02]hash_cache_v1:  40%|###9      | 1194/3000 [1:02:59<1:29:37,  2.98s/it, lr: 1.0e-04 loss: 7.358e-02]hash_cache_v1:  40%|###9      | 1195/3000 [1:02:59<1:27:43,  2.92s/it, lr: 1.0e-04 loss: 7.358e-02]hash_cache_v1:  40%|###9      | 1195/3000 [1:02:59<1:27:43,  2.92s/it, lr: 1.0e-04 loss: 7.358e-02]hash_cache_v1:  40%|###9      | 1195/3000 [1:03:02<1:27:43,  2.92s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  40%|###9      | 1195/3000 [1:03:02<1:27:43,  2.92s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  40%|###9      | 1196/3000 [1:03:02<1:20:54,  2.69s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  40%|###9      | 1196/3000 [1:03:02<1:20:54,  2.69s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  40%|###9      | 1196/3000 [1:03:04<1:20:54,  2.69s/it, lr: 1.0e-04 loss: 2.159e-01]hash_cache_v1:  40%|###9      | 1196/3000 [1:03:04<1:20:54,  2.69s/it, lr: 1.0e-04 loss: 2.159e-01]hash_cache_v1:  40%|###9      | 1197/3000 [1:03:04<1:15:35,  2.52s/it, lr: 1.0e-04 loss: 2.159e-01]hash_cache_v1:  40%|###9      | 1197/3000 [1:03:04<1:15:35,  2.52s/it, lr: 1.0e-04 loss: 2.159e-01]hash_cache_v1:  40%|###9      | 1197/3000 [1:03:08<1:15:35,  2.52s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  40%|###9      | 1197/3000 [1:03:08<1:15:35,  2.52s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  40%|###9      | 1198/3000 [1:03:08<1:32:59,  3.10s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  40%|###9      | 1198/3000 [1:03:08<1:32:59,  3.10s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  40%|###9      | 1198/3000 [1:03:10<1:32:59,  3.10s/it, lr: 1.0e-04 loss: 8.036e-02]hash_cache_v1:  40%|###9      | 1198/3000 [1:03:10<1:32:59,  3.10s/it, lr: 1.0e-04 loss: 8.036e-02]hash_cache_v1:  40%|###9      | 1199/3000 [1:03:10<1:24:06,  2.80s/it, lr: 1.0e-04 loss: 8.036e-02]hash_cache_v1:  40%|###9      | 1199/3000 [1:03:10<1:24:06,  2.80s/it, lr: 1.0e-04 loss: 8.036e-02]hash_cache_v1:  40%|###9      | 1199/3000 [1:03:12<1:24:06,  2.80s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:  40%|###9      | 1199/3000 [1:03:12<1:24:06,  2.80s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:  40%|####      | 1200/3000 [1:03:15<1:24:03,  2.80s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  40%|####      | 1200/3000 [1:03:15<1:24:03,  2.80s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  40%|####      | 1201/3000 [1:03:15<1:06:40,  2.22s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  40%|####      | 1201/3000 [1:03:15<1:06:40,  2.22s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  40%|####      | 1201/3000 [1:03:20<1:06:40,  2.22s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  40%|####      | 1201/3000 [1:03:20<1:06:40,  2.22s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  40%|####      | 1202/3000 [1:03:20<1:22:00,  2.74s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  40%|####      | 1202/3000 [1:03:20<1:22:00,  2.74s/it, lr: 1.0e-04 loss: 1.846e-01]hash_cache_v1:  40%|####      | 1202/3000 [1:03:23<1:22:00,  2.74s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  40%|####      | 1202/3000 [1:03:23<1:22:00,  2.74s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  40%|####      | 1203/3000 [1:03:23<1:22:46,  2.76s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  40%|####      | 1203/3000 [1:03:23<1:22:46,  2.76s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  40%|####      | 1203/3000 [1:03:25<1:22:46,  2.76s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  40%|####      | 1203/3000 [1:03:25<1:22:46,  2.76s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  40%|####      | 1204/3000 [1:03:25<1:17:20,  2.58s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  40%|####      | 1204/3000 [1:03:25<1:17:20,  2.58s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  40%|####      | 1204/3000 [1:03:29<1:17:20,  2.58s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  40%|####      | 1204/3000 [1:03:29<1:17:20,  2.58s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  40%|####      | 1205/3000 [1:03:29<1:32:56,  3.11s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  40%|####      | 1205/3000 [1:03:29<1:32:56,  3.11s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  40%|####      | 1205/3000 [1:03:32<1:32:56,  3.11s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  40%|####      | 1205/3000 [1:03:32<1:32:56,  3.11s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  40%|####      | 1206/3000 [1:03:32<1:30:33,  3.03s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  40%|####      | 1206/3000 [1:03:32<1:30:33,  3.03s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  40%|####      | 1206/3000 [1:03:36<1:30:33,  3.03s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  40%|####      | 1206/3000 [1:03:36<1:30:33,  3.03s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  40%|####      | 1207/3000 [1:03:36<1:41:39,  3.40s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  40%|####      | 1207/3000 [1:03:36<1:41:39,  3.40s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  40%|####      | 1207/3000 [1:03:39<1:41:39,  3.40s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  40%|####      | 1207/3000 [1:03:39<1:41:39,  3.40s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  40%|####      | 1208/3000 [1:03:39<1:36:40,  3.24s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  40%|####      | 1208/3000 [1:03:39<1:36:40,  3.24s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  40%|####      | 1208/3000 [1:03:44<1:36:40,  3.24s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  40%|####      | 1208/3000 [1:03:44<1:36:40,  3.24s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  40%|####      | 1209/3000 [1:03:44<1:47:54,  3.61s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  40%|####      | 1209/3000 [1:03:44<1:47:54,  3.61s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  40%|####      | 1209/3000 [1:03:48<1:47:54,  3.61s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  40%|####      | 1209/3000 [1:03:48<1:47:54,  3.61s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  40%|####      | 1210/3000 [1:03:52<1:47:50,  3.61s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  40%|####      | 1210/3000 [1:03:52<1:47:50,  3.61s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  40%|####      | 1211/3000 [1:03:52<1:27:58,  2.95s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  40%|####      | 1211/3000 [1:03:52<1:27:58,  2.95s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  40%|####      | 1211/3000 [1:03:55<1:27:58,  2.95s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  40%|####      | 1211/3000 [1:03:55<1:27:58,  2.95s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  40%|####      | 1212/3000 [1:03:55<1:28:38,  2.97s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  40%|####      | 1212/3000 [1:03:55<1:28:38,  2.97s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  40%|####      | 1212/3000 [1:03:57<1:28:38,  2.97s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  40%|####      | 1212/3000 [1:03:57<1:28:38,  2.97s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  40%|####      | 1213/3000 [1:03:57<1:21:45,  2.75s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  40%|####      | 1213/3000 [1:03:57<1:21:45,  2.75s/it, lr: 1.0e-04 loss: 1.927e-01]hash_cache_v1:  40%|####      | 1213/3000 [1:04:02<1:21:45,  2.75s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  40%|####      | 1213/3000 [1:04:02<1:21:45,  2.75s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  40%|####      | 1214/3000 [1:04:02<1:34:19,  3.17s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  40%|####      | 1214/3000 [1:04:02<1:34:19,  3.17s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  40%|####      | 1214/3000 [1:04:05<1:34:19,  3.17s/it, lr: 1.0e-04 loss: 1.878e-01]hash_cache_v1:  40%|####      | 1214/3000 [1:04:05<1:34:19,  3.17s/it, lr: 1.0e-04 loss: 1.878e-01]hash_cache_v1:  40%|####      | 1215/3000 [1:04:05<1:31:47,  3.09s/it, lr: 1.0e-04 loss: 1.878e-01]hash_cache_v1:  40%|####      | 1215/3000 [1:04:05<1:31:47,  3.09s/it, lr: 1.0e-04 loss: 1.878e-01]hash_cache_v1:  40%|####      | 1215/3000 [1:04:08<1:31:47,  3.09s/it, lr: 1.0e-04 loss: 7.508e-02]hash_cache_v1:  40%|####      | 1215/3000 [1:04:08<1:31:47,  3.09s/it, lr: 1.0e-04 loss: 7.508e-02]hash_cache_v1:  41%|####      | 1216/3000 [1:04:08<1:31:28,  3.08s/it, lr: 1.0e-04 loss: 7.508e-02]hash_cache_v1:  41%|####      | 1216/3000 [1:04:08<1:31:28,  3.08s/it, lr: 1.0e-04 loss: 7.508e-02]hash_cache_v1:  41%|####      | 1216/3000 [1:04:12<1:31:28,  3.08s/it, lr: 1.0e-04 loss: 7.161e-02]hash_cache_v1:  41%|####      | 1216/3000 [1:04:12<1:31:28,  3.08s/it, lr: 1.0e-04 loss: 7.161e-02]hash_cache_v1:  41%|####      | 1217/3000 [1:04:12<1:41:53,  3.43s/it, lr: 1.0e-04 loss: 7.161e-02]hash_cache_v1:  41%|####      | 1217/3000 [1:04:12<1:41:53,  3.43s/it, lr: 1.0e-04 loss: 7.161e-02]hash_cache_v1:  41%|####      | 1217/3000 [1:04:15<1:41:53,  3.43s/it, lr: 1.0e-04 loss: 1.284e-01]hash_cache_v1:  41%|####      | 1217/3000 [1:04:15<1:41:53,  3.43s/it, lr: 1.0e-04 loss: 1.284e-01]hash_cache_v1:  41%|####      | 1218/3000 [1:04:15<1:36:02,  3.23s/it, lr: 1.0e-04 loss: 1.284e-01]hash_cache_v1:  41%|####      | 1218/3000 [1:04:15<1:36:02,  3.23s/it, lr: 1.0e-04 loss: 1.284e-01]hash_cache_v1:  41%|####      | 1218/3000 [1:04:18<1:36:02,  3.23s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  41%|####      | 1218/3000 [1:04:18<1:36:02,  3.23s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  41%|####      | 1219/3000 [1:04:18<1:32:48,  3.13s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  41%|####      | 1219/3000 [1:04:18<1:32:48,  3.13s/it, lr: 1.0e-04 loss: 1.501e-01]hash_cache_v1:  41%|####      | 1219/3000 [1:04:21<1:32:48,  3.13s/it, lr: 1.0e-04 loss: 7.117e-02]hash_cache_v1:  41%|####      | 1219/3000 [1:04:21<1:32:48,  3.13s/it, lr: 1.0e-04 loss: 7.117e-02]hash_cache_v1:  41%|####      | 1220/3000 [1:04:23<1:32:45,  3.13s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  41%|####      | 1220/3000 [1:04:23<1:32:45,  3.13s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  41%|####      | 1221/3000 [1:04:23<1:04:28,  2.17s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  41%|####      | 1221/3000 [1:04:23<1:04:28,  2.17s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  41%|####      | 1221/3000 [1:04:26<1:04:28,  2.17s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  41%|####      | 1221/3000 [1:04:26<1:04:28,  2.17s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  41%|####      | 1222/3000 [1:04:26<1:09:28,  2.34s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  41%|####      | 1222/3000 [1:04:26<1:09:28,  2.34s/it, lr: 1.0e-04 loss: 7.443e-02]hash_cache_v1:  41%|####      | 1222/3000 [1:04:30<1:09:28,  2.34s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  41%|####      | 1222/3000 [1:04:30<1:09:28,  2.34s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  41%|####      | 1223/3000 [1:04:30<1:25:49,  2.90s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  41%|####      | 1223/3000 [1:04:30<1:25:49,  2.90s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  41%|####      | 1223/3000 [1:04:34<1:25:49,  2.90s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  41%|####      | 1223/3000 [1:04:34<1:25:49,  2.90s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  41%|####      | 1224/3000 [1:04:34<1:36:55,  3.27s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  41%|####      | 1224/3000 [1:04:34<1:36:55,  3.27s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  41%|####      | 1224/3000 [1:04:36<1:36:55,  3.27s/it, lr: 1.0e-04 loss: 3.520e-02]hash_cache_v1:  41%|####      | 1224/3000 [1:04:36<1:36:55,  3.27s/it, lr: 1.0e-04 loss: 3.520e-02]hash_cache_v1:  41%|####      | 1225/3000 [1:04:36<1:27:17,  2.95s/it, lr: 1.0e-04 loss: 3.520e-02]hash_cache_v1:  41%|####      | 1225/3000 [1:04:36<1:27:17,  2.95s/it, lr: 1.0e-04 loss: 3.520e-02]hash_cache_v1:  41%|####      | 1225/3000 [1:04:39<1:27:17,  2.95s/it, lr: 1.0e-04 loss: 2.529e-01]hash_cache_v1:  41%|####      | 1225/3000 [1:04:39<1:27:17,  2.95s/it, lr: 1.0e-04 loss: 2.529e-01]hash_cache_v1:  41%|####      | 1226/3000 [1:04:39<1:20:11,  2.71s/it, lr: 1.0e-04 loss: 2.529e-01]hash_cache_v1:  41%|####      | 1226/3000 [1:04:39<1:20:11,  2.71s/it, lr: 1.0e-04 loss: 2.529e-01]hash_cache_v1:  41%|####      | 1226/3000 [1:04:42<1:20:11,  2.71s/it, lr: 1.0e-04 loss: 1.792e-01]hash_cache_v1:  41%|####      | 1226/3000 [1:04:42<1:20:11,  2.71s/it, lr: 1.0e-04 loss: 1.792e-01]hash_cache_v1:  41%|####      | 1227/3000 [1:04:42<1:23:08,  2.81s/it, lr: 1.0e-04 loss: 1.792e-01]hash_cache_v1:  41%|####      | 1227/3000 [1:04:42<1:23:08,  2.81s/it, lr: 1.0e-04 loss: 1.792e-01]hash_cache_v1:  41%|####      | 1227/3000 [1:04:44<1:23:08,  2.81s/it, lr: 1.0e-04 loss: 1.601e-01]hash_cache_v1:  41%|####      | 1227/3000 [1:04:44<1:23:08,  2.81s/it, lr: 1.0e-04 loss: 1.601e-01]hash_cache_v1:  41%|####      | 1228/3000 [1:04:44<1:16:57,  2.61s/it, lr: 1.0e-04 loss: 1.601e-01]hash_cache_v1:  41%|####      | 1228/3000 [1:04:44<1:16:57,  2.61s/it, lr: 1.0e-04 loss: 1.601e-01]hash_cache_v1:  41%|####      | 1228/3000 [1:04:47<1:16:57,  2.61s/it, lr: 1.0e-04 loss: 1.819e-01]hash_cache_v1:  41%|####      | 1228/3000 [1:04:47<1:16:57,  2.61s/it, lr: 1.0e-04 loss: 1.819e-01]hash_cache_v1:  41%|####      | 1229/3000 [1:04:47<1:19:08,  2.68s/it, lr: 1.0e-04 loss: 1.819e-01]hash_cache_v1:  41%|####      | 1229/3000 [1:04:47<1:19:08,  2.68s/it, lr: 1.0e-04 loss: 1.819e-01]hash_cache_v1:  41%|####      | 1229/3000 [1:04:51<1:19:08,  2.68s/it, lr: 1.0e-04 loss: 1.187e-01]hash_cache_v1:  41%|####      | 1229/3000 [1:04:51<1:19:08,  2.68s/it, lr: 1.0e-04 loss: 1.187e-01]hash_cache_v1:  41%|####1     | 1230/3000 [1:04:54<1:19:05,  2.68s/it, lr: 1.0e-04 loss: 1.745e-01]hash_cache_v1:  41%|####1     | 1230/3000 [1:04:54<1:19:05,  2.68s/it, lr: 1.0e-04 loss: 1.745e-01]hash_cache_v1:  41%|####1     | 1231/3000 [1:04:54<1:03:48,  2.16s/it, lr: 1.0e-04 loss: 1.745e-01]hash_cache_v1:  41%|####1     | 1231/3000 [1:04:54<1:03:48,  2.16s/it, lr: 1.0e-04 loss: 1.745e-01]hash_cache_v1:  41%|####1     | 1231/3000 [1:04:58<1:03:48,  2.16s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  41%|####1     | 1231/3000 [1:04:58<1:03:48,  2.16s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  41%|####1     | 1232/3000 [1:04:58<1:19:29,  2.70s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  41%|####1     | 1232/3000 [1:04:58<1:19:29,  2.70s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  41%|####1     | 1232/3000 [1:05:00<1:19:29,  2.70s/it, lr: 1.0e-04 loss: 1.903e-01]hash_cache_v1:  41%|####1     | 1232/3000 [1:05:00<1:19:29,  2.70s/it, lr: 1.0e-04 loss: 1.903e-01]hash_cache_v1:  41%|####1     | 1233/3000 [1:05:00<1:14:54,  2.54s/it, lr: 1.0e-04 loss: 1.903e-01]hash_cache_v1:  41%|####1     | 1233/3000 [1:05:00<1:14:54,  2.54s/it, lr: 1.0e-04 loss: 1.903e-01]hash_cache_v1:  41%|####1     | 1233/3000 [1:05:03<1:14:54,  2.54s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  41%|####1     | 1233/3000 [1:05:03<1:14:54,  2.54s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  41%|####1     | 1234/3000 [1:05:03<1:13:54,  2.51s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  41%|####1     | 1234/3000 [1:05:03<1:13:54,  2.51s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  41%|####1     | 1234/3000 [1:05:05<1:13:54,  2.51s/it, lr: 1.0e-04 loss: 1.536e-01]hash_cache_v1:  41%|####1     | 1234/3000 [1:05:05<1:13:54,  2.51s/it, lr: 1.0e-04 loss: 1.536e-01]hash_cache_v1:  41%|####1     | 1235/3000 [1:05:05<1:10:41,  2.40s/it, lr: 1.0e-04 loss: 1.536e-01]hash_cache_v1:  41%|####1     | 1235/3000 [1:05:05<1:10:41,  2.40s/it, lr: 1.0e-04 loss: 1.536e-01]hash_cache_v1:  41%|####1     | 1235/3000 [1:05:07<1:10:41,  2.40s/it, lr: 1.0e-04 loss: 1.896e-01]hash_cache_v1:  41%|####1     | 1235/3000 [1:05:07<1:10:41,  2.40s/it, lr: 1.0e-04 loss: 1.896e-01]hash_cache_v1:  41%|####1     | 1236/3000 [1:05:07<1:08:11,  2.32s/it, lr: 1.0e-04 loss: 1.896e-01]hash_cache_v1:  41%|####1     | 1236/3000 [1:05:07<1:08:11,  2.32s/it, lr: 1.0e-04 loss: 1.896e-01]hash_cache_v1:  41%|####1     | 1236/3000 [1:05:11<1:08:11,  2.32s/it, lr: 1.0e-04 loss: 1.151e-01]hash_cache_v1:  41%|####1     | 1236/3000 [1:05:11<1:08:11,  2.32s/it, lr: 1.0e-04 loss: 1.151e-01]hash_cache_v1:  41%|####1     | 1237/3000 [1:05:11<1:25:11,  2.90s/it, lr: 1.0e-04 loss: 1.151e-01]hash_cache_v1:  41%|####1     | 1237/3000 [1:05:11<1:25:11,  2.90s/it, lr: 1.0e-04 loss: 1.151e-01]hash_cache_v1:  41%|####1     | 1237/3000 [1:05:15<1:25:11,  2.90s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  41%|####1     | 1237/3000 [1:05:15<1:25:11,  2.90s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  41%|####1     | 1238/3000 [1:05:15<1:26:50,  2.96s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  41%|####1     | 1238/3000 [1:05:15<1:26:50,  2.96s/it, lr: 1.0e-04 loss: 1.706e-01]hash_cache_v1:  41%|####1     | 1238/3000 [1:05:19<1:26:50,  2.96s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  41%|####1     | 1238/3000 [1:05:19<1:26:50,  2.96s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  41%|####1     | 1239/3000 [1:05:19<1:38:12,  3.35s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  41%|####1     | 1239/3000 [1:05:19<1:38:12,  3.35s/it, lr: 1.0e-04 loss: 1.391e-01]hash_cache_v1:  41%|####1     | 1239/3000 [1:05:21<1:38:12,  3.35s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  41%|####1     | 1239/3000 [1:05:21<1:38:12,  3.35s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  41%|####1     | 1240/3000 [1:05:25<1:38:08,  3.35s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  41%|####1     | 1240/3000 [1:05:25<1:38:08,  3.35s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  41%|####1     | 1241/3000 [1:05:25<1:22:05,  2.80s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  41%|####1     | 1241/3000 [1:05:25<1:22:05,  2.80s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  41%|####1     | 1241/3000 [1:05:28<1:22:05,  2.80s/it, lr: 1.0e-04 loss: 9.179e-02]hash_cache_v1:  41%|####1     | 1241/3000 [1:05:28<1:22:05,  2.80s/it, lr: 1.0e-04 loss: 9.179e-02]hash_cache_v1:  41%|####1     | 1242/3000 [1:05:28<1:18:59,  2.70s/it, lr: 1.0e-04 loss: 9.179e-02]hash_cache_v1:  41%|####1     | 1242/3000 [1:05:28<1:18:59,  2.70s/it, lr: 1.0e-04 loss: 9.179e-02]hash_cache_v1:  41%|####1     | 1242/3000 [1:05:30<1:18:59,  2.70s/it, lr: 1.0e-04 loss: 1.825e-01]hash_cache_v1:  41%|####1     | 1242/3000 [1:05:30<1:18:59,  2.70s/it, lr: 1.0e-04 loss: 1.825e-01]hash_cache_v1:  41%|####1     | 1243/3000 [1:05:30<1:20:19,  2.74s/it, lr: 1.0e-04 loss: 1.825e-01]hash_cache_v1:  41%|####1     | 1243/3000 [1:05:30<1:20:19,  2.74s/it, lr: 1.0e-04 loss: 1.825e-01]hash_cache_v1:  41%|####1     | 1243/3000 [1:05:33<1:20:19,  2.74s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  41%|####1     | 1243/3000 [1:05:33<1:20:19,  2.74s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  41%|####1     | 1244/3000 [1:05:33<1:20:26,  2.75s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  41%|####1     | 1244/3000 [1:05:33<1:20:26,  2.75s/it, lr: 1.0e-04 loss: 1.176e-01]hash_cache_v1:  41%|####1     | 1244/3000 [1:05:36<1:20:26,  2.75s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  41%|####1     | 1244/3000 [1:05:36<1:20:26,  2.75s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  42%|####1     | 1245/3000 [1:05:36<1:22:46,  2.83s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  42%|####1     | 1245/3000 [1:05:36<1:22:46,  2.83s/it, lr: 1.0e-04 loss: 1.701e-01]hash_cache_v1:  42%|####1     | 1245/3000 [1:05:41<1:22:46,  2.83s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  42%|####1     | 1245/3000 [1:05:41<1:22:46,  2.83s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  42%|####1     | 1246/3000 [1:05:41<1:35:10,  3.26s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  42%|####1     | 1246/3000 [1:05:41<1:35:10,  3.26s/it, lr: 1.0e-04 loss: 1.011e-01]hash_cache_v1:  42%|####1     | 1246/3000 [1:05:45<1:35:10,  3.26s/it, lr: 1.0e-04 loss: 9.097e-02]hash_cache_v1:  42%|####1     | 1246/3000 [1:05:45<1:35:10,  3.26s/it, lr: 1.0e-04 loss: 9.097e-02]hash_cache_v1:  42%|####1     | 1247/3000 [1:05:45<1:44:07,  3.56s/it, lr: 1.0e-04 loss: 9.097e-02]hash_cache_v1:  42%|####1     | 1247/3000 [1:05:45<1:44:07,  3.56s/it, lr: 1.0e-04 loss: 9.097e-02]hash_cache_v1:  42%|####1     | 1247/3000 [1:05:49<1:44:07,  3.56s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  42%|####1     | 1247/3000 [1:05:49<1:44:07,  3.56s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  42%|####1     | 1248/3000 [1:05:49<1:50:38,  3.79s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  42%|####1     | 1248/3000 [1:05:49<1:50:38,  3.79s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  42%|####1     | 1248/3000 [1:05:52<1:50:38,  3.79s/it, lr: 1.0e-04 loss: 1.676e-01]hash_cache_v1:  42%|####1     | 1248/3000 [1:05:52<1:50:38,  3.79s/it, lr: 1.0e-04 loss: 1.676e-01]hash_cache_v1:  42%|####1     | 1249/3000 [1:05:52<1:44:44,  3.59s/it, lr: 1.0e-04 loss: 1.676e-01]hash_cache_v1:  42%|####1     | 1249/3000 [1:05:52<1:44:44,  3.59s/it, lr: 1.0e-04 loss: 1.676e-01]hash_cache_v1:  42%|####1     | 1249/3000 [1:05:54<1:44:44,  3.59s/it, lr: 1.0e-04 loss: 3.713e-02]hash_cache_v1:  42%|####1     | 1249/3000 [1:05:54<1:44:44,  3.59s/it, lr: 1.0e-04 loss: 3.713e-02]
+Saving at step 1250
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001250.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000000250.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.16s/it]Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.16s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.35s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.35s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.42s/it]Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.42s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.38s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.38s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  42%|####1     | 1250/3000 [1:05:57<1:44:40,  3.59s/it, lr: 1.0e-04 loss: 1.869e-01]hash_cache_v1:  42%|####1     | 1250/3000 [1:05:57<1:44:40,  3.59s/it, lr: 1.0e-04 loss: 1.869e-01]hash_cache_v1:  42%|####1     | 1251/3000 [1:05:57<1:12:34,  2.49s/it, lr: 1.0e-04 loss: 1.869e-01]hash_cache_v1:  42%|####1     | 1251/3000 [1:05:57<1:12:34,  2.49s/it, lr: 1.0e-04 loss: 1.869e-01]hash_cache_v1:  42%|####1     | 1251/3000 [1:06:00<1:12:34,  2.49s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  42%|####1     | 1251/3000 [1:06:00<1:12:34,  2.49s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  42%|####1     | 1252/3000 [1:06:00<1:15:04,  2.58s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  42%|####1     | 1252/3000 [1:06:00<1:15:04,  2.58s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  42%|####1     | 1252/3000 [1:06:02<1:15:04,  2.58s/it, lr: 1.0e-04 loss: 1.816e-01]hash_cache_v1:  42%|####1     | 1252/3000 [1:06:02<1:15:04,  2.58s/it, lr: 1.0e-04 loss: 1.816e-01]hash_cache_v1:  42%|####1     | 1253/3000 [1:06:02<1:11:27,  2.45s/it, lr: 1.0e-04 loss: 1.816e-01]hash_cache_v1:  42%|####1     | 1253/3000 [1:06:02<1:11:27,  2.45s/it, lr: 1.0e-04 loss: 1.816e-01]hash_cache_v1:  42%|####1     | 1253/3000 [1:06:04<1:11:27,  2.45s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  42%|####1     | 1253/3000 [1:06:04<1:11:27,  2.45s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  42%|####1     | 1254/3000 [1:06:04<1:10:49,  2.43s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  42%|####1     | 1254/3000 [1:06:04<1:10:49,  2.43s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  42%|####1     | 1254/3000 [1:06:07<1:10:49,  2.43s/it, lr: 1.0e-04 loss: 9.989e-02]hash_cache_v1:  42%|####1     | 1254/3000 [1:06:07<1:10:49,  2.43s/it, lr: 1.0e-04 loss: 9.989e-02]hash_cache_v1:  42%|####1     | 1255/3000 [1:06:07<1:14:22,  2.56s/it, lr: 1.0e-04 loss: 9.989e-02]hash_cache_v1:  42%|####1     | 1255/3000 [1:06:07<1:14:22,  2.56s/it, lr: 1.0e-04 loss: 9.989e-02]hash_cache_v1:  42%|####1     | 1255/3000 [1:06:09<1:14:22,  2.56s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  42%|####1     | 1255/3000 [1:06:09<1:14:22,  2.56s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  42%|####1     | 1256/3000 [1:06:09<1:10:38,  2.43s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  42%|####1     | 1256/3000 [1:06:09<1:10:38,  2.43s/it, lr: 1.0e-04 loss: 1.686e-01]hash_cache_v1:  42%|####1     | 1256/3000 [1:06:14<1:10:38,  2.43s/it, lr: 1.0e-04 loss: 1.028e-01]hash_cache_v1:  42%|####1     | 1256/3000 [1:06:14<1:10:38,  2.43s/it, lr: 1.0e-04 loss: 1.028e-01]hash_cache_v1:  42%|####1     | 1257/3000 [1:06:14<1:27:50,  3.02s/it, lr: 1.0e-04 loss: 1.028e-01]hash_cache_v1:  42%|####1     | 1257/3000 [1:06:14<1:27:50,  3.02s/it, lr: 1.0e-04 loss: 1.028e-01]hash_cache_v1:  42%|####1     | 1257/3000 [1:06:18<1:27:50,  3.02s/it, lr: 1.0e-04 loss: 1.387e-01]hash_cache_v1:  42%|####1     | 1257/3000 [1:06:18<1:27:50,  3.02s/it, lr: 1.0e-04 loss: 1.387e-01]hash_cache_v1:  42%|####1     | 1258/3000 [1:06:18<1:38:51,  3.41s/it, lr: 1.0e-04 loss: 1.387e-01]hash_cache_v1:  42%|####1     | 1258/3000 [1:06:18<1:38:51,  3.41s/it, lr: 1.0e-04 loss: 1.387e-01]hash_cache_v1:  42%|####1     | 1258/3000 [1:06:20<1:38:51,  3.41s/it, lr: 1.0e-04 loss: 9.222e-02]hash_cache_v1:  42%|####1     | 1258/3000 [1:06:20<1:38:51,  3.41s/it, lr: 1.0e-04 loss: 9.222e-02]hash_cache_v1:  42%|####1     | 1259/3000 [1:06:20<1:27:45,  3.02s/it, lr: 1.0e-04 loss: 9.222e-02]hash_cache_v1:  42%|####1     | 1259/3000 [1:06:20<1:27:45,  3.02s/it, lr: 1.0e-04 loss: 9.222e-02]hash_cache_v1:  42%|####1     | 1259/3000 [1:06:23<1:27:45,  3.02s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  42%|####1     | 1259/3000 [1:06:23<1:27:45,  3.02s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  42%|####2     | 1260/3000 [1:06:27<1:27:42,  3.02s/it, lr: 1.0e-04 loss: 4.267e-02]hash_cache_v1:  42%|####2     | 1260/3000 [1:06:27<1:27:42,  3.02s/it, lr: 1.0e-04 loss: 4.267e-02]hash_cache_v1:  42%|####2     | 1261/3000 [1:06:27<1:17:57,  2.69s/it, lr: 1.0e-04 loss: 4.267e-02]hash_cache_v1:  42%|####2     | 1261/3000 [1:06:27<1:17:57,  2.69s/it, lr: 1.0e-04 loss: 4.267e-02]hash_cache_v1:  42%|####2     | 1261/3000 [1:06:31<1:17:57,  2.69s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  42%|####2     | 1261/3000 [1:06:31<1:17:57,  2.69s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  42%|####2     | 1262/3000 [1:06:32<1:29:32,  3.09s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  42%|####2     | 1262/3000 [1:06:32<1:29:32,  3.09s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  42%|####2     | 1262/3000 [1:06:36<1:29:32,  3.09s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  42%|####2     | 1262/3000 [1:06:36<1:29:32,  3.09s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  42%|####2     | 1263/3000 [1:06:36<1:38:25,  3.40s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  42%|####2     | 1263/3000 [1:06:36<1:38:25,  3.40s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  42%|####2     | 1263/3000 [1:06:38<1:38:25,  3.40s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  42%|####2     | 1263/3000 [1:06:38<1:38:25,  3.40s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  42%|####2     | 1264/3000 [1:06:38<1:28:13,  3.05s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  42%|####2     | 1264/3000 [1:06:38<1:28:13,  3.05s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  42%|####2     | 1264/3000 [1:06:40<1:28:13,  3.05s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  42%|####2     | 1264/3000 [1:06:40<1:28:13,  3.05s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  42%|####2     | 1265/3000 [1:06:40<1:22:48,  2.86s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  42%|####2     | 1265/3000 [1:06:40<1:22:48,  2.86s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  42%|####2     | 1265/3000 [1:06:43<1:22:48,  2.86s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  42%|####2     | 1265/3000 [1:06:43<1:22:48,  2.86s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  42%|####2     | 1266/3000 [1:06:43<1:21:49,  2.83s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  42%|####2     | 1266/3000 [1:06:43<1:21:49,  2.83s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  42%|####2     | 1266/3000 [1:06:45<1:21:49,  2.83s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  42%|####2     | 1266/3000 [1:06:45<1:21:49,  2.83s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  42%|####2     | 1267/3000 [1:06:45<1:15:44,  2.62s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  42%|####2     | 1267/3000 [1:06:45<1:15:44,  2.62s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  42%|####2     | 1267/3000 [1:06:48<1:15:44,  2.62s/it, lr: 1.0e-04 loss: 3.655e-02]hash_cache_v1:  42%|####2     | 1267/3000 [1:06:48<1:15:44,  2.62s/it, lr: 1.0e-04 loss: 3.655e-02]hash_cache_v1:  42%|####2     | 1268/3000 [1:06:48<1:19:21,  2.75s/it, lr: 1.0e-04 loss: 3.655e-02]hash_cache_v1:  42%|####2     | 1268/3000 [1:06:48<1:19:21,  2.75s/it, lr: 1.0e-04 loss: 3.655e-02]hash_cache_v1:  42%|####2     | 1268/3000 [1:06:52<1:19:21,  2.75s/it, lr: 1.0e-04 loss: 9.181e-02]hash_cache_v1:  42%|####2     | 1268/3000 [1:06:52<1:19:21,  2.75s/it, lr: 1.0e-04 loss: 9.181e-02]hash_cache_v1:  42%|####2     | 1269/3000 [1:06:52<1:32:34,  3.21s/it, lr: 1.0e-04 loss: 9.181e-02]hash_cache_v1:  42%|####2     | 1269/3000 [1:06:52<1:32:34,  3.21s/it, lr: 1.0e-04 loss: 9.181e-02]hash_cache_v1:  42%|####2     | 1269/3000 [1:06:57<1:32:34,  3.21s/it, lr: 1.0e-04 loss: 1.448e-01]hash_cache_v1:  42%|####2     | 1269/3000 [1:06:57<1:32:34,  3.21s/it, lr: 1.0e-04 loss: 1.448e-01]hash_cache_v1:  42%|####2     | 1270/3000 [1:07:00<1:32:30,  3.21s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  42%|####2     | 1270/3000 [1:07:00<1:32:30,  3.21s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  42%|####2     | 1271/3000 [1:07:00<1:08:21,  2.37s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  42%|####2     | 1271/3000 [1:07:00<1:08:21,  2.37s/it, lr: 1.0e-04 loss: 1.473e-01]hash_cache_v1:  42%|####2     | 1271/3000 [1:07:04<1:08:21,  2.37s/it, lr: 1.0e-04 loss: 1.699e-01]hash_cache_v1:  42%|####2     | 1271/3000 [1:07:04<1:08:21,  2.37s/it, lr: 1.0e-04 loss: 1.699e-01]hash_cache_v1:  42%|####2     | 1272/3000 [1:07:04<1:23:36,  2.90s/it, lr: 1.0e-04 loss: 1.699e-01]hash_cache_v1:  42%|####2     | 1272/3000 [1:07:04<1:23:36,  2.90s/it, lr: 1.0e-04 loss: 1.699e-01]hash_cache_v1:  42%|####2     | 1272/3000 [1:07:07<1:23:36,  2.90s/it, lr: 1.0e-04 loss: 2.338e-01]hash_cache_v1:  42%|####2     | 1272/3000 [1:07:07<1:23:36,  2.90s/it, lr: 1.0e-04 loss: 2.338e-01]hash_cache_v1:  42%|####2     | 1273/3000 [1:07:07<1:22:25,  2.86s/it, lr: 1.0e-04 loss: 2.338e-01]hash_cache_v1:  42%|####2     | 1273/3000 [1:07:07<1:22:25,  2.86s/it, lr: 1.0e-04 loss: 2.338e-01]hash_cache_v1:  42%|####2     | 1273/3000 [1:07:09<1:22:25,  2.86s/it, lr: 1.0e-04 loss: 1.289e-02]hash_cache_v1:  42%|####2     | 1273/3000 [1:07:09<1:22:25,  2.86s/it, lr: 1.0e-04 loss: 1.289e-02]hash_cache_v1:  42%|####2     | 1274/3000 [1:07:09<1:16:22,  2.65s/it, lr: 1.0e-04 loss: 1.289e-02]hash_cache_v1:  42%|####2     | 1274/3000 [1:07:09<1:16:22,  2.65s/it, lr: 1.0e-04 loss: 1.289e-02]hash_cache_v1:  42%|####2     | 1274/3000 [1:07:12<1:16:22,  2.65s/it, lr: 1.0e-04 loss: 7.346e-02]hash_cache_v1:  42%|####2     | 1274/3000 [1:07:12<1:16:22,  2.65s/it, lr: 1.0e-04 loss: 7.346e-02]hash_cache_v1:  42%|####2     | 1275/3000 [1:07:12<1:19:30,  2.77s/it, lr: 1.0e-04 loss: 7.346e-02]hash_cache_v1:  42%|####2     | 1275/3000 [1:07:12<1:19:30,  2.77s/it, lr: 1.0e-04 loss: 7.346e-02]hash_cache_v1:  42%|####2     | 1275/3000 [1:07:15<1:19:30,  2.77s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  42%|####2     | 1275/3000 [1:07:15<1:19:30,  2.77s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  43%|####2     | 1276/3000 [1:07:15<1:20:19,  2.80s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  43%|####2     | 1276/3000 [1:07:15<1:20:19,  2.80s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  43%|####2     | 1276/3000 [1:07:17<1:20:19,  2.80s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  43%|####2     | 1276/3000 [1:07:17<1:20:19,  2.80s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  43%|####2     | 1277/3000 [1:07:17<1:14:34,  2.60s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  43%|####2     | 1277/3000 [1:07:17<1:14:34,  2.60s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  43%|####2     | 1277/3000 [1:07:19<1:14:34,  2.60s/it, lr: 1.0e-04 loss: 2.276e-01]hash_cache_v1:  43%|####2     | 1277/3000 [1:07:19<1:14:34,  2.60s/it, lr: 1.0e-04 loss: 2.276e-01]hash_cache_v1:  43%|####2     | 1278/3000 [1:07:19<1:10:29,  2.46s/it, lr: 1.0e-04 loss: 2.276e-01]hash_cache_v1:  43%|####2     | 1278/3000 [1:07:19<1:10:29,  2.46s/it, lr: 1.0e-04 loss: 2.276e-01]hash_cache_v1:  43%|####2     | 1278/3000 [1:07:24<1:10:29,  2.46s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  43%|####2     | 1278/3000 [1:07:24<1:10:29,  2.46s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  43%|####2     | 1279/3000 [1:07:24<1:27:32,  3.05s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  43%|####2     | 1279/3000 [1:07:24<1:27:32,  3.05s/it, lr: 1.0e-04 loss: 1.649e-01]hash_cache_v1:  43%|####2     | 1279/3000 [1:07:28<1:27:32,  3.05s/it, lr: 1.0e-04 loss: 1.121e-01]hash_cache_v1:  43%|####2     | 1279/3000 [1:07:28<1:27:32,  3.05s/it, lr: 1.0e-04 loss: 1.121e-01]hash_cache_v1:  43%|####2     | 1280/3000 [1:07:30<1:27:29,  3.05s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  43%|####2     | 1280/3000 [1:07:30<1:27:29,  3.05s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  43%|####2     | 1281/3000 [1:07:30<1:01:15,  2.14s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  43%|####2     | 1281/3000 [1:07:30<1:01:15,  2.14s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  43%|####2     | 1281/3000 [1:07:33<1:01:15,  2.14s/it, lr: 1.0e-04 loss: 2.197e-01]hash_cache_v1:  43%|####2     | 1281/3000 [1:07:33<1:01:15,  2.14s/it, lr: 1.0e-04 loss: 2.197e-01]hash_cache_v1:  43%|####2     | 1282/3000 [1:07:33<1:06:25,  2.32s/it, lr: 1.0e-04 loss: 2.197e-01]hash_cache_v1:  43%|####2     | 1282/3000 [1:07:33<1:06:25,  2.32s/it, lr: 1.0e-04 loss: 2.197e-01]hash_cache_v1:  43%|####2     | 1282/3000 [1:07:36<1:06:25,  2.32s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  43%|####2     | 1282/3000 [1:07:36<1:06:25,  2.32s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  43%|####2     | 1283/3000 [1:07:36<1:12:16,  2.53s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  43%|####2     | 1283/3000 [1:07:36<1:12:16,  2.53s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  43%|####2     | 1283/3000 [1:07:38<1:12:16,  2.53s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  43%|####2     | 1283/3000 [1:07:38<1:12:16,  2.53s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  43%|####2     | 1284/3000 [1:07:38<1:09:00,  2.41s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  43%|####2     | 1284/3000 [1:07:38<1:09:00,  2.41s/it, lr: 1.0e-04 loss: 1.048e-01]hash_cache_v1:  43%|####2     | 1284/3000 [1:07:41<1:09:00,  2.41s/it, lr: 1.0e-04 loss: 8.927e-02]hash_cache_v1:  43%|####2     | 1284/3000 [1:07:41<1:09:00,  2.41s/it, lr: 1.0e-04 loss: 8.927e-02]hash_cache_v1:  43%|####2     | 1285/3000 [1:07:41<1:12:25,  2.53s/it, lr: 1.0e-04 loss: 8.927e-02]hash_cache_v1:  43%|####2     | 1285/3000 [1:07:41<1:12:25,  2.53s/it, lr: 1.0e-04 loss: 8.927e-02]hash_cache_v1:  43%|####2     | 1285/3000 [1:07:44<1:12:25,  2.53s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  43%|####2     | 1285/3000 [1:07:44<1:12:25,  2.53s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  43%|####2     | 1286/3000 [1:07:44<1:16:51,  2.69s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  43%|####2     | 1286/3000 [1:07:44<1:16:51,  2.69s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  43%|####2     | 1286/3000 [1:07:46<1:16:51,  2.69s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  43%|####2     | 1286/3000 [1:07:46<1:16:51,  2.69s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  43%|####2     | 1287/3000 [1:07:46<1:12:07,  2.53s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  43%|####2     | 1287/3000 [1:07:46<1:12:07,  2.53s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  43%|####2     | 1287/3000 [1:07:48<1:12:07,  2.53s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  43%|####2     | 1287/3000 [1:07:48<1:12:07,  2.53s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  43%|####2     | 1288/3000 [1:07:48<1:08:35,  2.40s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  43%|####2     | 1288/3000 [1:07:48<1:08:35,  2.40s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  43%|####2     | 1288/3000 [1:07:51<1:08:35,  2.40s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  43%|####2     | 1288/3000 [1:07:51<1:08:35,  2.40s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  43%|####2     | 1289/3000 [1:07:51<1:12:09,  2.53s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  43%|####2     | 1289/3000 [1:07:51<1:12:09,  2.53s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  43%|####2     | 1289/3000 [1:07:56<1:12:09,  2.53s/it, lr: 1.0e-04 loss: 8.588e-02]hash_cache_v1:  43%|####2     | 1289/3000 [1:07:56<1:12:09,  2.53s/it, lr: 1.0e-04 loss: 8.588e-02]hash_cache_v1:  43%|####3     | 1290/3000 [1:08:00<1:12:07,  2.53s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  43%|####3     | 1290/3000 [1:08:00<1:12:07,  2.53s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  43%|####3     | 1291/3000 [1:08:00<1:07:13,  2.36s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  43%|####3     | 1291/3000 [1:08:00<1:07:13,  2.36s/it, lr: 1.0e-04 loss: 1.662e-01]hash_cache_v1:  43%|####3     | 1291/3000 [1:08:03<1:07:13,  2.36s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  43%|####3     | 1291/3000 [1:08:03<1:07:13,  2.36s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  43%|####3     | 1292/3000 [1:08:03<1:10:48,  2.49s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  43%|####3     | 1292/3000 [1:08:03<1:10:48,  2.49s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  43%|####3     | 1292/3000 [1:08:06<1:10:48,  2.49s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  43%|####3     | 1292/3000 [1:08:06<1:10:48,  2.49s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  43%|####3     | 1293/3000 [1:08:06<1:13:44,  2.59s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  43%|####3     | 1293/3000 [1:08:06<1:13:44,  2.59s/it, lr: 1.0e-04 loss: 1.615e-01]hash_cache_v1:  43%|####3     | 1293/3000 [1:08:10<1:13:44,  2.59s/it, lr: 1.0e-04 loss: 5.951e-02]hash_cache_v1:  43%|####3     | 1293/3000 [1:08:10<1:13:44,  2.59s/it, lr: 1.0e-04 loss: 5.951e-02]hash_cache_v1:  43%|####3     | 1294/3000 [1:08:10<1:28:16,  3.10s/it, lr: 1.0e-04 loss: 5.951e-02]hash_cache_v1:  43%|####3     | 1294/3000 [1:08:10<1:28:16,  3.10s/it, lr: 1.0e-04 loss: 5.951e-02]hash_cache_v1:  43%|####3     | 1294/3000 [1:08:12<1:28:16,  3.10s/it, lr: 1.0e-04 loss: 2.522e-01]hash_cache_v1:  43%|####3     | 1294/3000 [1:08:12<1:28:16,  3.10s/it, lr: 1.0e-04 loss: 2.522e-01]hash_cache_v1:  43%|####3     | 1295/3000 [1:08:12<1:20:15,  2.82s/it, lr: 1.0e-04 loss: 2.522e-01]hash_cache_v1:  43%|####3     | 1295/3000 [1:08:12<1:20:15,  2.82s/it, lr: 1.0e-04 loss: 2.522e-01]hash_cache_v1:  43%|####3     | 1295/3000 [1:08:17<1:20:15,  2.82s/it, lr: 1.0e-04 loss: 5.209e-02]hash_cache_v1:  43%|####3     | 1295/3000 [1:08:17<1:20:15,  2.82s/it, lr: 1.0e-04 loss: 5.209e-02]hash_cache_v1:  43%|####3     | 1296/3000 [1:08:17<1:32:15,  3.25s/it, lr: 1.0e-04 loss: 5.209e-02]hash_cache_v1:  43%|####3     | 1296/3000 [1:08:17<1:32:15,  3.25s/it, lr: 1.0e-04 loss: 5.209e-02]hash_cache_v1:  43%|####3     | 1296/3000 [1:08:19<1:32:15,  3.25s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  43%|####3     | 1296/3000 [1:08:19<1:32:15,  3.25s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  43%|####3     | 1297/3000 [1:08:19<1:25:05,  3.00s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  43%|####3     | 1297/3000 [1:08:19<1:25:05,  3.00s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  43%|####3     | 1297/3000 [1:08:22<1:25:05,  3.00s/it, lr: 1.0e-04 loss: 6.717e-02]hash_cache_v1:  43%|####3     | 1297/3000 [1:08:22<1:25:05,  3.00s/it, lr: 1.0e-04 loss: 6.717e-02]hash_cache_v1:  43%|####3     | 1298/3000 [1:08:22<1:23:57,  2.96s/it, lr: 1.0e-04 loss: 6.717e-02]hash_cache_v1:  43%|####3     | 1298/3000 [1:08:22<1:23:57,  2.96s/it, lr: 1.0e-04 loss: 6.717e-02]hash_cache_v1:  43%|####3     | 1298/3000 [1:08:24<1:23:57,  2.96s/it, lr: 1.0e-04 loss: 1.131e-02]hash_cache_v1:  43%|####3     | 1298/3000 [1:08:24<1:23:57,  2.96s/it, lr: 1.0e-04 loss: 1.131e-02]hash_cache_v1:  43%|####3     | 1299/3000 [1:08:24<1:16:48,  2.71s/it, lr: 1.0e-04 loss: 1.131e-02]hash_cache_v1:  43%|####3     | 1299/3000 [1:08:24<1:16:48,  2.71s/it, lr: 1.0e-04 loss: 1.131e-02]hash_cache_v1:  43%|####3     | 1299/3000 [1:08:26<1:16:48,  2.71s/it, lr: 1.0e-04 loss: 1.904e-03]hash_cache_v1:  43%|####3     | 1299/3000 [1:08:26<1:16:48,  2.71s/it, lr: 1.0e-04 loss: 1.904e-03]hash_cache_v1:  43%|####3     | 1300/3000 [1:08:28<1:16:45,  2.71s/it, lr: 1.0e-04 loss: 1.135e-01]hash_cache_v1:  43%|####3     | 1300/3000 [1:08:28<1:16:45,  2.71s/it, lr: 1.0e-04 loss: 1.135e-01]hash_cache_v1:  43%|####3     | 1301/3000 [1:08:28<57:06,  2.02s/it, lr: 1.0e-04 loss: 1.135e-01]  hash_cache_v1:  43%|####3     | 1301/3000 [1:08:28<57:06,  2.02s/it, lr: 1.0e-04 loss: 1.135e-01]  hash_cache_v1:  43%|####3     | 1301/3000 [1:08:31<57:06,  2.02s/it, lr: 1.0e-04 loss: 2.142e-02]hash_cache_v1:  43%|####3     | 1301/3000 [1:08:31<57:06,  2.02s/it, lr: 1.0e-04 loss: 2.142e-02]hash_cache_v1:  43%|####3     | 1302/3000 [1:08:31<1:02:48,  2.22s/it, lr: 1.0e-04 loss: 2.142e-02]hash_cache_v1:  43%|####3     | 1302/3000 [1:08:31<1:02:48,  2.22s/it, lr: 1.0e-04 loss: 2.142e-02]hash_cache_v1:  43%|####3     | 1302/3000 [1:08:36<1:02:48,  2.22s/it, lr: 1.0e-04 loss: 7.337e-02]hash_cache_v1:  43%|####3     | 1302/3000 [1:08:36<1:02:48,  2.22s/it, lr: 1.0e-04 loss: 7.337e-02]hash_cache_v1:  43%|####3     | 1303/3000 [1:08:36<1:17:53,  2.75s/it, lr: 1.0e-04 loss: 7.337e-02]hash_cache_v1:  43%|####3     | 1303/3000 [1:08:36<1:17:53,  2.75s/it, lr: 1.0e-04 loss: 7.337e-02]hash_cache_v1:  43%|####3     | 1303/3000 [1:08:38<1:17:53,  2.75s/it, lr: 1.0e-04 loss: 2.091e-02]hash_cache_v1:  43%|####3     | 1303/3000 [1:08:38<1:17:53,  2.75s/it, lr: 1.0e-04 loss: 2.091e-02]hash_cache_v1:  43%|####3     | 1304/3000 [1:08:38<1:18:30,  2.78s/it, lr: 1.0e-04 loss: 2.091e-02]hash_cache_v1:  43%|####3     | 1304/3000 [1:08:38<1:18:30,  2.78s/it, lr: 1.0e-04 loss: 2.091e-02]hash_cache_v1:  43%|####3     | 1304/3000 [1:08:41<1:18:30,  2.78s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  43%|####3     | 1304/3000 [1:08:41<1:18:30,  2.78s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  44%|####3     | 1305/3000 [1:08:41<1:15:26,  2.67s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  44%|####3     | 1305/3000 [1:08:41<1:15:26,  2.67s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  44%|####3     | 1305/3000 [1:08:43<1:15:26,  2.67s/it, lr: 1.0e-04 loss: 2.014e-01]hash_cache_v1:  44%|####3     | 1305/3000 [1:08:43<1:15:26,  2.67s/it, lr: 1.0e-04 loss: 2.014e-01]hash_cache_v1:  44%|####3     | 1306/3000 [1:08:43<1:10:58,  2.51s/it, lr: 1.0e-04 loss: 2.014e-01]hash_cache_v1:  44%|####3     | 1306/3000 [1:08:43<1:10:58,  2.51s/it, lr: 1.0e-04 loss: 2.014e-01]hash_cache_v1:  44%|####3     | 1306/3000 [1:08:47<1:10:58,  2.51s/it, lr: 1.0e-04 loss: 1.437e-01]hash_cache_v1:  44%|####3     | 1306/3000 [1:08:47<1:10:58,  2.51s/it, lr: 1.0e-04 loss: 1.437e-01]hash_cache_v1:  44%|####3     | 1307/3000 [1:08:47<1:25:38,  3.04s/it, lr: 1.0e-04 loss: 1.437e-01]hash_cache_v1:  44%|####3     | 1307/3000 [1:08:47<1:25:38,  3.04s/it, lr: 1.0e-04 loss: 1.437e-01]hash_cache_v1:  44%|####3     | 1307/3000 [1:08:50<1:25:38,  3.04s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  44%|####3     | 1307/3000 [1:08:50<1:25:38,  3.04s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  44%|####3     | 1308/3000 [1:08:50<1:20:20,  2.85s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  44%|####3     | 1308/3000 [1:08:50<1:20:20,  2.85s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  44%|####3     | 1308/3000 [1:08:52<1:20:20,  2.85s/it, lr: 1.0e-04 loss: 1.099e-02]hash_cache_v1:  44%|####3     | 1308/3000 [1:08:52<1:20:20,  2.85s/it, lr: 1.0e-04 loss: 1.099e-02]hash_cache_v1:  44%|####3     | 1309/3000 [1:08:52<1:14:17,  2.64s/it, lr: 1.0e-04 loss: 1.099e-02]hash_cache_v1:  44%|####3     | 1309/3000 [1:08:52<1:14:17,  2.64s/it, lr: 1.0e-04 loss: 1.099e-02]hash_cache_v1:  44%|####3     | 1309/3000 [1:08:56<1:14:17,  2.64s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  44%|####3     | 1309/3000 [1:08:56<1:14:17,  2.64s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  44%|####3     | 1310/3000 [1:08:58<1:14:15,  2.64s/it, lr: 1.0e-04 loss: 2.100e-01]hash_cache_v1:  44%|####3     | 1310/3000 [1:08:58<1:14:15,  2.64s/it, lr: 1.0e-04 loss: 2.100e-01]hash_cache_v1:  44%|####3     | 1311/3000 [1:08:58<53:53,  1.91s/it, lr: 1.0e-04 loss: 2.100e-01]  hash_cache_v1:  44%|####3     | 1311/3000 [1:08:58<53:53,  1.91s/it, lr: 1.0e-04 loss: 2.100e-01]  hash_cache_v1:  44%|####3     | 1311/3000 [1:09:00<53:53,  1.91s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  44%|####3     | 1311/3000 [1:09:00<53:53,  1.91s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  44%|####3     | 1312/3000 [1:09:00<57:05,  2.03s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  44%|####3     | 1312/3000 [1:09:00<57:05,  2.03s/it, lr: 1.0e-04 loss: 1.946e-01]hash_cache_v1:  44%|####3     | 1312/3000 [1:09:05<57:05,  2.03s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  44%|####3     | 1312/3000 [1:09:05<57:05,  2.03s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  44%|####3     | 1313/3000 [1:09:05<1:13:49,  2.63s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  44%|####3     | 1313/3000 [1:09:05<1:13:49,  2.63s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  44%|####3     | 1313/3000 [1:09:09<1:13:49,  2.63s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  44%|####3     | 1313/3000 [1:09:09<1:13:49,  2.63s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  44%|####3     | 1314/3000 [1:09:09<1:26:38,  3.08s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  44%|####3     | 1314/3000 [1:09:09<1:26:38,  3.08s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  44%|####3     | 1314/3000 [1:09:14<1:26:38,  3.08s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  44%|####3     | 1314/3000 [1:09:14<1:26:38,  3.08s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  44%|####3     | 1315/3000 [1:09:14<1:37:41,  3.48s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  44%|####3     | 1315/3000 [1:09:14<1:37:41,  3.48s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  44%|####3     | 1315/3000 [1:09:16<1:37:41,  3.48s/it, lr: 1.0e-04 loss: 7.884e-02]hash_cache_v1:  44%|####3     | 1315/3000 [1:09:16<1:37:41,  3.48s/it, lr: 1.0e-04 loss: 7.884e-02]hash_cache_v1:  44%|####3     | 1316/3000 [1:09:16<1:26:42,  3.09s/it, lr: 1.0e-04 loss: 7.884e-02]hash_cache_v1:  44%|####3     | 1316/3000 [1:09:16<1:26:42,  3.09s/it, lr: 1.0e-04 loss: 7.884e-02]hash_cache_v1:  44%|####3     | 1316/3000 [1:09:19<1:26:42,  3.09s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  44%|####3     | 1316/3000 [1:09:19<1:26:42,  3.09s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  44%|####3     | 1317/3000 [1:09:19<1:25:06,  3.03s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  44%|####3     | 1317/3000 [1:09:19<1:25:06,  3.03s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  44%|####3     | 1317/3000 [1:09:23<1:25:06,  3.03s/it, lr: 1.0e-04 loss: 7.455e-02]hash_cache_v1:  44%|####3     | 1317/3000 [1:09:23<1:25:06,  3.03s/it, lr: 1.0e-04 loss: 7.455e-02]hash_cache_v1:  44%|####3     | 1318/3000 [1:09:23<1:35:15,  3.40s/it, lr: 1.0e-04 loss: 7.455e-02]hash_cache_v1:  44%|####3     | 1318/3000 [1:09:23<1:35:15,  3.40s/it, lr: 1.0e-04 loss: 7.455e-02]hash_cache_v1:  44%|####3     | 1318/3000 [1:09:26<1:35:15,  3.40s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  44%|####3     | 1318/3000 [1:09:26<1:35:15,  3.40s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  44%|####3     | 1319/3000 [1:09:26<1:32:40,  3.31s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  44%|####3     | 1319/3000 [1:09:26<1:32:40,  3.31s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  44%|####3     | 1319/3000 [1:09:30<1:32:40,  3.31s/it, lr: 1.0e-04 loss: 1.107e-01]hash_cache_v1:  44%|####3     | 1319/3000 [1:09:30<1:32:40,  3.31s/it, lr: 1.0e-04 loss: 1.107e-01]hash_cache_v1:  44%|####4     | 1320/3000 [1:09:32<1:32:37,  3.31s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  44%|####4     | 1320/3000 [1:09:32<1:32:37,  3.31s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  44%|####4     | 1321/3000 [1:09:32<1:03:48,  2.28s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  44%|####4     | 1321/3000 [1:09:32<1:03:48,  2.28s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  44%|####4     | 1321/3000 [1:09:35<1:03:48,  2.28s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  44%|####4     | 1321/3000 [1:09:35<1:03:48,  2.28s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  44%|####4     | 1322/3000 [1:09:35<1:07:54,  2.43s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  44%|####4     | 1322/3000 [1:09:35<1:07:54,  2.43s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  44%|####4     | 1322/3000 [1:09:38<1:07:54,  2.43s/it, lr: 1.0e-04 loss: 2.448e-02]hash_cache_v1:  44%|####4     | 1322/3000 [1:09:38<1:07:54,  2.43s/it, lr: 1.0e-04 loss: 2.448e-02]hash_cache_v1:  44%|####4     | 1323/3000 [1:09:38<1:13:01,  2.61s/it, lr: 1.0e-04 loss: 2.448e-02]hash_cache_v1:  44%|####4     | 1323/3000 [1:09:38<1:13:01,  2.61s/it, lr: 1.0e-04 loss: 2.448e-02]hash_cache_v1:  44%|####4     | 1323/3000 [1:09:41<1:13:01,  2.61s/it, lr: 1.0e-04 loss: 3.254e-02]hash_cache_v1:  44%|####4     | 1323/3000 [1:09:41<1:13:01,  2.61s/it, lr: 1.0e-04 loss: 3.254e-02]hash_cache_v1:  44%|####4     | 1324/3000 [1:09:41<1:09:08,  2.48s/it, lr: 1.0e-04 loss: 3.254e-02]hash_cache_v1:  44%|####4     | 1324/3000 [1:09:41<1:09:08,  2.48s/it, lr: 1.0e-04 loss: 3.254e-02]hash_cache_v1:  44%|####4     | 1324/3000 [1:09:43<1:09:08,  2.48s/it, lr: 1.0e-04 loss: 9.087e-02]hash_cache_v1:  44%|####4     | 1324/3000 [1:09:43<1:09:08,  2.48s/it, lr: 1.0e-04 loss: 9.087e-02]hash_cache_v1:  44%|####4     | 1325/3000 [1:09:43<1:06:31,  2.38s/it, lr: 1.0e-04 loss: 9.087e-02]hash_cache_v1:  44%|####4     | 1325/3000 [1:09:43<1:06:31,  2.38s/it, lr: 1.0e-04 loss: 9.087e-02]hash_cache_v1:  44%|####4     | 1325/3000 [1:09:45<1:06:31,  2.38s/it, lr: 1.0e-04 loss: 1.683e-01]hash_cache_v1:  44%|####4     | 1325/3000 [1:09:45<1:06:31,  2.38s/it, lr: 1.0e-04 loss: 1.683e-01]hash_cache_v1:  44%|####4     | 1326/3000 [1:09:45<1:06:24,  2.38s/it, lr: 1.0e-04 loss: 1.683e-01]hash_cache_v1:  44%|####4     | 1326/3000 [1:09:45<1:06:24,  2.38s/it, lr: 1.0e-04 loss: 1.683e-01]hash_cache_v1:  44%|####4     | 1326/3000 [1:09:48<1:06:24,  2.38s/it, lr: 1.0e-04 loss: 1.965e-02]hash_cache_v1:  44%|####4     | 1326/3000 [1:09:48<1:06:24,  2.38s/it, lr: 1.0e-04 loss: 1.965e-02]hash_cache_v1:  44%|####4     | 1327/3000 [1:09:48<1:10:29,  2.53s/it, lr: 1.0e-04 loss: 1.965e-02]hash_cache_v1:  44%|####4     | 1327/3000 [1:09:48<1:10:29,  2.53s/it, lr: 1.0e-04 loss: 1.965e-02]hash_cache_v1:  44%|####4     | 1327/3000 [1:09:51<1:10:29,  2.53s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  44%|####4     | 1327/3000 [1:09:51<1:10:29,  2.53s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  44%|####4     | 1328/3000 [1:09:51<1:13:27,  2.64s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  44%|####4     | 1328/3000 [1:09:51<1:13:27,  2.64s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  44%|####4     | 1328/3000 [1:09:55<1:13:27,  2.64s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  44%|####4     | 1328/3000 [1:09:55<1:13:27,  2.64s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  44%|####4     | 1329/3000 [1:09:55<1:27:22,  3.14s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  44%|####4     | 1329/3000 [1:09:55<1:27:22,  3.14s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  44%|####4     | 1329/3000 [1:10:00<1:27:22,  3.14s/it, lr: 1.0e-04 loss: 1.170e-01]hash_cache_v1:  44%|####4     | 1329/3000 [1:10:00<1:27:22,  3.14s/it, lr: 1.0e-04 loss: 1.170e-01]hash_cache_v1:  44%|####4     | 1330/3000 [1:10:03<1:27:19,  3.14s/it, lr: 1.0e-04 loss: 1.234e-01]hash_cache_v1:  44%|####4     | 1330/3000 [1:10:03<1:27:19,  3.14s/it, lr: 1.0e-04 loss: 1.234e-01]hash_cache_v1:  44%|####4     | 1331/3000 [1:10:03<1:05:38,  2.36s/it, lr: 1.0e-04 loss: 1.234e-01]hash_cache_v1:  44%|####4     | 1331/3000 [1:10:03<1:05:38,  2.36s/it, lr: 1.0e-04 loss: 1.234e-01]hash_cache_v1:  44%|####4     | 1331/3000 [1:10:05<1:05:38,  2.36s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  44%|####4     | 1331/3000 [1:10:05<1:05:38,  2.36s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  44%|####4     | 1332/3000 [1:10:05<1:08:49,  2.48s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  44%|####4     | 1332/3000 [1:10:05<1:08:49,  2.48s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  44%|####4     | 1332/3000 [1:10:08<1:08:49,  2.48s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  44%|####4     | 1332/3000 [1:10:08<1:08:49,  2.48s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  44%|####4     | 1333/3000 [1:10:08<1:07:52,  2.44s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  44%|####4     | 1333/3000 [1:10:08<1:07:52,  2.44s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  44%|####4     | 1333/3000 [1:10:12<1:07:52,  2.44s/it, lr: 1.0e-04 loss: 2.496e-02]hash_cache_v1:  44%|####4     | 1333/3000 [1:10:12<1:07:52,  2.44s/it, lr: 1.0e-04 loss: 2.496e-02]hash_cache_v1:  44%|####4     | 1334/3000 [1:10:12<1:21:31,  2.94s/it, lr: 1.0e-04 loss: 2.496e-02]hash_cache_v1:  44%|####4     | 1334/3000 [1:10:12<1:21:31,  2.94s/it, lr: 1.0e-04 loss: 2.496e-02]hash_cache_v1:  44%|####4     | 1334/3000 [1:10:15<1:21:31,  2.94s/it, lr: 1.0e-04 loss: 6.052e-02]hash_cache_v1:  44%|####4     | 1334/3000 [1:10:15<1:21:31,  2.94s/it, lr: 1.0e-04 loss: 6.052e-02]hash_cache_v1:  44%|####4     | 1335/3000 [1:10:15<1:20:48,  2.91s/it, lr: 1.0e-04 loss: 6.052e-02]hash_cache_v1:  44%|####4     | 1335/3000 [1:10:15<1:20:48,  2.91s/it, lr: 1.0e-04 loss: 6.052e-02]hash_cache_v1:  44%|####4     | 1335/3000 [1:10:19<1:20:48,  2.91s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  44%|####4     | 1335/3000 [1:10:19<1:20:48,  2.91s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  45%|####4     | 1336/3000 [1:10:19<1:31:03,  3.28s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  45%|####4     | 1336/3000 [1:10:19<1:31:03,  3.28s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  45%|####4     | 1336/3000 [1:10:24<1:31:03,  3.28s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  45%|####4     | 1336/3000 [1:10:24<1:31:03,  3.28s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  45%|####4     | 1337/3000 [1:10:24<1:40:51,  3.64s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  45%|####4     | 1337/3000 [1:10:24<1:40:51,  3.64s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  45%|####4     | 1337/3000 [1:10:26<1:40:51,  3.64s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  45%|####4     | 1337/3000 [1:10:26<1:40:51,  3.64s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  45%|####4     | 1338/3000 [1:10:26<1:34:33,  3.41s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  45%|####4     | 1338/3000 [1:10:26<1:34:33,  3.41s/it, lr: 1.0e-04 loss: 1.430e-01]hash_cache_v1:  45%|####4     | 1338/3000 [1:10:29<1:34:33,  3.41s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  45%|####4     | 1338/3000 [1:10:29<1:34:33,  3.41s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  45%|####4     | 1339/3000 [1:10:29<1:30:17,  3.26s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  45%|####4     | 1339/3000 [1:10:29<1:30:17,  3.26s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  45%|####4     | 1339/3000 [1:10:32<1:30:17,  3.26s/it, lr: 1.0e-04 loss: 9.388e-02]hash_cache_v1:  45%|####4     | 1339/3000 [1:10:32<1:30:17,  3.26s/it, lr: 1.0e-04 loss: 9.388e-02]hash_cache_v1:  45%|####4     | 1340/3000 [1:10:37<1:30:13,  3.26s/it, lr: 1.0e-04 loss: 8.422e-02]hash_cache_v1:  45%|####4     | 1340/3000 [1:10:37<1:30:13,  3.26s/it, lr: 1.0e-04 loss: 8.422e-02]hash_cache_v1:  45%|####4     | 1341/3000 [1:10:37<1:16:15,  2.76s/it, lr: 1.0e-04 loss: 8.422e-02]hash_cache_v1:  45%|####4     | 1341/3000 [1:10:37<1:16:15,  2.76s/it, lr: 1.0e-04 loss: 8.422e-02]hash_cache_v1:  45%|####4     | 1341/3000 [1:10:41<1:16:15,  2.76s/it, lr: 1.0e-04 loss: 3.442e-02]hash_cache_v1:  45%|####4     | 1341/3000 [1:10:41<1:16:15,  2.76s/it, lr: 1.0e-04 loss: 3.442e-02]hash_cache_v1:  45%|####4     | 1342/3000 [1:10:41<1:26:36,  3.13s/it, lr: 1.0e-04 loss: 3.442e-02]hash_cache_v1:  45%|####4     | 1342/3000 [1:10:41<1:26:36,  3.13s/it, lr: 1.0e-04 loss: 3.442e-02]hash_cache_v1:  45%|####4     | 1342/3000 [1:10:45<1:26:36,  3.13s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  45%|####4     | 1342/3000 [1:10:45<1:26:36,  3.13s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  45%|####4     | 1343/3000 [1:10:45<1:34:54,  3.44s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  45%|####4     | 1343/3000 [1:10:45<1:34:54,  3.44s/it, lr: 1.0e-04 loss: 1.131e-01]hash_cache_v1:  45%|####4     | 1343/3000 [1:10:48<1:34:54,  3.44s/it, lr: 1.0e-04 loss: 1.969e-01]hash_cache_v1:  45%|####4     | 1343/3000 [1:10:48<1:34:54,  3.44s/it, lr: 1.0e-04 loss: 1.969e-01]hash_cache_v1:  45%|####4     | 1344/3000 [1:10:48<1:27:09,  3.16s/it, lr: 1.0e-04 loss: 1.969e-01]hash_cache_v1:  45%|####4     | 1344/3000 [1:10:48<1:27:09,  3.16s/it, lr: 1.0e-04 loss: 1.969e-01]hash_cache_v1:  45%|####4     | 1344/3000 [1:10:50<1:27:09,  3.16s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  45%|####4     | 1344/3000 [1:10:50<1:27:09,  3.16s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  45%|####4     | 1345/3000 [1:10:50<1:19:07,  2.87s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  45%|####4     | 1345/3000 [1:10:50<1:19:07,  2.87s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  45%|####4     | 1345/3000 [1:10:53<1:19:07,  2.87s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  45%|####4     | 1345/3000 [1:10:53<1:19:07,  2.87s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  45%|####4     | 1346/3000 [1:10:53<1:19:08,  2.87s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  45%|####4     | 1346/3000 [1:10:53<1:19:08,  2.87s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  45%|####4     | 1346/3000 [1:10:57<1:19:08,  2.87s/it, lr: 1.0e-04 loss: 2.278e-02]hash_cache_v1:  45%|####4     | 1346/3000 [1:10:57<1:19:08,  2.87s/it, lr: 1.0e-04 loss: 2.278e-02]hash_cache_v1:  45%|####4     | 1347/3000 [1:10:57<1:30:22,  3.28s/it, lr: 1.0e-04 loss: 2.278e-02]hash_cache_v1:  45%|####4     | 1347/3000 [1:10:57<1:30:22,  3.28s/it, lr: 1.0e-04 loss: 2.278e-02]hash_cache_v1:  45%|####4     | 1347/3000 [1:11:00<1:30:22,  3.28s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  45%|####4     | 1347/3000 [1:11:00<1:30:22,  3.28s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  45%|####4     | 1348/3000 [1:11:00<1:28:33,  3.22s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  45%|####4     | 1348/3000 [1:11:00<1:28:33,  3.22s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  45%|####4     | 1348/3000 [1:11:04<1:28:33,  3.22s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  45%|####4     | 1348/3000 [1:11:04<1:28:33,  3.22s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  45%|####4     | 1349/3000 [1:11:04<1:37:41,  3.55s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  45%|####4     | 1349/3000 [1:11:04<1:37:41,  3.55s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  45%|####4     | 1349/3000 [1:11:07<1:37:41,  3.55s/it, lr: 1.0e-04 loss: 1.539e-01]hash_cache_v1:  45%|####4     | 1349/3000 [1:11:07<1:37:41,  3.55s/it, lr: 1.0e-04 loss: 1.539e-01]hash_cache_v1:  45%|####5     | 1350/3000 [1:11:12<1:37:37,  3.55s/it, lr: 1.0e-04 loss: 9.729e-03]hash_cache_v1:  45%|####5     | 1350/3000 [1:11:12<1:37:37,  3.55s/it, lr: 1.0e-04 loss: 9.729e-03]hash_cache_v1:  45%|####5     | 1351/3000 [1:11:12<1:21:57,  2.98s/it, lr: 1.0e-04 loss: 9.729e-03]hash_cache_v1:  45%|####5     | 1351/3000 [1:11:12<1:21:57,  2.98s/it, lr: 1.0e-04 loss: 9.729e-03]hash_cache_v1:  45%|####5     | 1351/3000 [1:11:16<1:21:57,  2.98s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  45%|####5     | 1351/3000 [1:11:16<1:21:57,  2.98s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  45%|####5     | 1352/3000 [1:11:16<1:31:02,  3.31s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  45%|####5     | 1352/3000 [1:11:16<1:31:02,  3.31s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  45%|####5     | 1352/3000 [1:11:20<1:31:02,  3.31s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  45%|####5     | 1352/3000 [1:11:20<1:31:02,  3.31s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  45%|####5     | 1353/3000 [1:11:20<1:37:52,  3.57s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  45%|####5     | 1353/3000 [1:11:20<1:37:52,  3.57s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  45%|####5     | 1353/3000 [1:11:22<1:37:52,  3.57s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  45%|####5     | 1353/3000 [1:11:22<1:37:52,  3.57s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  45%|####5     | 1354/3000 [1:11:22<1:26:59,  3.17s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  45%|####5     | 1354/3000 [1:11:22<1:26:59,  3.17s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  45%|####5     | 1354/3000 [1:11:25<1:26:59,  3.17s/it, lr: 1.0e-04 loss: 2.062e-01]hash_cache_v1:  45%|####5     | 1354/3000 [1:11:25<1:26:59,  3.17s/it, lr: 1.0e-04 loss: 2.062e-01]hash_cache_v1:  45%|####5     | 1355/3000 [1:11:25<1:21:02,  2.96s/it, lr: 1.0e-04 loss: 2.062e-01]hash_cache_v1:  45%|####5     | 1355/3000 [1:11:25<1:21:02,  2.96s/it, lr: 1.0e-04 loss: 2.062e-01]hash_cache_v1:  45%|####5     | 1355/3000 [1:11:29<1:21:02,  2.96s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  45%|####5     | 1355/3000 [1:11:29<1:21:02,  2.96s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  45%|####5     | 1356/3000 [1:11:29<1:31:18,  3.33s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  45%|####5     | 1356/3000 [1:11:29<1:31:18,  3.33s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  45%|####5     | 1356/3000 [1:11:32<1:31:18,  3.33s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  45%|####5     | 1356/3000 [1:11:32<1:31:18,  3.33s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  45%|####5     | 1357/3000 [1:11:32<1:27:39,  3.20s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  45%|####5     | 1357/3000 [1:11:32<1:27:39,  3.20s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  45%|####5     | 1357/3000 [1:11:35<1:27:39,  3.20s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  45%|####5     | 1357/3000 [1:11:35<1:27:39,  3.20s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  45%|####5     | 1358/3000 [1:11:35<1:25:00,  3.11s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  45%|####5     | 1358/3000 [1:11:35<1:25:00,  3.11s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  45%|####5     | 1358/3000 [1:11:39<1:25:00,  3.11s/it, lr: 1.0e-04 loss: 1.511e-01]hash_cache_v1:  45%|####5     | 1358/3000 [1:11:39<1:25:00,  3.11s/it, lr: 1.0e-04 loss: 1.511e-01]hash_cache_v1:  45%|####5     | 1359/3000 [1:11:39<1:36:28,  3.53s/it, lr: 1.0e-04 loss: 1.511e-01]hash_cache_v1:  45%|####5     | 1359/3000 [1:11:39<1:36:28,  3.53s/it, lr: 1.0e-04 loss: 1.511e-01]hash_cache_v1:  45%|####5     | 1359/3000 [1:11:43<1:36:28,  3.53s/it, lr: 1.0e-04 loss: 5.294e-02]hash_cache_v1:  45%|####5     | 1359/3000 [1:11:43<1:36:28,  3.53s/it, lr: 1.0e-04 loss: 5.294e-02]hash_cache_v1:  45%|####5     | 1360/3000 [1:11:46<1:36:25,  3.53s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  45%|####5     | 1360/3000 [1:11:46<1:36:25,  3.53s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  45%|####5     | 1361/3000 [1:11:46<1:10:04,  2.57s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  45%|####5     | 1361/3000 [1:11:46<1:10:04,  2.57s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  45%|####5     | 1361/3000 [1:11:49<1:10:04,  2.57s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1:  45%|####5     | 1361/3000 [1:11:49<1:10:04,  2.57s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1:  45%|####5     | 1362/3000 [1:11:49<1:08:38,  2.51s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1:  45%|####5     | 1362/3000 [1:11:49<1:08:38,  2.51s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1:  45%|####5     | 1362/3000 [1:11:51<1:08:38,  2.51s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  45%|####5     | 1362/3000 [1:11:51<1:08:38,  2.51s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  45%|####5     | 1363/3000 [1:11:51<1:05:43,  2.41s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  45%|####5     | 1363/3000 [1:11:51<1:05:43,  2.41s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  45%|####5     | 1363/3000 [1:11:55<1:05:43,  2.41s/it, lr: 1.0e-04 loss: 1.147e-01]hash_cache_v1:  45%|####5     | 1363/3000 [1:11:55<1:05:43,  2.41s/it, lr: 1.0e-04 loss: 1.147e-01]hash_cache_v1:  45%|####5     | 1364/3000 [1:11:55<1:19:37,  2.92s/it, lr: 1.0e-04 loss: 1.147e-01]hash_cache_v1:  45%|####5     | 1364/3000 [1:11:55<1:19:37,  2.92s/it, lr: 1.0e-04 loss: 1.147e-01]hash_cache_v1:  45%|####5     | 1364/3000 [1:11:59<1:19:37,  2.92s/it, lr: 1.0e-04 loss: 5.201e-02]hash_cache_v1:  45%|####5     | 1364/3000 [1:11:59<1:19:37,  2.92s/it, lr: 1.0e-04 loss: 5.201e-02]hash_cache_v1:  46%|####5     | 1365/3000 [1:11:59<1:29:54,  3.30s/it, lr: 1.0e-04 loss: 5.201e-02]hash_cache_v1:  46%|####5     | 1365/3000 [1:11:59<1:29:54,  3.30s/it, lr: 1.0e-04 loss: 5.201e-02]hash_cache_v1:  46%|####5     | 1365/3000 [1:12:04<1:29:54,  3.30s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:  46%|####5     | 1365/3000 [1:12:04<1:29:54,  3.30s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:  46%|####5     | 1366/3000 [1:12:04<1:38:24,  3.61s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:  46%|####5     | 1366/3000 [1:12:04<1:38:24,  3.61s/it, lr: 1.0e-04 loss: 1.367e-01]hash_cache_v1:  46%|####5     | 1366/3000 [1:12:06<1:38:24,  3.61s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  46%|####5     | 1366/3000 [1:12:06<1:38:24,  3.61s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  46%|####5     | 1367/3000 [1:12:06<1:26:31,  3.18s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  46%|####5     | 1367/3000 [1:12:06<1:26:31,  3.18s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  46%|####5     | 1367/3000 [1:12:09<1:26:31,  3.18s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  46%|####5     | 1367/3000 [1:12:09<1:26:31,  3.18s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  46%|####5     | 1368/3000 [1:12:09<1:24:02,  3.09s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  46%|####5     | 1368/3000 [1:12:09<1:24:02,  3.09s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  46%|####5     | 1368/3000 [1:12:12<1:24:02,  3.09s/it, lr: 1.0e-04 loss: 8.281e-02]hash_cache_v1:  46%|####5     | 1368/3000 [1:12:12<1:24:02,  3.09s/it, lr: 1.0e-04 loss: 8.281e-02]hash_cache_v1:  46%|####5     | 1369/3000 [1:12:12<1:22:20,  3.03s/it, lr: 1.0e-04 loss: 8.281e-02]hash_cache_v1:  46%|####5     | 1369/3000 [1:12:12<1:22:20,  3.03s/it, lr: 1.0e-04 loss: 8.281e-02]hash_cache_v1:  46%|####5     | 1369/3000 [1:12:14<1:22:20,  3.03s/it, lr: 1.0e-04 loss: 2.005e-01]hash_cache_v1:  46%|####5     | 1369/3000 [1:12:14<1:22:20,  3.03s/it, lr: 1.0e-04 loss: 2.005e-01]hash_cache_v1:  46%|####5     | 1370/3000 [1:12:16<1:22:17,  3.03s/it, lr: 1.0e-04 loss: 1.935e-01]hash_cache_v1:  46%|####5     | 1370/3000 [1:12:16<1:22:17,  3.03s/it, lr: 1.0e-04 loss: 1.935e-01]hash_cache_v1:  46%|####5     | 1371/3000 [1:12:16<57:51,  2.13s/it, lr: 1.0e-04 loss: 1.935e-01]  hash_cache_v1:  46%|####5     | 1371/3000 [1:12:16<57:51,  2.13s/it, lr: 1.0e-04 loss: 1.935e-01]  hash_cache_v1:  46%|####5     | 1371/3000 [1:12:19<57:51,  2.13s/it, lr: 1.0e-04 loss: 7.910e-02]hash_cache_v1:  46%|####5     | 1371/3000 [1:12:19<57:51,  2.13s/it, lr: 1.0e-04 loss: 7.910e-02]hash_cache_v1:  46%|####5     | 1372/3000 [1:12:19<1:02:53,  2.32s/it, lr: 1.0e-04 loss: 7.910e-02]hash_cache_v1:  46%|####5     | 1372/3000 [1:12:19<1:02:53,  2.32s/it, lr: 1.0e-04 loss: 7.910e-02]hash_cache_v1:  46%|####5     | 1372/3000 [1:12:22<1:02:53,  2.32s/it, lr: 1.0e-04 loss: 1.704e-02]hash_cache_v1:  46%|####5     | 1372/3000 [1:12:22<1:02:53,  2.32s/it, lr: 1.0e-04 loss: 1.704e-02]hash_cache_v1:  46%|####5     | 1373/3000 [1:12:22<1:08:07,  2.51s/it, lr: 1.0e-04 loss: 1.704e-02]hash_cache_v1:  46%|####5     | 1373/3000 [1:12:22<1:08:07,  2.51s/it, lr: 1.0e-04 loss: 1.704e-02]hash_cache_v1:  46%|####5     | 1373/3000 [1:12:26<1:08:07,  2.51s/it, lr: 1.0e-04 loss: 7.823e-02]hash_cache_v1:  46%|####5     | 1373/3000 [1:12:26<1:08:07,  2.51s/it, lr: 1.0e-04 loss: 7.823e-02]hash_cache_v1:  46%|####5     | 1374/3000 [1:12:26<1:21:06,  2.99s/it, lr: 1.0e-04 loss: 7.823e-02]hash_cache_v1:  46%|####5     | 1374/3000 [1:12:26<1:21:06,  2.99s/it, lr: 1.0e-04 loss: 7.823e-02]hash_cache_v1:  46%|####5     | 1374/3000 [1:12:29<1:21:06,  2.99s/it, lr: 1.0e-04 loss: 1.482e-01]hash_cache_v1:  46%|####5     | 1374/3000 [1:12:29<1:21:06,  2.99s/it, lr: 1.0e-04 loss: 1.482e-01]hash_cache_v1:  46%|####5     | 1375/3000 [1:12:29<1:20:17,  2.96s/it, lr: 1.0e-04 loss: 1.482e-01]hash_cache_v1:  46%|####5     | 1375/3000 [1:12:29<1:20:17,  2.96s/it, lr: 1.0e-04 loss: 1.482e-01]hash_cache_v1:  46%|####5     | 1375/3000 [1:12:33<1:20:17,  2.96s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  46%|####5     | 1375/3000 [1:12:33<1:20:17,  2.96s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  46%|####5     | 1376/3000 [1:12:33<1:30:22,  3.34s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  46%|####5     | 1376/3000 [1:12:33<1:30:22,  3.34s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  46%|####5     | 1376/3000 [1:12:38<1:30:22,  3.34s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  46%|####5     | 1376/3000 [1:12:38<1:30:22,  3.34s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  46%|####5     | 1377/3000 [1:12:38<1:39:00,  3.66s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  46%|####5     | 1377/3000 [1:12:38<1:39:00,  3.66s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  46%|####5     | 1377/3000 [1:12:40<1:39:00,  3.66s/it, lr: 1.0e-04 loss: 1.938e-01]hash_cache_v1:  46%|####5     | 1377/3000 [1:12:40<1:39:00,  3.66s/it, lr: 1.0e-04 loss: 1.938e-01]hash_cache_v1:  46%|####5     | 1378/3000 [1:12:40<1:26:40,  3.21s/it, lr: 1.0e-04 loss: 1.938e-01]hash_cache_v1:  46%|####5     | 1378/3000 [1:12:40<1:26:40,  3.21s/it, lr: 1.0e-04 loss: 1.938e-01]hash_cache_v1:  46%|####5     | 1378/3000 [1:12:44<1:26:40,  3.21s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  46%|####5     | 1378/3000 [1:12:44<1:26:40,  3.21s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  46%|####5     | 1379/3000 [1:12:44<1:35:32,  3.54s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  46%|####5     | 1379/3000 [1:12:44<1:35:32,  3.54s/it, lr: 1.0e-04 loss: 1.471e-01]hash_cache_v1:  46%|####5     | 1379/3000 [1:12:47<1:35:32,  3.54s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  46%|####5     | 1379/3000 [1:12:47<1:35:32,  3.54s/it, lr: 1.0e-04 loss: 1.645e-01]hash_cache_v1:  46%|####6     | 1380/3000 [1:12:49<1:35:28,  3.54s/it, lr: 1.0e-04 loss: 1.784e-01]hash_cache_v1:  46%|####6     | 1380/3000 [1:12:49<1:35:28,  3.54s/it, lr: 1.0e-04 loss: 1.784e-01]hash_cache_v1:  46%|####6     | 1381/3000 [1:12:49<1:04:49,  2.40s/it, lr: 1.0e-04 loss: 1.784e-01]hash_cache_v1:  46%|####6     | 1381/3000 [1:12:49<1:04:49,  2.40s/it, lr: 1.0e-04 loss: 1.784e-01]hash_cache_v1:  46%|####6     | 1381/3000 [1:12:51<1:04:49,  2.40s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  46%|####6     | 1381/3000 [1:12:51<1:04:49,  2.40s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  46%|####6     | 1382/3000 [1:12:51<1:02:48,  2.33s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  46%|####6     | 1382/3000 [1:12:51<1:02:48,  2.33s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  46%|####6     | 1382/3000 [1:12:55<1:02:48,  2.33s/it, lr: 1.0e-04 loss: 8.059e-02]hash_cache_v1:  46%|####6     | 1382/3000 [1:12:55<1:02:48,  2.33s/it, lr: 1.0e-04 loss: 8.059e-02]hash_cache_v1:  46%|####6     | 1383/3000 [1:12:55<1:16:52,  2.85s/it, lr: 1.0e-04 loss: 8.059e-02]hash_cache_v1:  46%|####6     | 1383/3000 [1:12:55<1:16:52,  2.85s/it, lr: 1.0e-04 loss: 8.059e-02]hash_cache_v1:  46%|####6     | 1383/3000 [1:13:00<1:16:52,  2.85s/it, lr: 1.0e-04 loss: 6.032e-02]hash_cache_v1:  46%|####6     | 1383/3000 [1:13:00<1:16:52,  2.85s/it, lr: 1.0e-04 loss: 6.032e-02]hash_cache_v1:  46%|####6     | 1384/3000 [1:13:00<1:29:03,  3.31s/it, lr: 1.0e-04 loss: 6.032e-02]hash_cache_v1:  46%|####6     | 1384/3000 [1:13:00<1:29:03,  3.31s/it, lr: 1.0e-04 loss: 6.032e-02]hash_cache_v1:  46%|####6     | 1384/3000 [1:13:03<1:29:03,  3.31s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  46%|####6     | 1384/3000 [1:13:03<1:29:03,  3.31s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  46%|####6     | 1385/3000 [1:13:03<1:25:52,  3.19s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  46%|####6     | 1385/3000 [1:13:03<1:25:52,  3.19s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  46%|####6     | 1385/3000 [1:13:07<1:25:52,  3.19s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  46%|####6     | 1385/3000 [1:13:07<1:25:52,  3.19s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  46%|####6     | 1386/3000 [1:13:07<1:34:45,  3.52s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  46%|####6     | 1386/3000 [1:13:07<1:34:45,  3.52s/it, lr: 1.0e-04 loss: 1.343e-01]hash_cache_v1:  46%|####6     | 1386/3000 [1:13:09<1:34:45,  3.52s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  46%|####6     | 1386/3000 [1:13:09<1:34:45,  3.52s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  46%|####6     | 1387/3000 [1:13:09<1:23:52,  3.12s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  46%|####6     | 1387/3000 [1:13:09<1:23:52,  3.12s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  46%|####6     | 1387/3000 [1:13:12<1:23:52,  3.12s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  46%|####6     | 1387/3000 [1:13:12<1:23:52,  3.12s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  46%|####6     | 1388/3000 [1:13:12<1:23:46,  3.12s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  46%|####6     | 1388/3000 [1:13:12<1:23:46,  3.12s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  46%|####6     | 1388/3000 [1:13:14<1:23:46,  3.12s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  46%|####6     | 1388/3000 [1:13:14<1:23:46,  3.12s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  46%|####6     | 1389/3000 [1:13:14<1:15:45,  2.82s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  46%|####6     | 1389/3000 [1:13:14<1:15:45,  2.82s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  46%|####6     | 1389/3000 [1:13:17<1:15:45,  2.82s/it, lr: 1.0e-04 loss: 1.854e-01]hash_cache_v1:  46%|####6     | 1389/3000 [1:13:17<1:15:45,  2.82s/it, lr: 1.0e-04 loss: 1.854e-01]hash_cache_v1:  46%|####6     | 1390/3000 [1:13:21<1:15:42,  2.82s/it, lr: 1.0e-04 loss: 5.943e-02]hash_cache_v1:  46%|####6     | 1390/3000 [1:13:21<1:15:42,  2.82s/it, lr: 1.0e-04 loss: 5.943e-02]hash_cache_v1:  46%|####6     | 1391/3000 [1:13:21<1:08:41,  2.56s/it, lr: 1.0e-04 loss: 5.943e-02]hash_cache_v1:  46%|####6     | 1391/3000 [1:13:21<1:08:41,  2.56s/it, lr: 1.0e-04 loss: 5.943e-02]hash_cache_v1:  46%|####6     | 1391/3000 [1:13:24<1:08:41,  2.56s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  46%|####6     | 1391/3000 [1:13:24<1:08:41,  2.56s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  46%|####6     | 1392/3000 [1:13:24<1:10:29,  2.63s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  46%|####6     | 1392/3000 [1:13:24<1:10:29,  2.63s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  46%|####6     | 1392/3000 [1:13:26<1:10:29,  2.63s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:  46%|####6     | 1392/3000 [1:13:26<1:10:29,  2.63s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:  46%|####6     | 1393/3000 [1:13:26<1:06:58,  2.50s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:  46%|####6     | 1393/3000 [1:13:26<1:06:58,  2.50s/it, lr: 1.0e-04 loss: 1.732e-01]hash_cache_v1:  46%|####6     | 1393/3000 [1:13:28<1:06:58,  2.50s/it, lr: 1.0e-04 loss: 7.489e-02]hash_cache_v1:  46%|####6     | 1393/3000 [1:13:28<1:06:58,  2.50s/it, lr: 1.0e-04 loss: 7.489e-02]hash_cache_v1:  46%|####6     | 1394/3000 [1:13:28<1:04:07,  2.40s/it, lr: 1.0e-04 loss: 7.489e-02]hash_cache_v1:  46%|####6     | 1394/3000 [1:13:28<1:04:07,  2.40s/it, lr: 1.0e-04 loss: 7.489e-02]hash_cache_v1:  46%|####6     | 1394/3000 [1:13:33<1:04:07,  2.40s/it, lr: 1.0e-04 loss: 6.733e-02]hash_cache_v1:  46%|####6     | 1394/3000 [1:13:33<1:04:07,  2.40s/it, lr: 1.0e-04 loss: 6.733e-02]hash_cache_v1:  46%|####6     | 1395/3000 [1:13:33<1:20:00,  2.99s/it, lr: 1.0e-04 loss: 6.733e-02]hash_cache_v1:  46%|####6     | 1395/3000 [1:13:33<1:20:00,  2.99s/it, lr: 1.0e-04 loss: 6.733e-02]hash_cache_v1:  46%|####6     | 1395/3000 [1:13:37<1:20:00,  2.99s/it, lr: 1.0e-04 loss: 1.376e-01]hash_cache_v1:  46%|####6     | 1395/3000 [1:13:37<1:20:00,  2.99s/it, lr: 1.0e-04 loss: 1.376e-01]hash_cache_v1:  47%|####6     | 1396/3000 [1:13:37<1:29:57,  3.37s/it, lr: 1.0e-04 loss: 1.376e-01]hash_cache_v1:  47%|####6     | 1396/3000 [1:13:37<1:29:57,  3.37s/it, lr: 1.0e-04 loss: 1.376e-01]hash_cache_v1:  47%|####6     | 1396/3000 [1:13:39<1:29:57,  3.37s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  47%|####6     | 1396/3000 [1:13:39<1:29:57,  3.37s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  47%|####6     | 1397/3000 [1:13:39<1:20:12,  3.00s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  47%|####6     | 1397/3000 [1:13:39<1:20:12,  3.00s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  47%|####6     | 1397/3000 [1:13:41<1:20:12,  3.00s/it, lr: 1.0e-04 loss: 6.235e-02]hash_cache_v1:  47%|####6     | 1397/3000 [1:13:41<1:20:12,  3.00s/it, lr: 1.0e-04 loss: 6.235e-02]hash_cache_v1:  47%|####6     | 1398/3000 [1:13:41<1:15:14,  2.82s/it, lr: 1.0e-04 loss: 6.235e-02]hash_cache_v1:  47%|####6     | 1398/3000 [1:13:41<1:15:14,  2.82s/it, lr: 1.0e-04 loss: 6.235e-02]hash_cache_v1:  47%|####6     | 1398/3000 [1:13:46<1:15:14,  2.82s/it, lr: 1.0e-04 loss: 7.238e-02]hash_cache_v1:  47%|####6     | 1398/3000 [1:13:46<1:15:14,  2.82s/it, lr: 1.0e-04 loss: 7.238e-02]hash_cache_v1:  47%|####6     | 1399/3000 [1:13:46<1:26:57,  3.26s/it, lr: 1.0e-04 loss: 7.238e-02]hash_cache_v1:  47%|####6     | 1399/3000 [1:13:46<1:26:57,  3.26s/it, lr: 1.0e-04 loss: 7.238e-02]hash_cache_v1:  47%|####6     | 1399/3000 [1:13:48<1:26:57,  3.26s/it, lr: 1.0e-04 loss: 1.292e-01]hash_cache_v1:  47%|####6     | 1399/3000 [1:13:48<1:26:57,  3.26s/it, lr: 1.0e-04 loss: 1.292e-01]hash_cache_v1:  47%|####6     | 1400/3000 [1:13:51<1:26:54,  3.26s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  47%|####6     | 1400/3000 [1:13:51<1:26:54,  3.26s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  47%|####6     | 1401/3000 [1:13:51<1:04:48,  2.43s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  47%|####6     | 1401/3000 [1:13:51<1:04:48,  2.43s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  47%|####6     | 1401/3000 [1:13:54<1:04:48,  2.43s/it, lr: 1.0e-04 loss: 1.493e-01]hash_cache_v1:  47%|####6     | 1401/3000 [1:13:54<1:04:48,  2.43s/it, lr: 1.0e-04 loss: 1.493e-01]hash_cache_v1:  47%|####6     | 1402/3000 [1:13:54<1:08:46,  2.58s/it, lr: 1.0e-04 loss: 1.493e-01]hash_cache_v1:  47%|####6     | 1402/3000 [1:13:54<1:08:46,  2.58s/it, lr: 1.0e-04 loss: 1.493e-01]hash_cache_v1:  47%|####6     | 1402/3000 [1:13:56<1:08:46,  2.58s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  47%|####6     | 1402/3000 [1:13:56<1:08:46,  2.58s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  47%|####6     | 1403/3000 [1:13:56<1:05:25,  2.46s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  47%|####6     | 1403/3000 [1:13:56<1:05:25,  2.46s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  47%|####6     | 1403/3000 [1:13:59<1:05:25,  2.46s/it, lr: 1.0e-04 loss: 1.661e-01]hash_cache_v1:  47%|####6     | 1403/3000 [1:13:59<1:05:25,  2.46s/it, lr: 1.0e-04 loss: 1.661e-01]hash_cache_v1:  47%|####6     | 1404/3000 [1:13:59<1:08:11,  2.56s/it, lr: 1.0e-04 loss: 1.661e-01]hash_cache_v1:  47%|####6     | 1404/3000 [1:13:59<1:08:11,  2.56s/it, lr: 1.0e-04 loss: 1.661e-01]hash_cache_v1:  47%|####6     | 1404/3000 [1:14:01<1:08:11,  2.56s/it, lr: 1.0e-04 loss: 3.813e-02]hash_cache_v1:  47%|####6     | 1404/3000 [1:14:01<1:08:11,  2.56s/it, lr: 1.0e-04 loss: 3.813e-02]hash_cache_v1:  47%|####6     | 1405/3000 [1:14:01<1:06:58,  2.52s/it, lr: 1.0e-04 loss: 3.813e-02]hash_cache_v1:  47%|####6     | 1405/3000 [1:14:01<1:06:58,  2.52s/it, lr: 1.0e-04 loss: 3.813e-02]hash_cache_v1:  47%|####6     | 1405/3000 [1:14:04<1:06:58,  2.52s/it, lr: 1.0e-04 loss: 5.818e-03]hash_cache_v1:  47%|####6     | 1405/3000 [1:14:04<1:06:58,  2.52s/it, lr: 1.0e-04 loss: 5.818e-03]hash_cache_v1:  47%|####6     | 1406/3000 [1:14:04<1:09:36,  2.62s/it, lr: 1.0e-04 loss: 5.818e-03]hash_cache_v1:  47%|####6     | 1406/3000 [1:14:04<1:09:36,  2.62s/it, lr: 1.0e-04 loss: 5.818e-03]hash_cache_v1:  47%|####6     | 1406/3000 [1:14:06<1:09:36,  2.62s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  47%|####6     | 1406/3000 [1:14:06<1:09:36,  2.62s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  47%|####6     | 1407/3000 [1:14:06<1:05:34,  2.47s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  47%|####6     | 1407/3000 [1:14:06<1:05:34,  2.47s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  47%|####6     | 1407/3000 [1:14:10<1:05:34,  2.47s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  47%|####6     | 1407/3000 [1:14:10<1:05:34,  2.47s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  47%|####6     | 1408/3000 [1:14:10<1:19:59,  3.01s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  47%|####6     | 1408/3000 [1:14:10<1:19:59,  3.01s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  47%|####6     | 1408/3000 [1:14:15<1:19:59,  3.01s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  47%|####6     | 1408/3000 [1:14:15<1:19:59,  3.01s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  47%|####6     | 1409/3000 [1:14:15<1:31:46,  3.46s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  47%|####6     | 1409/3000 [1:14:15<1:31:46,  3.46s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  47%|####6     | 1409/3000 [1:14:19<1:31:46,  3.46s/it, lr: 1.0e-04 loss: 1.081e-01]hash_cache_v1:  47%|####6     | 1409/3000 [1:14:19<1:31:46,  3.46s/it, lr: 1.0e-04 loss: 1.081e-01]hash_cache_v1:  47%|####6     | 1410/3000 [1:14:22<1:31:42,  3.46s/it, lr: 1.0e-04 loss: 8.273e-02]hash_cache_v1:  47%|####6     | 1410/3000 [1:14:22<1:31:42,  3.46s/it, lr: 1.0e-04 loss: 8.273e-02]hash_cache_v1:  47%|####7     | 1411/3000 [1:14:22<1:07:18,  2.54s/it, lr: 1.0e-04 loss: 8.273e-02]hash_cache_v1:  47%|####7     | 1411/3000 [1:14:22<1:07:18,  2.54s/it, lr: 1.0e-04 loss: 8.273e-02]hash_cache_v1:  47%|####7     | 1411/3000 [1:14:25<1:07:18,  2.54s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:  47%|####7     | 1411/3000 [1:14:25<1:07:18,  2.54s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:  47%|####7     | 1412/3000 [1:14:25<1:09:29,  2.63s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:  47%|####7     | 1412/3000 [1:14:25<1:09:29,  2.63s/it, lr: 1.0e-04 loss: 1.140e-01]hash_cache_v1:  47%|####7     | 1412/3000 [1:14:30<1:09:29,  2.63s/it, lr: 1.0e-04 loss: 1.712e-02]hash_cache_v1:  47%|####7     | 1412/3000 [1:14:30<1:09:29,  2.63s/it, lr: 1.0e-04 loss: 1.712e-02]hash_cache_v1:  47%|####7     | 1413/3000 [1:14:30<1:22:12,  3.11s/it, lr: 1.0e-04 loss: 1.712e-02]hash_cache_v1:  47%|####7     | 1413/3000 [1:14:30<1:22:12,  3.11s/it, lr: 1.0e-04 loss: 1.712e-02]hash_cache_v1:  47%|####7     | 1413/3000 [1:14:32<1:22:12,  3.11s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  47%|####7     | 1413/3000 [1:14:32<1:22:12,  3.11s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  47%|####7     | 1414/3000 [1:14:32<1:20:27,  3.04s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  47%|####7     | 1414/3000 [1:14:32<1:20:27,  3.04s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  47%|####7     | 1414/3000 [1:14:35<1:20:27,  3.04s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  47%|####7     | 1414/3000 [1:14:35<1:20:27,  3.04s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  47%|####7     | 1415/3000 [1:14:35<1:13:34,  2.79s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  47%|####7     | 1415/3000 [1:14:35<1:13:34,  2.79s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  47%|####7     | 1415/3000 [1:14:37<1:13:34,  2.79s/it, lr: 1.0e-04 loss: 4.443e-02]hash_cache_v1:  47%|####7     | 1415/3000 [1:14:37<1:13:34,  2.79s/it, lr: 1.0e-04 loss: 4.443e-02]hash_cache_v1:  47%|####7     | 1416/3000 [1:14:37<1:10:24,  2.67s/it, lr: 1.0e-04 loss: 4.443e-02]hash_cache_v1:  47%|####7     | 1416/3000 [1:14:37<1:10:24,  2.67s/it, lr: 1.0e-04 loss: 4.443e-02]hash_cache_v1:  47%|####7     | 1416/3000 [1:14:40<1:10:24,  2.67s/it, lr: 1.0e-04 loss: 8.126e-02]hash_cache_v1:  47%|####7     | 1416/3000 [1:14:40<1:10:24,  2.67s/it, lr: 1.0e-04 loss: 8.126e-02]hash_cache_v1:  47%|####7     | 1417/3000 [1:14:40<1:11:51,  2.72s/it, lr: 1.0e-04 loss: 8.126e-02]hash_cache_v1:  47%|####7     | 1417/3000 [1:14:40<1:11:51,  2.72s/it, lr: 1.0e-04 loss: 8.126e-02]hash_cache_v1:  47%|####7     | 1417/3000 [1:14:43<1:11:51,  2.72s/it, lr: 1.0e-04 loss: 6.622e-02]hash_cache_v1:  47%|####7     | 1417/3000 [1:14:43<1:11:51,  2.72s/it, lr: 1.0e-04 loss: 6.622e-02]hash_cache_v1:  47%|####7     | 1418/3000 [1:14:43<1:12:57,  2.77s/it, lr: 1.0e-04 loss: 6.622e-02]hash_cache_v1:  47%|####7     | 1418/3000 [1:14:43<1:12:57,  2.77s/it, lr: 1.0e-04 loss: 6.622e-02]hash_cache_v1:  47%|####7     | 1418/3000 [1:14:46<1:12:57,  2.77s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  47%|####7     | 1418/3000 [1:14:46<1:12:57,  2.77s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  47%|####7     | 1419/3000 [1:14:46<1:13:51,  2.80s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  47%|####7     | 1419/3000 [1:14:46<1:13:51,  2.80s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  47%|####7     | 1419/3000 [1:14:49<1:13:51,  2.80s/it, lr: 1.0e-04 loss: 1.024e-01]hash_cache_v1:  47%|####7     | 1419/3000 [1:14:49<1:13:51,  2.80s/it, lr: 1.0e-04 loss: 1.024e-01]hash_cache_v1:  47%|####7     | 1420/3000 [1:14:52<1:13:48,  2.80s/it, lr: 1.0e-04 loss: 9.890e-02]hash_cache_v1:  47%|####7     | 1420/3000 [1:14:52<1:13:48,  2.80s/it, lr: 1.0e-04 loss: 9.890e-02]hash_cache_v1:  47%|####7     | 1421/3000 [1:14:52<57:13,  2.17s/it, lr: 1.0e-04 loss: 9.890e-02]  hash_cache_v1:  47%|####7     | 1421/3000 [1:14:52<57:13,  2.17s/it, lr: 1.0e-04 loss: 9.890e-02]  hash_cache_v1:  47%|####7     | 1421/3000 [1:14:56<57:13,  2.17s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  47%|####7     | 1421/3000 [1:14:56<57:13,  2.17s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  47%|####7     | 1422/3000 [1:14:56<1:11:17,  2.71s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  47%|####7     | 1422/3000 [1:14:56<1:11:17,  2.71s/it, lr: 1.0e-04 loss: 1.508e-01]hash_cache_v1:  47%|####7     | 1422/3000 [1:14:59<1:11:17,  2.71s/it, lr: 1.0e-04 loss: 5.960e-02]hash_cache_v1:  47%|####7     | 1422/3000 [1:14:59<1:11:17,  2.71s/it, lr: 1.0e-04 loss: 5.960e-02]hash_cache_v1:  47%|####7     | 1423/3000 [1:14:59<1:12:29,  2.76s/it, lr: 1.0e-04 loss: 5.960e-02]hash_cache_v1:  47%|####7     | 1423/3000 [1:14:59<1:12:29,  2.76s/it, lr: 1.0e-04 loss: 5.960e-02]hash_cache_v1:  47%|####7     | 1423/3000 [1:15:02<1:12:29,  2.76s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  47%|####7     | 1423/3000 [1:15:02<1:12:29,  2.76s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  47%|####7     | 1424/3000 [1:15:02<1:14:27,  2.83s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  47%|####7     | 1424/3000 [1:15:02<1:14:27,  2.83s/it, lr: 1.0e-04 loss: 1.044e-01]hash_cache_v1:  47%|####7     | 1424/3000 [1:15:04<1:14:27,  2.83s/it, lr: 1.0e-04 loss: 8.766e-02]hash_cache_v1:  47%|####7     | 1424/3000 [1:15:04<1:14:27,  2.83s/it, lr: 1.0e-04 loss: 8.766e-02]hash_cache_v1:  48%|####7     | 1425/3000 [1:15:04<1:09:11,  2.64s/it, lr: 1.0e-04 loss: 8.766e-02]hash_cache_v1:  48%|####7     | 1425/3000 [1:15:04<1:09:11,  2.64s/it, lr: 1.0e-04 loss: 8.766e-02]hash_cache_v1:  48%|####7     | 1425/3000 [1:15:07<1:09:11,  2.64s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  48%|####7     | 1425/3000 [1:15:07<1:09:11,  2.64s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  48%|####7     | 1426/3000 [1:15:07<1:10:56,  2.70s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  48%|####7     | 1426/3000 [1:15:07<1:10:56,  2.70s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  48%|####7     | 1426/3000 [1:15:11<1:10:56,  2.70s/it, lr: 1.0e-04 loss: 1.915e-01]hash_cache_v1:  48%|####7     | 1426/3000 [1:15:11<1:10:56,  2.70s/it, lr: 1.0e-04 loss: 1.915e-01]hash_cache_v1:  48%|####7     | 1427/3000 [1:15:11<1:24:33,  3.23s/it, lr: 1.0e-04 loss: 1.915e-01]hash_cache_v1:  48%|####7     | 1427/3000 [1:15:11<1:24:33,  3.23s/it, lr: 1.0e-04 loss: 1.915e-01]hash_cache_v1:  48%|####7     | 1427/3000 [1:15:16<1:24:33,  3.23s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:  48%|####7     | 1427/3000 [1:15:16<1:24:33,  3.23s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:  48%|####7     | 1428/3000 [1:15:16<1:32:32,  3.53s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:  48%|####7     | 1428/3000 [1:15:16<1:32:32,  3.53s/it, lr: 1.0e-04 loss: 1.553e-01]hash_cache_v1:  48%|####7     | 1428/3000 [1:15:18<1:32:32,  3.53s/it, lr: 1.0e-04 loss: 2.427e-01]hash_cache_v1:  48%|####7     | 1428/3000 [1:15:18<1:32:32,  3.53s/it, lr: 1.0e-04 loss: 2.427e-01]hash_cache_v1:  48%|####7     | 1429/3000 [1:15:18<1:21:36,  3.12s/it, lr: 1.0e-04 loss: 2.427e-01]hash_cache_v1:  48%|####7     | 1429/3000 [1:15:18<1:21:36,  3.12s/it, lr: 1.0e-04 loss: 2.427e-01]hash_cache_v1:  48%|####7     | 1429/3000 [1:15:20<1:21:36,  3.12s/it, lr: 1.0e-04 loss: 1.636e-01]hash_cache_v1:  48%|####7     | 1429/3000 [1:15:20<1:21:36,  3.12s/it, lr: 1.0e-04 loss: 1.636e-01]hash_cache_v1:  48%|####7     | 1430/3000 [1:15:23<1:21:33,  3.12s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:  48%|####7     | 1430/3000 [1:15:23<1:21:33,  3.12s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:  48%|####7     | 1431/3000 [1:15:23<1:02:30,  2.39s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:  48%|####7     | 1431/3000 [1:15:23<1:02:30,  2.39s/it, lr: 1.0e-04 loss: 1.084e-01]hash_cache_v1:  48%|####7     | 1431/3000 [1:15:26<1:02:30,  2.39s/it, lr: 1.0e-04 loss: 1.528e-01]hash_cache_v1:  48%|####7     | 1431/3000 [1:15:26<1:02:30,  2.39s/it, lr: 1.0e-04 loss: 1.528e-01]hash_cache_v1:  48%|####7     | 1432/3000 [1:15:26<1:05:30,  2.51s/it, lr: 1.0e-04 loss: 1.528e-01]hash_cache_v1:  48%|####7     | 1432/3000 [1:15:26<1:05:30,  2.51s/it, lr: 1.0e-04 loss: 1.528e-01]hash_cache_v1:  48%|####7     | 1432/3000 [1:15:28<1:05:30,  2.51s/it, lr: 1.0e-04 loss: 7.097e-02]hash_cache_v1:  48%|####7     | 1432/3000 [1:15:28<1:05:30,  2.51s/it, lr: 1.0e-04 loss: 7.097e-02]hash_cache_v1:  48%|####7     | 1433/3000 [1:15:28<1:02:47,  2.40s/it, lr: 1.0e-04 loss: 7.097e-02]hash_cache_v1:  48%|####7     | 1433/3000 [1:15:28<1:02:47,  2.40s/it, lr: 1.0e-04 loss: 7.097e-02]hash_cache_v1:  48%|####7     | 1433/3000 [1:15:31<1:02:47,  2.40s/it, lr: 1.0e-04 loss: 1.552e-01]hash_cache_v1:  48%|####7     | 1433/3000 [1:15:31<1:02:47,  2.40s/it, lr: 1.0e-04 loss: 1.552e-01]hash_cache_v1:  48%|####7     | 1434/3000 [1:15:31<1:05:58,  2.53s/it, lr: 1.0e-04 loss: 1.552e-01]hash_cache_v1:  48%|####7     | 1434/3000 [1:15:31<1:05:58,  2.53s/it, lr: 1.0e-04 loss: 1.552e-01]hash_cache_v1:  48%|####7     | 1434/3000 [1:15:33<1:05:58,  2.53s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:  48%|####7     | 1434/3000 [1:15:33<1:05:58,  2.53s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:  48%|####7     | 1435/3000 [1:15:33<1:04:54,  2.49s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:  48%|####7     | 1435/3000 [1:15:33<1:04:54,  2.49s/it, lr: 1.0e-04 loss: 2.133e-01]hash_cache_v1:  48%|####7     | 1435/3000 [1:15:36<1:04:54,  2.49s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  48%|####7     | 1435/3000 [1:15:36<1:04:54,  2.49s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  48%|####7     | 1436/3000 [1:15:36<1:07:45,  2.60s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  48%|####7     | 1436/3000 [1:15:36<1:07:45,  2.60s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  48%|####7     | 1436/3000 [1:15:40<1:07:45,  2.60s/it, lr: 1.0e-04 loss: 8.063e-02]hash_cache_v1:  48%|####7     | 1436/3000 [1:15:40<1:07:45,  2.60s/it, lr: 1.0e-04 loss: 8.063e-02]hash_cache_v1:  48%|####7     | 1437/3000 [1:15:40<1:20:33,  3.09s/it, lr: 1.0e-04 loss: 8.063e-02]hash_cache_v1:  48%|####7     | 1437/3000 [1:15:40<1:20:33,  3.09s/it, lr: 1.0e-04 loss: 8.063e-02]hash_cache_v1:  48%|####7     | 1437/3000 [1:15:45<1:20:33,  3.09s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  48%|####7     | 1437/3000 [1:15:45<1:20:33,  3.09s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  48%|####7     | 1438/3000 [1:15:45<1:31:04,  3.50s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  48%|####7     | 1438/3000 [1:15:45<1:31:04,  3.50s/it, lr: 1.0e-04 loss: 1.022e-01]hash_cache_v1:  48%|####7     | 1438/3000 [1:15:49<1:31:04,  3.50s/it, lr: 1.0e-04 loss: 1.772e-01]hash_cache_v1:  48%|####7     | 1438/3000 [1:15:49<1:31:04,  3.50s/it, lr: 1.0e-04 loss: 1.772e-01]hash_cache_v1:  48%|####7     | 1439/3000 [1:15:49<1:37:15,  3.74s/it, lr: 1.0e-04 loss: 1.772e-01]hash_cache_v1:  48%|####7     | 1439/3000 [1:15:49<1:37:15,  3.74s/it, lr: 1.0e-04 loss: 1.772e-01]hash_cache_v1:  48%|####7     | 1439/3000 [1:15:52<1:37:15,  3.74s/it, lr: 1.0e-04 loss: 6.947e-03]hash_cache_v1:  48%|####7     | 1439/3000 [1:15:52<1:37:15,  3.74s/it, lr: 1.0e-04 loss: 6.947e-03]hash_cache_v1:  48%|####8     | 1440/3000 [1:15:54<1:37:11,  3.74s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  48%|####8     | 1440/3000 [1:15:54<1:37:11,  3.74s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  48%|####8     | 1441/3000 [1:15:54<1:05:18,  2.51s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  48%|####8     | 1441/3000 [1:15:54<1:05:18,  2.51s/it, lr: 1.0e-04 loss: 2.051e-01]hash_cache_v1:  48%|####8     | 1441/3000 [1:15:57<1:05:18,  2.51s/it, lr: 1.0e-04 loss: 1.252e-01]hash_cache_v1:  48%|####8     | 1441/3000 [1:15:57<1:05:18,  2.51s/it, lr: 1.0e-04 loss: 1.252e-01]hash_cache_v1:  48%|####8     | 1442/3000 [1:15:57<1:09:06,  2.66s/it, lr: 1.0e-04 loss: 1.252e-01]hash_cache_v1:  48%|####8     | 1442/3000 [1:15:57<1:09:06,  2.66s/it, lr: 1.0e-04 loss: 1.252e-01]hash_cache_v1:  48%|####8     | 1442/3000 [1:16:00<1:09:06,  2.66s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  48%|####8     | 1442/3000 [1:16:00<1:09:06,  2.66s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  48%|####8     | 1443/3000 [1:16:00<1:10:26,  2.71s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  48%|####8     | 1443/3000 [1:16:00<1:10:26,  2.71s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  48%|####8     | 1443/3000 [1:16:02<1:10:26,  2.71s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  48%|####8     | 1443/3000 [1:16:02<1:10:26,  2.71s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  48%|####8     | 1444/3000 [1:16:02<1:06:01,  2.55s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  48%|####8     | 1444/3000 [1:16:02<1:06:01,  2.55s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  48%|####8     | 1444/3000 [1:16:05<1:06:01,  2.55s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  48%|####8     | 1444/3000 [1:16:05<1:06:01,  2.55s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  48%|####8     | 1445/3000 [1:16:05<1:04:46,  2.50s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  48%|####8     | 1445/3000 [1:16:05<1:04:46,  2.50s/it, lr: 1.0e-04 loss: 2.011e-01]hash_cache_v1:  48%|####8     | 1445/3000 [1:16:09<1:04:46,  2.50s/it, lr: 1.0e-04 loss: 9.591e-02]hash_cache_v1:  48%|####8     | 1445/3000 [1:16:09<1:04:46,  2.50s/it, lr: 1.0e-04 loss: 9.591e-02]hash_cache_v1:  48%|####8     | 1446/3000 [1:16:09<1:18:01,  3.01s/it, lr: 1.0e-04 loss: 9.591e-02]hash_cache_v1:  48%|####8     | 1446/3000 [1:16:09<1:18:01,  3.01s/it, lr: 1.0e-04 loss: 9.591e-02]hash_cache_v1:  48%|####8     | 1446/3000 [1:16:13<1:18:01,  3.01s/it, lr: 1.0e-04 loss: 5.667e-02]hash_cache_v1:  48%|####8     | 1446/3000 [1:16:13<1:18:01,  3.01s/it, lr: 1.0e-04 loss: 5.667e-02]hash_cache_v1:  48%|####8     | 1447/3000 [1:16:13<1:27:35,  3.38s/it, lr: 1.0e-04 loss: 5.667e-02]hash_cache_v1:  48%|####8     | 1447/3000 [1:16:13<1:27:35,  3.38s/it, lr: 1.0e-04 loss: 5.667e-02]hash_cache_v1:  48%|####8     | 1447/3000 [1:16:18<1:27:35,  3.38s/it, lr: 1.0e-04 loss: 7.922e-02]hash_cache_v1:  48%|####8     | 1447/3000 [1:16:18<1:27:35,  3.38s/it, lr: 1.0e-04 loss: 7.922e-02]hash_cache_v1:  48%|####8     | 1448/3000 [1:16:18<1:34:41,  3.66s/it, lr: 1.0e-04 loss: 7.922e-02]hash_cache_v1:  48%|####8     | 1448/3000 [1:16:18<1:34:41,  3.66s/it, lr: 1.0e-04 loss: 7.922e-02]hash_cache_v1:  48%|####8     | 1448/3000 [1:16:21<1:34:41,  3.66s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  48%|####8     | 1448/3000 [1:16:21<1:34:41,  3.66s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  48%|####8     | 1449/3000 [1:16:21<1:30:01,  3.48s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  48%|####8     | 1449/3000 [1:16:21<1:30:01,  3.48s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  48%|####8     | 1449/3000 [1:16:25<1:30:01,  3.48s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  48%|####8     | 1449/3000 [1:16:25<1:30:01,  3.48s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  48%|####8     | 1450/3000 [1:16:29<1:29:58,  3.48s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  48%|####8     | 1450/3000 [1:16:29<1:29:58,  3.48s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  48%|####8     | 1451/3000 [1:16:29<1:14:09,  2.87s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  48%|####8     | 1451/3000 [1:16:29<1:14:09,  2.87s/it, lr: 1.0e-04 loss: 1.562e-01]hash_cache_v1:  48%|####8     | 1451/3000 [1:16:32<1:14:09,  2.87s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  48%|####8     | 1451/3000 [1:16:32<1:14:09,  2.87s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  48%|####8     | 1452/3000 [1:16:32<1:09:08,  2.68s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  48%|####8     | 1452/3000 [1:16:32<1:09:08,  2.68s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  48%|####8     | 1452/3000 [1:16:34<1:09:08,  2.68s/it, lr: 1.0e-04 loss: 1.887e-01]hash_cache_v1:  48%|####8     | 1452/3000 [1:16:34<1:09:08,  2.68s/it, lr: 1.0e-04 loss: 1.887e-01]hash_cache_v1:  48%|####8     | 1453/3000 [1:16:34<1:06:57,  2.60s/it, lr: 1.0e-04 loss: 1.887e-01]hash_cache_v1:  48%|####8     | 1453/3000 [1:16:34<1:06:57,  2.60s/it, lr: 1.0e-04 loss: 1.887e-01]hash_cache_v1:  48%|####8     | 1453/3000 [1:16:38<1:06:57,  2.60s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  48%|####8     | 1453/3000 [1:16:38<1:06:57,  2.60s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  48%|####8     | 1454/3000 [1:16:38<1:19:04,  3.07s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  48%|####8     | 1454/3000 [1:16:38<1:19:04,  3.07s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  48%|####8     | 1454/3000 [1:16:41<1:19:04,  3.07s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  48%|####8     | 1454/3000 [1:16:41<1:19:04,  3.07s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  48%|####8     | 1455/3000 [1:16:41<1:17:43,  3.02s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  48%|####8     | 1455/3000 [1:16:41<1:17:43,  3.02s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  48%|####8     | 1455/3000 [1:16:44<1:17:43,  3.02s/it, lr: 1.0e-04 loss: 8.901e-03]hash_cache_v1:  48%|####8     | 1455/3000 [1:16:44<1:17:43,  3.02s/it, lr: 1.0e-04 loss: 8.901e-03]hash_cache_v1:  49%|####8     | 1456/3000 [1:16:44<1:17:56,  3.03s/it, lr: 1.0e-04 loss: 8.901e-03]hash_cache_v1:  49%|####8     | 1456/3000 [1:16:44<1:17:56,  3.03s/it, lr: 1.0e-04 loss: 8.901e-03]hash_cache_v1:  49%|####8     | 1456/3000 [1:16:49<1:17:56,  3.03s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  49%|####8     | 1456/3000 [1:16:49<1:17:56,  3.03s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  49%|####8     | 1457/3000 [1:16:49<1:27:37,  3.41s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  49%|####8     | 1457/3000 [1:16:49<1:27:37,  3.41s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  49%|####8     | 1457/3000 [1:16:51<1:27:37,  3.41s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  49%|####8     | 1457/3000 [1:16:51<1:27:37,  3.41s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  49%|####8     | 1458/3000 [1:16:51<1:23:40,  3.26s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  49%|####8     | 1458/3000 [1:16:51<1:23:40,  3.26s/it, lr: 1.0e-04 loss: 1.707e-01]hash_cache_v1:  49%|####8     | 1458/3000 [1:16:53<1:23:40,  3.26s/it, lr: 1.0e-04 loss: 4.750e-02]hash_cache_v1:  49%|####8     | 1458/3000 [1:16:53<1:23:40,  3.26s/it, lr: 1.0e-04 loss: 4.750e-02]hash_cache_v1:  49%|####8     | 1459/3000 [1:16:53<1:14:51,  2.91s/it, lr: 1.0e-04 loss: 4.750e-02]hash_cache_v1:  49%|####8     | 1459/3000 [1:16:53<1:14:51,  2.91s/it, lr: 1.0e-04 loss: 4.750e-02]hash_cache_v1:  49%|####8     | 1459/3000 [1:16:56<1:14:51,  2.91s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  49%|####8     | 1459/3000 [1:16:56<1:14:51,  2.91s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  49%|####8     | 1460/3000 [1:17:00<1:14:48,  2.91s/it, lr: 1.0e-04 loss: 8.979e-02]hash_cache_v1:  49%|####8     | 1460/3000 [1:17:00<1:14:48,  2.91s/it, lr: 1.0e-04 loss: 8.979e-02]hash_cache_v1:  49%|####8     | 1461/3000 [1:17:00<1:05:40,  2.56s/it, lr: 1.0e-04 loss: 8.979e-02]hash_cache_v1:  49%|####8     | 1461/3000 [1:17:00<1:05:40,  2.56s/it, lr: 1.0e-04 loss: 8.979e-02]hash_cache_v1:  49%|####8     | 1461/3000 [1:17:02<1:05:40,  2.56s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  49%|####8     | 1461/3000 [1:17:02<1:05:40,  2.56s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  49%|####8     | 1462/3000 [1:17:02<1:02:46,  2.45s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  49%|####8     | 1462/3000 [1:17:02<1:02:46,  2.45s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  49%|####8     | 1462/3000 [1:17:07<1:02:46,  2.45s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  49%|####8     | 1462/3000 [1:17:07<1:02:46,  2.45s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  49%|####8     | 1463/3000 [1:17:07<1:16:18,  2.98s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  49%|####8     | 1463/3000 [1:17:07<1:16:18,  2.98s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  49%|####8     | 1463/3000 [1:17:10<1:16:18,  2.98s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  49%|####8     | 1463/3000 [1:17:10<1:16:18,  2.98s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  49%|####8     | 1464/3000 [1:17:10<1:15:46,  2.96s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  49%|####8     | 1464/3000 [1:17:10<1:15:46,  2.96s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  49%|####8     | 1464/3000 [1:17:13<1:15:46,  2.96s/it, lr: 1.0e-04 loss: 1.074e-01]hash_cache_v1:  49%|####8     | 1464/3000 [1:17:13<1:15:46,  2.96s/it, lr: 1.0e-04 loss: 1.074e-01]hash_cache_v1:  49%|####8     | 1465/3000 [1:17:13<1:15:02,  2.93s/it, lr: 1.0e-04 loss: 1.074e-01]hash_cache_v1:  49%|####8     | 1465/3000 [1:17:13<1:15:02,  2.93s/it, lr: 1.0e-04 loss: 1.074e-01]hash_cache_v1:  49%|####8     | 1465/3000 [1:17:15<1:15:02,  2.93s/it, lr: 1.0e-04 loss: 6.365e-02]hash_cache_v1:  49%|####8     | 1465/3000 [1:17:15<1:15:02,  2.93s/it, lr: 1.0e-04 loss: 6.365e-02]hash_cache_v1:  49%|####8     | 1466/3000 [1:17:15<1:14:41,  2.92s/it, lr: 1.0e-04 loss: 6.365e-02]hash_cache_v1:  49%|####8     | 1466/3000 [1:17:15<1:14:41,  2.92s/it, lr: 1.0e-04 loss: 6.365e-02]hash_cache_v1:  49%|####8     | 1466/3000 [1:17:18<1:14:41,  2.92s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  49%|####8     | 1466/3000 [1:17:18<1:14:41,  2.92s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  49%|####8     | 1467/3000 [1:17:18<1:10:40,  2.77s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  49%|####8     | 1467/3000 [1:17:18<1:10:40,  2.77s/it, lr: 1.0e-04 loss: 1.888e-01]hash_cache_v1:  49%|####8     | 1467/3000 [1:17:20<1:10:40,  2.77s/it, lr: 1.0e-04 loss: 1.725e-02]hash_cache_v1:  49%|####8     | 1467/3000 [1:17:20<1:10:40,  2.77s/it, lr: 1.0e-04 loss: 1.725e-02]hash_cache_v1:  49%|####8     | 1468/3000 [1:17:20<1:05:38,  2.57s/it, lr: 1.0e-04 loss: 1.725e-02]hash_cache_v1:  49%|####8     | 1468/3000 [1:17:20<1:05:38,  2.57s/it, lr: 1.0e-04 loss: 1.725e-02]hash_cache_v1:  49%|####8     | 1468/3000 [1:17:23<1:05:38,  2.57s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  49%|####8     | 1468/3000 [1:17:23<1:05:38,  2.57s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  49%|####8     | 1469/3000 [1:17:23<1:07:56,  2.66s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  49%|####8     | 1469/3000 [1:17:23<1:07:56,  2.66s/it, lr: 1.0e-04 loss: 1.604e-02]hash_cache_v1:  49%|####8     | 1469/3000 [1:17:26<1:07:56,  2.66s/it, lr: 1.0e-04 loss: 1.915e-01]hash_cache_v1:  49%|####8     | 1469/3000 [1:17:26<1:07:56,  2.66s/it, lr: 1.0e-04 loss: 1.915e-01]hash_cache_v1:  49%|####9     | 1470/3000 [1:17:30<1:07:54,  2.66s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  49%|####9     | 1470/3000 [1:17:30<1:07:54,  2.66s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  49%|####9     | 1471/3000 [1:17:30<1:02:47,  2.46s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  49%|####9     | 1471/3000 [1:17:30<1:02:47,  2.46s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  49%|####9     | 1471/3000 [1:17:32<1:02:47,  2.46s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  49%|####9     | 1471/3000 [1:17:32<1:02:47,  2.46s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  49%|####9     | 1472/3000 [1:17:32<1:00:32,  2.38s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  49%|####9     | 1472/3000 [1:17:32<1:00:32,  2.38s/it, lr: 1.0e-04 loss: 1.439e-01]hash_cache_v1:  49%|####9     | 1472/3000 [1:17:36<1:00:32,  2.38s/it, lr: 1.0e-04 loss: 2.502e-02]hash_cache_v1:  49%|####9     | 1472/3000 [1:17:36<1:00:32,  2.38s/it, lr: 1.0e-04 loss: 2.502e-02]hash_cache_v1:  49%|####9     | 1473/3000 [1:17:37<1:13:06,  2.87s/it, lr: 1.0e-04 loss: 2.502e-02]hash_cache_v1:  49%|####9     | 1473/3000 [1:17:37<1:13:06,  2.87s/it, lr: 1.0e-04 loss: 2.502e-02]hash_cache_v1:  49%|####9     | 1473/3000 [1:17:41<1:13:06,  2.87s/it, lr: 1.0e-04 loss: 5.046e-02]hash_cache_v1:  49%|####9     | 1473/3000 [1:17:41<1:13:06,  2.87s/it, lr: 1.0e-04 loss: 5.046e-02]hash_cache_v1:  49%|####9     | 1474/3000 [1:17:41<1:24:20,  3.32s/it, lr: 1.0e-04 loss: 5.046e-02]hash_cache_v1:  49%|####9     | 1474/3000 [1:17:41<1:24:20,  3.32s/it, lr: 1.0e-04 loss: 5.046e-02]hash_cache_v1:  49%|####9     | 1474/3000 [1:17:43<1:24:20,  3.32s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  49%|####9     | 1474/3000 [1:17:43<1:24:20,  3.32s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  49%|####9     | 1475/3000 [1:17:43<1:15:43,  2.98s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  49%|####9     | 1475/3000 [1:17:43<1:15:43,  2.98s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  49%|####9     | 1475/3000 [1:17:45<1:15:43,  2.98s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  49%|####9     | 1475/3000 [1:17:45<1:15:43,  2.98s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  49%|####9     | 1476/3000 [1:17:45<1:09:20,  2.73s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  49%|####9     | 1476/3000 [1:17:45<1:09:20,  2.73s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  49%|####9     | 1476/3000 [1:17:47<1:09:20,  2.73s/it, lr: 1.0e-04 loss: 1.959e-01]hash_cache_v1:  49%|####9     | 1476/3000 [1:17:47<1:09:20,  2.73s/it, lr: 1.0e-04 loss: 1.959e-01]hash_cache_v1:  49%|####9     | 1477/3000 [1:17:47<1:04:45,  2.55s/it, lr: 1.0e-04 loss: 1.959e-01]hash_cache_v1:  49%|####9     | 1477/3000 [1:17:47<1:04:45,  2.55s/it, lr: 1.0e-04 loss: 1.959e-01]hash_cache_v1:  49%|####9     | 1477/3000 [1:17:50<1:04:45,  2.55s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:  49%|####9     | 1477/3000 [1:17:50<1:04:45,  2.55s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:  49%|####9     | 1478/3000 [1:17:50<1:08:44,  2.71s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:  49%|####9     | 1478/3000 [1:17:50<1:08:44,  2.71s/it, lr: 1.0e-04 loss: 1.947e-01]hash_cache_v1:  49%|####9     | 1478/3000 [1:17:53<1:08:44,  2.71s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  49%|####9     | 1478/3000 [1:17:53<1:08:44,  2.71s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  49%|####9     | 1479/3000 [1:17:53<1:09:43,  2.75s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  49%|####9     | 1479/3000 [1:17:53<1:09:43,  2.75s/it, lr: 1.0e-04 loss: 1.546e-01]hash_cache_v1:  49%|####9     | 1479/3000 [1:17:55<1:09:43,  2.75s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  49%|####9     | 1479/3000 [1:17:55<1:09:43,  2.75s/it, lr: 1.0e-04 loss: 1.621e-01]hash_cache_v1:  49%|####9     | 1480/3000 [1:17:58<1:09:40,  2.75s/it, lr: 1.0e-04 loss: 1.696e-01]hash_cache_v1:  49%|####9     | 1480/3000 [1:17:58<1:09:40,  2.75s/it, lr: 1.0e-04 loss: 1.696e-01]hash_cache_v1:  49%|####9     | 1481/3000 [1:17:58<55:27,  2.19s/it, lr: 1.0e-04 loss: 1.696e-01]  hash_cache_v1:  49%|####9     | 1481/3000 [1:17:58<55:27,  2.19s/it, lr: 1.0e-04 loss: 1.696e-01]  hash_cache_v1:  49%|####9     | 1481/3000 [1:18:01<55:27,  2.19s/it, lr: 1.0e-04 loss: 2.690e-02]hash_cache_v1:  49%|####9     | 1481/3000 [1:18:01<55:27,  2.19s/it, lr: 1.0e-04 loss: 2.690e-02]hash_cache_v1:  49%|####9     | 1482/3000 [1:18:01<59:42,  2.36s/it, lr: 1.0e-04 loss: 2.690e-02]hash_cache_v1:  49%|####9     | 1482/3000 [1:18:01<59:42,  2.36s/it, lr: 1.0e-04 loss: 2.690e-02]hash_cache_v1:  49%|####9     | 1482/3000 [1:18:03<59:42,  2.36s/it, lr: 1.0e-04 loss: 4.673e-02]hash_cache_v1:  49%|####9     | 1482/3000 [1:18:03<59:42,  2.36s/it, lr: 1.0e-04 loss: 4.673e-02]hash_cache_v1:  49%|####9     | 1483/3000 [1:18:03<58:00,  2.29s/it, lr: 1.0e-04 loss: 4.673e-02]hash_cache_v1:  49%|####9     | 1483/3000 [1:18:03<58:00,  2.29s/it, lr: 1.0e-04 loss: 4.673e-02]hash_cache_v1:  49%|####9     | 1483/3000 [1:18:06<58:00,  2.29s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  49%|####9     | 1483/3000 [1:18:06<58:00,  2.29s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  49%|####9     | 1484/3000 [1:18:06<56:39,  2.24s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  49%|####9     | 1484/3000 [1:18:06<56:39,  2.24s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  49%|####9     | 1484/3000 [1:18:10<56:39,  2.24s/it, lr: 1.0e-04 loss: 2.058e-02]hash_cache_v1:  49%|####9     | 1484/3000 [1:18:10<56:39,  2.24s/it, lr: 1.0e-04 loss: 2.058e-02]hash_cache_v1:  50%|####9     | 1485/3000 [1:18:10<1:12:35,  2.87s/it, lr: 1.0e-04 loss: 2.058e-02]hash_cache_v1:  50%|####9     | 1485/3000 [1:18:10<1:12:35,  2.87s/it, lr: 1.0e-04 loss: 2.058e-02]hash_cache_v1:  50%|####9     | 1485/3000 [1:18:13<1:12:35,  2.87s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  50%|####9     | 1485/3000 [1:18:13<1:12:35,  2.87s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  50%|####9     | 1486/3000 [1:18:13<1:12:28,  2.87s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  50%|####9     | 1486/3000 [1:18:13<1:12:28,  2.87s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  50%|####9     | 1486/3000 [1:18:15<1:12:28,  2.87s/it, lr: 1.0e-04 loss: 9.584e-02]hash_cache_v1:  50%|####9     | 1486/3000 [1:18:15<1:12:28,  2.87s/it, lr: 1.0e-04 loss: 9.584e-02]hash_cache_v1:  50%|####9     | 1487/3000 [1:18:15<1:06:56,  2.65s/it, lr: 1.0e-04 loss: 9.584e-02]hash_cache_v1:  50%|####9     | 1487/3000 [1:18:15<1:06:56,  2.65s/it, lr: 1.0e-04 loss: 9.584e-02]hash_cache_v1:  50%|####9     | 1487/3000 [1:18:18<1:06:56,  2.65s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:  50%|####9     | 1487/3000 [1:18:18<1:06:56,  2.65s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:  50%|####9     | 1488/3000 [1:18:18<1:10:20,  2.79s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:  50%|####9     | 1488/3000 [1:18:18<1:10:20,  2.79s/it, lr: 1.0e-04 loss: 1.764e-01]hash_cache_v1:  50%|####9     | 1488/3000 [1:18:21<1:10:20,  2.79s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  50%|####9     | 1488/3000 [1:18:21<1:10:20,  2.79s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  50%|####9     | 1489/3000 [1:18:21<1:10:53,  2.82s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  50%|####9     | 1489/3000 [1:18:21<1:10:53,  2.82s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  50%|####9     | 1489/3000 [1:18:25<1:10:53,  2.82s/it, lr: 1.0e-04 loss: 5.726e-02]hash_cache_v1:  50%|####9     | 1489/3000 [1:18:25<1:10:53,  2.82s/it, lr: 1.0e-04 loss: 5.726e-02]hash_cache_v1:  50%|####9     | 1490/3000 [1:18:30<1:10:50,  2.82s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  50%|####9     | 1490/3000 [1:18:30<1:10:50,  2.82s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  50%|####9     | 1491/3000 [1:18:30<1:03:10,  2.51s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  50%|####9     | 1491/3000 [1:18:30<1:03:10,  2.51s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  50%|####9     | 1491/3000 [1:18:32<1:03:10,  2.51s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  50%|####9     | 1491/3000 [1:18:32<1:03:10,  2.51s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  50%|####9     | 1492/3000 [1:18:32<1:02:24,  2.48s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  50%|####9     | 1492/3000 [1:18:32<1:02:24,  2.48s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  50%|####9     | 1492/3000 [1:18:35<1:02:24,  2.48s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  50%|####9     | 1492/3000 [1:18:35<1:02:24,  2.48s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  50%|####9     | 1493/3000 [1:18:35<1:04:49,  2.58s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  50%|####9     | 1493/3000 [1:18:35<1:04:49,  2.58s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  50%|####9     | 1493/3000 [1:18:39<1:04:49,  2.58s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  50%|####9     | 1493/3000 [1:18:39<1:04:49,  2.58s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  50%|####9     | 1494/3000 [1:18:39<1:16:24,  3.04s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  50%|####9     | 1494/3000 [1:18:39<1:16:24,  3.04s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  50%|####9     | 1494/3000 [1:18:42<1:16:24,  3.04s/it, lr: 1.0e-04 loss: 2.302e-01]hash_cache_v1:  50%|####9     | 1494/3000 [1:18:42<1:16:24,  3.04s/it, lr: 1.0e-04 loss: 2.302e-01]hash_cache_v1:  50%|####9     | 1495/3000 [1:18:42<1:11:52,  2.87s/it, lr: 1.0e-04 loss: 2.302e-01]hash_cache_v1:  50%|####9     | 1495/3000 [1:18:42<1:11:52,  2.87s/it, lr: 1.0e-04 loss: 2.302e-01]hash_cache_v1:  50%|####9     | 1495/3000 [1:18:44<1:11:52,  2.87s/it, lr: 1.0e-04 loss: 2.320e-01]hash_cache_v1:  50%|####9     | 1495/3000 [1:18:44<1:11:52,  2.87s/it, lr: 1.0e-04 loss: 2.320e-01]hash_cache_v1:  50%|####9     | 1496/3000 [1:18:44<1:06:22,  2.65s/it, lr: 1.0e-04 loss: 2.320e-01]hash_cache_v1:  50%|####9     | 1496/3000 [1:18:44<1:06:22,  2.65s/it, lr: 1.0e-04 loss: 2.320e-01]hash_cache_v1:  50%|####9     | 1496/3000 [1:18:47<1:06:22,  2.65s/it, lr: 1.0e-04 loss: 1.597e-01]hash_cache_v1:  50%|####9     | 1496/3000 [1:18:47<1:06:22,  2.65s/it, lr: 1.0e-04 loss: 1.597e-01]hash_cache_v1:  50%|####9     | 1497/3000 [1:18:47<1:08:04,  2.72s/it, lr: 1.0e-04 loss: 1.597e-01]hash_cache_v1:  50%|####9     | 1497/3000 [1:18:47<1:08:04,  2.72s/it, lr: 1.0e-04 loss: 1.597e-01]hash_cache_v1:  50%|####9     | 1497/3000 [1:18:49<1:08:04,  2.72s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  50%|####9     | 1497/3000 [1:18:49<1:08:04,  2.72s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  50%|####9     | 1498/3000 [1:18:49<1:09:17,  2.77s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  50%|####9     | 1498/3000 [1:18:49<1:09:17,  2.77s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  50%|####9     | 1498/3000 [1:18:54<1:09:17,  2.77s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  50%|####9     | 1498/3000 [1:18:54<1:09:17,  2.77s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  50%|####9     | 1499/3000 [1:18:54<1:21:43,  3.27s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  50%|####9     | 1499/3000 [1:18:54<1:21:43,  3.27s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  50%|####9     | 1499/3000 [1:18:56<1:21:43,  3.27s/it, lr: 1.0e-04 loss: 1.896e-01]hash_cache_v1:  50%|####9     | 1499/3000 [1:18:56<1:21:43,  3.27s/it, lr: 1.0e-04 loss: 1.896e-01]
+Saving at step 1500
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001500.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000000500.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.11s/it]Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.11s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.25s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.25s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.33s/it]Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.33s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.36s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.36s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  50%|#####     | 1500/3000 [1:18:58<1:21:40,  3.27s/it, lr: 1.0e-04 loss: 1.010e-01]hash_cache_v1:  50%|#####     | 1500/3000 [1:18:58<1:21:40,  3.27s/it, lr: 1.0e-04 loss: 1.010e-01]hash_cache_v1:  50%|#####     | 1501/3000 [1:18:58<57:54,  2.32s/it, lr: 1.0e-04 loss: 1.010e-01]  hash_cache_v1:  50%|#####     | 1501/3000 [1:18:58<57:54,  2.32s/it, lr: 1.0e-04 loss: 1.010e-01]  hash_cache_v1:  50%|#####     | 1501/3000 [1:19:01<57:54,  2.32s/it, lr: 1.0e-04 loss: 1.249e-01]hash_cache_v1:  50%|#####     | 1501/3000 [1:19:01<57:54,  2.32s/it, lr: 1.0e-04 loss: 1.249e-01]hash_cache_v1:  50%|#####     | 1502/3000 [1:19:01<1:01:13,  2.45s/it, lr: 1.0e-04 loss: 1.249e-01]hash_cache_v1:  50%|#####     | 1502/3000 [1:19:01<1:01:13,  2.45s/it, lr: 1.0e-04 loss: 1.249e-01]hash_cache_v1:  50%|#####     | 1502/3000 [1:19:05<1:01:13,  2.45s/it, lr: 1.0e-04 loss: 2.572e-02]hash_cache_v1:  50%|#####     | 1502/3000 [1:19:05<1:01:13,  2.45s/it, lr: 1.0e-04 loss: 2.572e-02]hash_cache_v1:  50%|#####     | 1503/3000 [1:19:05<1:12:58,  2.92s/it, lr: 1.0e-04 loss: 2.572e-02]hash_cache_v1:  50%|#####     | 1503/3000 [1:19:05<1:12:58,  2.92s/it, lr: 1.0e-04 loss: 2.572e-02]hash_cache_v1:  50%|#####     | 1503/3000 [1:19:09<1:12:58,  2.92s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  50%|#####     | 1503/3000 [1:19:09<1:12:58,  2.92s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  50%|#####     | 1504/3000 [1:19:09<1:14:02,  2.97s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  50%|#####     | 1504/3000 [1:19:09<1:14:02,  2.97s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  50%|#####     | 1504/3000 [1:19:11<1:14:02,  2.97s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  50%|#####     | 1504/3000 [1:19:11<1:14:02,  2.97s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  50%|#####     | 1505/3000 [1:19:11<1:13:05,  2.93s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  50%|#####     | 1505/3000 [1:19:11<1:13:05,  2.93s/it, lr: 1.0e-04 loss: 1.691e-01]hash_cache_v1:  50%|#####     | 1505/3000 [1:19:14<1:13:05,  2.93s/it, lr: 1.0e-04 loss: 5.781e-02]hash_cache_v1:  50%|#####     | 1505/3000 [1:19:14<1:13:05,  2.93s/it, lr: 1.0e-04 loss: 5.781e-02]hash_cache_v1:  50%|#####     | 1506/3000 [1:19:14<1:07:08,  2.70s/it, lr: 1.0e-04 loss: 5.781e-02]hash_cache_v1:  50%|#####     | 1506/3000 [1:19:14<1:07:08,  2.70s/it, lr: 1.0e-04 loss: 5.781e-02]hash_cache_v1:  50%|#####     | 1506/3000 [1:19:18<1:07:08,  2.70s/it, lr: 1.0e-04 loss: 1.090e-01]hash_cache_v1:  50%|#####     | 1506/3000 [1:19:18<1:07:08,  2.70s/it, lr: 1.0e-04 loss: 1.090e-01]hash_cache_v1:  50%|#####     | 1507/3000 [1:19:18<1:20:26,  3.23s/it, lr: 1.0e-04 loss: 1.090e-01]hash_cache_v1:  50%|#####     | 1507/3000 [1:19:18<1:20:26,  3.23s/it, lr: 1.0e-04 loss: 1.090e-01]hash_cache_v1:  50%|#####     | 1507/3000 [1:19:22<1:20:26,  3.23s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  50%|#####     | 1507/3000 [1:19:22<1:20:26,  3.23s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  50%|#####     | 1508/3000 [1:19:22<1:28:14,  3.55s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  50%|#####     | 1508/3000 [1:19:22<1:28:14,  3.55s/it, lr: 1.0e-04 loss: 1.152e-01]hash_cache_v1:  50%|#####     | 1508/3000 [1:19:27<1:28:14,  3.55s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  50%|#####     | 1508/3000 [1:19:27<1:28:14,  3.55s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  50%|#####     | 1509/3000 [1:19:27<1:33:50,  3.78s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  50%|#####     | 1509/3000 [1:19:27<1:33:50,  3.78s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  50%|#####     | 1509/3000 [1:19:29<1:33:50,  3.78s/it, lr: 1.0e-04 loss: 2.628e-02]hash_cache_v1:  50%|#####     | 1509/3000 [1:19:29<1:33:50,  3.78s/it, lr: 1.0e-04 loss: 2.628e-02]hash_cache_v1:  50%|#####     | 1510/3000 [1:19:33<1:33:46,  3.78s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  50%|#####     | 1510/3000 [1:19:33<1:33:46,  3.78s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  50%|#####     | 1511/3000 [1:19:33<1:16:29,  3.08s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  50%|#####     | 1511/3000 [1:19:33<1:16:29,  3.08s/it, lr: 1.0e-04 loss: 1.516e-01]hash_cache_v1:  50%|#####     | 1511/3000 [1:19:38<1:16:29,  3.08s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  50%|#####     | 1511/3000 [1:19:38<1:16:29,  3.08s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  50%|#####     | 1512/3000 [1:19:38<1:24:01,  3.39s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  50%|#####     | 1512/3000 [1:19:38<1:24:01,  3.39s/it, lr: 1.0e-04 loss: 2.705e-02]hash_cache_v1:  50%|#####     | 1512/3000 [1:19:42<1:24:01,  3.39s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  50%|#####     | 1512/3000 [1:19:42<1:24:01,  3.39s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  50%|#####     | 1513/3000 [1:19:42<1:29:50,  3.63s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  50%|#####     | 1513/3000 [1:19:42<1:29:50,  3.63s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  50%|#####     | 1513/3000 [1:19:44<1:29:50,  3.63s/it, lr: 1.0e-04 loss: 1.181e-01]hash_cache_v1:  50%|#####     | 1513/3000 [1:19:44<1:29:50,  3.63s/it, lr: 1.0e-04 loss: 1.181e-01]hash_cache_v1:  50%|#####     | 1514/3000 [1:19:44<1:19:34,  3.21s/it, lr: 1.0e-04 loss: 1.181e-01]hash_cache_v1:  50%|#####     | 1514/3000 [1:19:44<1:19:34,  3.21s/it, lr: 1.0e-04 loss: 1.181e-01]hash_cache_v1:  50%|#####     | 1514/3000 [1:19:47<1:19:34,  3.21s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  50%|#####     | 1514/3000 [1:19:47<1:19:34,  3.21s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  50%|#####     | 1515/3000 [1:19:47<1:18:44,  3.18s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  50%|#####     | 1515/3000 [1:19:47<1:18:44,  3.18s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  50%|#####     | 1515/3000 [1:19:51<1:18:44,  3.18s/it, lr: 1.0e-04 loss: 9.606e-02]hash_cache_v1:  50%|#####     | 1515/3000 [1:19:51<1:18:44,  3.18s/it, lr: 1.0e-04 loss: 9.606e-02]hash_cache_v1:  51%|#####     | 1516/3000 [1:19:51<1:26:37,  3.50s/it, lr: 1.0e-04 loss: 9.606e-02]hash_cache_v1:  51%|#####     | 1516/3000 [1:19:51<1:26:37,  3.50s/it, lr: 1.0e-04 loss: 9.606e-02]hash_cache_v1:  51%|#####     | 1516/3000 [1:19:54<1:26:37,  3.50s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  51%|#####     | 1516/3000 [1:19:54<1:26:37,  3.50s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  51%|#####     | 1517/3000 [1:19:54<1:22:03,  3.32s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  51%|#####     | 1517/3000 [1:19:54<1:22:03,  3.32s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  51%|#####     | 1517/3000 [1:19:59<1:22:03,  3.32s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  51%|#####     | 1517/3000 [1:19:59<1:22:03,  3.32s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  51%|#####     | 1518/3000 [1:19:59<1:30:37,  3.67s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  51%|#####     | 1518/3000 [1:19:59<1:30:37,  3.67s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  51%|#####     | 1518/3000 [1:20:03<1:30:37,  3.67s/it, lr: 1.0e-04 loss: 3.774e-02]hash_cache_v1:  51%|#####     | 1518/3000 [1:20:03<1:30:37,  3.67s/it, lr: 1.0e-04 loss: 3.774e-02]hash_cache_v1:  51%|#####     | 1519/3000 [1:20:03<1:35:14,  3.86s/it, lr: 1.0e-04 loss: 3.774e-02]hash_cache_v1:  51%|#####     | 1519/3000 [1:20:03<1:35:14,  3.86s/it, lr: 1.0e-04 loss: 3.774e-02]hash_cache_v1:  51%|#####     | 1519/3000 [1:20:07<1:35:14,  3.86s/it, lr: 1.0e-04 loss: 4.544e-02]hash_cache_v1:  51%|#####     | 1519/3000 [1:20:07<1:35:14,  3.86s/it, lr: 1.0e-04 loss: 4.544e-02]hash_cache_v1:  51%|#####     | 1520/3000 [1:20:10<1:35:10,  3.86s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  51%|#####     | 1520/3000 [1:20:10<1:35:10,  3.86s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  51%|#####     | 1521/3000 [1:20:10<1:03:29,  2.58s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  51%|#####     | 1521/3000 [1:20:10<1:03:29,  2.58s/it, lr: 1.0e-04 loss: 1.803e-01]hash_cache_v1:  51%|#####     | 1521/3000 [1:20:12<1:03:29,  2.58s/it, lr: 1.0e-04 loss: 3.573e-02]hash_cache_v1:  51%|#####     | 1521/3000 [1:20:12<1:03:29,  2.58s/it, lr: 1.0e-04 loss: 3.573e-02]hash_cache_v1:  51%|#####     | 1522/3000 [1:20:12<1:02:13,  2.53s/it, lr: 1.0e-04 loss: 3.573e-02]hash_cache_v1:  51%|#####     | 1522/3000 [1:20:12<1:02:13,  2.53s/it, lr: 1.0e-04 loss: 3.573e-02]hash_cache_v1:  51%|#####     | 1522/3000 [1:20:15<1:02:13,  2.53s/it, lr: 1.0e-04 loss: 1.295e-01]hash_cache_v1:  51%|#####     | 1522/3000 [1:20:15<1:02:13,  2.53s/it, lr: 1.0e-04 loss: 1.295e-01]hash_cache_v1:  51%|#####     | 1523/3000 [1:20:15<1:04:19,  2.61s/it, lr: 1.0e-04 loss: 1.295e-01]hash_cache_v1:  51%|#####     | 1523/3000 [1:20:15<1:04:19,  2.61s/it, lr: 1.0e-04 loss: 1.295e-01]hash_cache_v1:  51%|#####     | 1523/3000 [1:20:18<1:04:19,  2.61s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  51%|#####     | 1523/3000 [1:20:18<1:04:19,  2.61s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  51%|#####     | 1524/3000 [1:20:18<1:05:59,  2.68s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  51%|#####     | 1524/3000 [1:20:18<1:05:59,  2.68s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  51%|#####     | 1524/3000 [1:20:21<1:05:59,  2.68s/it, lr: 1.0e-04 loss: 6.573e-02]hash_cache_v1:  51%|#####     | 1524/3000 [1:20:21<1:05:59,  2.68s/it, lr: 1.0e-04 loss: 6.573e-02]hash_cache_v1:  51%|#####     | 1525/3000 [1:20:21<1:07:12,  2.73s/it, lr: 1.0e-04 loss: 6.573e-02]hash_cache_v1:  51%|#####     | 1525/3000 [1:20:21<1:07:12,  2.73s/it, lr: 1.0e-04 loss: 6.573e-02]hash_cache_v1:  51%|#####     | 1525/3000 [1:20:25<1:07:12,  2.73s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  51%|#####     | 1525/3000 [1:20:25<1:07:12,  2.73s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  51%|#####     | 1526/3000 [1:20:25<1:19:43,  3.25s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  51%|#####     | 1526/3000 [1:20:25<1:19:43,  3.25s/it, lr: 1.0e-04 loss: 5.972e-02]hash_cache_v1:  51%|#####     | 1526/3000 [1:20:27<1:19:43,  3.25s/it, lr: 1.0e-04 loss: 1.920e-01]hash_cache_v1:  51%|#####     | 1526/3000 [1:20:27<1:19:43,  3.25s/it, lr: 1.0e-04 loss: 1.920e-01]hash_cache_v1:  51%|#####     | 1527/3000 [1:20:27<1:11:41,  2.92s/it, lr: 1.0e-04 loss: 1.920e-01]hash_cache_v1:  51%|#####     | 1527/3000 [1:20:27<1:11:41,  2.92s/it, lr: 1.0e-04 loss: 1.920e-01]hash_cache_v1:  51%|#####     | 1527/3000 [1:20:31<1:11:41,  2.92s/it, lr: 1.0e-04 loss: 8.793e-02]hash_cache_v1:  51%|#####     | 1527/3000 [1:20:31<1:11:41,  2.92s/it, lr: 1.0e-04 loss: 8.793e-02]hash_cache_v1:  51%|#####     | 1528/3000 [1:20:31<1:21:26,  3.32s/it, lr: 1.0e-04 loss: 8.793e-02]hash_cache_v1:  51%|#####     | 1528/3000 [1:20:31<1:21:26,  3.32s/it, lr: 1.0e-04 loss: 8.793e-02]hash_cache_v1:  51%|#####     | 1528/3000 [1:20:34<1:21:26,  3.32s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  51%|#####     | 1528/3000 [1:20:34<1:21:26,  3.32s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  51%|#####     | 1529/3000 [1:20:34<1:14:43,  3.05s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  51%|#####     | 1529/3000 [1:20:34<1:14:43,  3.05s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  51%|#####     | 1529/3000 [1:20:36<1:14:43,  3.05s/it, lr: 1.0e-04 loss: 1.151e-01]hash_cache_v1:  51%|#####     | 1529/3000 [1:20:36<1:14:43,  3.05s/it, lr: 1.0e-04 loss: 1.151e-01]hash_cache_v1:  51%|#####1    | 1530/3000 [1:20:39<1:14:39,  3.05s/it, lr: 1.0e-04 loss: 1.208e-01]hash_cache_v1:  51%|#####1    | 1530/3000 [1:20:39<1:14:39,  3.05s/it, lr: 1.0e-04 loss: 1.208e-01]hash_cache_v1:  51%|#####1    | 1531/3000 [1:20:39<56:36,  2.31s/it, lr: 1.0e-04 loss: 1.208e-01]  hash_cache_v1:  51%|#####1    | 1531/3000 [1:20:39<56:36,  2.31s/it, lr: 1.0e-04 loss: 1.208e-01]  hash_cache_v1:  51%|#####1    | 1531/3000 [1:20:41<56:36,  2.31s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  51%|#####1    | 1531/3000 [1:20:41<56:36,  2.31s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  51%|#####1    | 1532/3000 [1:20:41<55:18,  2.26s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  51%|#####1    | 1532/3000 [1:20:41<55:18,  2.26s/it, lr: 1.0e-04 loss: 1.438e-01]hash_cache_v1:  51%|#####1    | 1532/3000 [1:20:46<55:18,  2.26s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  51%|#####1    | 1532/3000 [1:20:46<55:18,  2.26s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  51%|#####1    | 1533/3000 [1:20:46<1:09:41,  2.85s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  51%|#####1    | 1533/3000 [1:20:46<1:09:41,  2.85s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  51%|#####1    | 1533/3000 [1:20:50<1:09:41,  2.85s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  51%|#####1    | 1533/3000 [1:20:50<1:09:41,  2.85s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  51%|#####1    | 1534/3000 [1:20:50<1:19:18,  3.25s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  51%|#####1    | 1534/3000 [1:20:50<1:19:18,  3.25s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  51%|#####1    | 1534/3000 [1:20:52<1:19:18,  3.25s/it, lr: 1.0e-04 loss: 8.653e-02]hash_cache_v1:  51%|#####1    | 1534/3000 [1:20:52<1:19:18,  3.25s/it, lr: 1.0e-04 loss: 8.653e-02]hash_cache_v1:  51%|#####1    | 1535/3000 [1:20:52<1:11:33,  2.93s/it, lr: 1.0e-04 loss: 8.653e-02]hash_cache_v1:  51%|#####1    | 1535/3000 [1:20:52<1:11:33,  2.93s/it, lr: 1.0e-04 loss: 8.653e-02]hash_cache_v1:  51%|#####1    | 1535/3000 [1:20:55<1:11:33,  2.93s/it, lr: 1.0e-04 loss: 1.715e-01]hash_cache_v1:  51%|#####1    | 1535/3000 [1:20:55<1:11:33,  2.93s/it, lr: 1.0e-04 loss: 1.715e-01]hash_cache_v1:  51%|#####1    | 1536/3000 [1:20:55<1:07:43,  2.78s/it, lr: 1.0e-04 loss: 1.715e-01]hash_cache_v1:  51%|#####1    | 1536/3000 [1:20:55<1:07:43,  2.78s/it, lr: 1.0e-04 loss: 1.715e-01]hash_cache_v1:  51%|#####1    | 1536/3000 [1:20:58<1:07:43,  2.78s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  51%|#####1    | 1536/3000 [1:20:58<1:07:43,  2.78s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  51%|#####1    | 1537/3000 [1:20:58<1:08:23,  2.80s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  51%|#####1    | 1537/3000 [1:20:58<1:08:23,  2.80s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  51%|#####1    | 1537/3000 [1:21:00<1:08:23,  2.80s/it, lr: 1.0e-04 loss: 2.450e-02]hash_cache_v1:  51%|#####1    | 1537/3000 [1:21:00<1:08:23,  2.80s/it, lr: 1.0e-04 loss: 2.450e-02]hash_cache_v1:  51%|#####1    | 1538/3000 [1:21:00<1:08:56,  2.83s/it, lr: 1.0e-04 loss: 2.450e-02]hash_cache_v1:  51%|#####1    | 1538/3000 [1:21:00<1:08:56,  2.83s/it, lr: 1.0e-04 loss: 2.450e-02]hash_cache_v1:  51%|#####1    | 1538/3000 [1:21:03<1:08:56,  2.83s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  51%|#####1    | 1538/3000 [1:21:03<1:08:56,  2.83s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  51%|#####1    | 1539/3000 [1:21:03<1:03:44,  2.62s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  51%|#####1    | 1539/3000 [1:21:03<1:03:44,  2.62s/it, lr: 1.0e-04 loss: 1.722e-01]hash_cache_v1:  51%|#####1    | 1539/3000 [1:21:06<1:03:44,  2.62s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:  51%|#####1    | 1539/3000 [1:21:06<1:03:44,  2.62s/it, lr: 1.0e-04 loss: 1.486e-01]hash_cache_v1:  51%|#####1    | 1540/3000 [1:21:10<1:03:42,  2.62s/it, lr: 1.0e-04 loss: 1.397e-01]hash_cache_v1:  51%|#####1    | 1540/3000 [1:21:10<1:03:42,  2.62s/it, lr: 1.0e-04 loss: 1.397e-01]hash_cache_v1:  51%|#####1    | 1541/3000 [1:21:10<57:52,  2.38s/it, lr: 1.0e-04 loss: 1.397e-01]  hash_cache_v1:  51%|#####1    | 1541/3000 [1:21:10<57:52,  2.38s/it, lr: 1.0e-04 loss: 1.397e-01]  hash_cache_v1:  51%|#####1    | 1541/3000 [1:21:13<57:52,  2.38s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  51%|#####1    | 1541/3000 [1:21:13<57:52,  2.38s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  51%|#####1    | 1542/3000 [1:21:13<1:00:52,  2.51s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  51%|#####1    | 1542/3000 [1:21:13<1:00:52,  2.51s/it, lr: 1.0e-04 loss: 1.414e-01]hash_cache_v1:  51%|#####1    | 1542/3000 [1:21:16<1:00:52,  2.51s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  51%|#####1    | 1542/3000 [1:21:16<1:00:52,  2.51s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  51%|#####1    | 1543/3000 [1:21:16<1:02:53,  2.59s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  51%|#####1    | 1543/3000 [1:21:16<1:02:53,  2.59s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  51%|#####1    | 1543/3000 [1:21:19<1:02:53,  2.59s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  51%|#####1    | 1543/3000 [1:21:19<1:02:53,  2.59s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  51%|#####1    | 1544/3000 [1:21:19<1:06:07,  2.73s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  51%|#####1    | 1544/3000 [1:21:19<1:06:07,  2.73s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  51%|#####1    | 1544/3000 [1:21:23<1:06:07,  2.73s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  51%|#####1    | 1544/3000 [1:21:23<1:06:07,  2.73s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  52%|#####1    | 1545/3000 [1:21:23<1:16:59,  3.17s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  52%|#####1    | 1545/3000 [1:21:23<1:16:59,  3.17s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  52%|#####1    | 1545/3000 [1:21:27<1:16:59,  3.17s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  52%|#####1    | 1545/3000 [1:21:27<1:16:59,  3.17s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  52%|#####1    | 1546/3000 [1:21:27<1:25:02,  3.51s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  52%|#####1    | 1546/3000 [1:21:27<1:25:02,  3.51s/it, lr: 1.0e-04 loss: 1.504e-01]hash_cache_v1:  52%|#####1    | 1546/3000 [1:21:30<1:25:02,  3.51s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  52%|#####1    | 1546/3000 [1:21:30<1:25:02,  3.51s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  52%|#####1    | 1547/3000 [1:21:30<1:17:04,  3.18s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  52%|#####1    | 1547/3000 [1:21:30<1:17:04,  3.18s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  52%|#####1    | 1547/3000 [1:21:34<1:17:04,  3.18s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  52%|#####1    | 1547/3000 [1:21:34<1:17:04,  3.18s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  52%|#####1    | 1548/3000 [1:21:34<1:24:58,  3.51s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  52%|#####1    | 1548/3000 [1:21:34<1:24:58,  3.51s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  52%|#####1    | 1548/3000 [1:21:38<1:24:58,  3.51s/it, lr: 1.0e-04 loss: 1.018e-01]hash_cache_v1:  52%|#####1    | 1548/3000 [1:21:38<1:24:58,  3.51s/it, lr: 1.0e-04 loss: 1.018e-01]hash_cache_v1:  52%|#####1    | 1549/3000 [1:21:38<1:30:31,  3.74s/it, lr: 1.0e-04 loss: 1.018e-01]hash_cache_v1:  52%|#####1    | 1549/3000 [1:21:38<1:30:31,  3.74s/it, lr: 1.0e-04 loss: 1.018e-01]hash_cache_v1:  52%|#####1    | 1549/3000 [1:21:43<1:30:31,  3.74s/it, lr: 1.0e-04 loss: 3.487e-02]hash_cache_v1:  52%|#####1    | 1549/3000 [1:21:43<1:30:31,  3.74s/it, lr: 1.0e-04 loss: 3.487e-02]hash_cache_v1:  52%|#####1    | 1550/3000 [1:21:46<1:30:27,  3.74s/it, lr: 1.0e-04 loss: 1.703e-02]hash_cache_v1:  52%|#####1    | 1550/3000 [1:21:46<1:30:27,  3.74s/it, lr: 1.0e-04 loss: 1.703e-02]hash_cache_v1:  52%|#####1    | 1551/3000 [1:21:46<1:06:04,  2.74s/it, lr: 1.0e-04 loss: 1.703e-02]hash_cache_v1:  52%|#####1    | 1551/3000 [1:21:46<1:06:04,  2.74s/it, lr: 1.0e-04 loss: 1.703e-02]hash_cache_v1:  52%|#####1    | 1551/3000 [1:21:48<1:06:04,  2.74s/it, lr: 1.0e-04 loss: 8.873e-02]hash_cache_v1:  52%|#####1    | 1551/3000 [1:21:48<1:06:04,  2.74s/it, lr: 1.0e-04 loss: 8.873e-02]hash_cache_v1:  52%|#####1    | 1552/3000 [1:21:48<1:02:18,  2.58s/it, lr: 1.0e-04 loss: 8.873e-02]hash_cache_v1:  52%|#####1    | 1552/3000 [1:21:48<1:02:18,  2.58s/it, lr: 1.0e-04 loss: 8.873e-02]hash_cache_v1:  52%|#####1    | 1552/3000 [1:21:51<1:02:18,  2.58s/it, lr: 1.0e-04 loss: 2.560e-02]hash_cache_v1:  52%|#####1    | 1552/3000 [1:21:51<1:02:18,  2.58s/it, lr: 1.0e-04 loss: 2.560e-02]hash_cache_v1:  52%|#####1    | 1553/3000 [1:21:51<1:04:03,  2.66s/it, lr: 1.0e-04 loss: 2.560e-02]hash_cache_v1:  52%|#####1    | 1553/3000 [1:21:51<1:04:03,  2.66s/it, lr: 1.0e-04 loss: 2.560e-02]hash_cache_v1:  52%|#####1    | 1553/3000 [1:21:55<1:04:03,  2.66s/it, lr: 1.0e-04 loss: 4.194e-02]hash_cache_v1:  52%|#####1    | 1553/3000 [1:21:55<1:04:03,  2.66s/it, lr: 1.0e-04 loss: 4.194e-02]hash_cache_v1:  52%|#####1    | 1554/3000 [1:21:55<1:15:58,  3.15s/it, lr: 1.0e-04 loss: 4.194e-02]hash_cache_v1:  52%|#####1    | 1554/3000 [1:21:55<1:15:58,  3.15s/it, lr: 1.0e-04 loss: 4.194e-02]hash_cache_v1:  52%|#####1    | 1554/3000 [1:21:59<1:15:58,  3.15s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  52%|#####1    | 1554/3000 [1:21:59<1:15:58,  3.15s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  52%|#####1    | 1555/3000 [1:21:59<1:23:26,  3.47s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  52%|#####1    | 1555/3000 [1:21:59<1:23:26,  3.47s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  52%|#####1    | 1555/3000 [1:22:02<1:23:26,  3.47s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:  52%|#####1    | 1555/3000 [1:22:02<1:23:26,  3.47s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:  52%|#####1    | 1556/3000 [1:22:02<1:14:09,  3.08s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:  52%|#####1    | 1556/3000 [1:22:02<1:14:09,  3.08s/it, lr: 1.0e-04 loss: 1.998e-01]hash_cache_v1:  52%|#####1    | 1556/3000 [1:22:04<1:14:09,  3.08s/it, lr: 1.0e-04 loss: 3.849e-02]hash_cache_v1:  52%|#####1    | 1556/3000 [1:22:04<1:14:09,  3.08s/it, lr: 1.0e-04 loss: 3.849e-02]hash_cache_v1:  52%|#####1    | 1557/3000 [1:22:04<1:07:17,  2.80s/it, lr: 1.0e-04 loss: 3.849e-02]hash_cache_v1:  52%|#####1    | 1557/3000 [1:22:04<1:07:17,  2.80s/it, lr: 1.0e-04 loss: 3.849e-02]hash_cache_v1:  52%|#####1    | 1557/3000 [1:22:07<1:07:17,  2.80s/it, lr: 1.0e-04 loss: 8.491e-02]hash_cache_v1:  52%|#####1    | 1557/3000 [1:22:07<1:07:17,  2.80s/it, lr: 1.0e-04 loss: 8.491e-02]hash_cache_v1:  52%|#####1    | 1558/3000 [1:22:07<1:09:08,  2.88s/it, lr: 1.0e-04 loss: 8.491e-02]hash_cache_v1:  52%|#####1    | 1558/3000 [1:22:07<1:09:08,  2.88s/it, lr: 1.0e-04 loss: 8.491e-02]hash_cache_v1:  52%|#####1    | 1558/3000 [1:22:09<1:09:08,  2.88s/it, lr: 1.0e-04 loss: 1.387e-03]hash_cache_v1:  52%|#####1    | 1558/3000 [1:22:09<1:09:08,  2.88s/it, lr: 1.0e-04 loss: 1.387e-03]hash_cache_v1:  52%|#####1    | 1559/3000 [1:22:09<1:03:43,  2.65s/it, lr: 1.0e-04 loss: 1.387e-03]hash_cache_v1:  52%|#####1    | 1559/3000 [1:22:09<1:03:43,  2.65s/it, lr: 1.0e-04 loss: 1.387e-03]hash_cache_v1:  52%|#####1    | 1559/3000 [1:22:13<1:03:43,  2.65s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  52%|#####1    | 1559/3000 [1:22:13<1:03:43,  2.65s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  52%|#####2    | 1560/3000 [1:22:17<1:03:40,  2.65s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  52%|#####2    | 1560/3000 [1:22:17<1:03:40,  2.65s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  52%|#####2    | 1561/3000 [1:22:17<58:15,  2.43s/it, lr: 1.0e-04 loss: 1.092e-01]  hash_cache_v1:  52%|#####2    | 1561/3000 [1:22:17<58:15,  2.43s/it, lr: 1.0e-04 loss: 1.092e-01]  hash_cache_v1:  52%|#####2    | 1561/3000 [1:22:20<58:15,  2.43s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  52%|#####2    | 1561/3000 [1:22:20<58:15,  2.43s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  52%|#####2    | 1562/3000 [1:22:20<58:00,  2.42s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  52%|#####2    | 1562/3000 [1:22:20<58:00,  2.42s/it, lr: 1.0e-04 loss: 1.774e-01]hash_cache_v1:  52%|#####2    | 1562/3000 [1:22:23<58:00,  2.42s/it, lr: 1.0e-04 loss: 1.656e-01]hash_cache_v1:  52%|#####2    | 1562/3000 [1:22:23<58:00,  2.42s/it, lr: 1.0e-04 loss: 1.656e-01]hash_cache_v1:  52%|#####2    | 1563/3000 [1:22:23<1:00:51,  2.54s/it, lr: 1.0e-04 loss: 1.656e-01]hash_cache_v1:  52%|#####2    | 1563/3000 [1:22:23<1:00:51,  2.54s/it, lr: 1.0e-04 loss: 1.656e-01]hash_cache_v1:  52%|#####2    | 1563/3000 [1:22:25<1:00:51,  2.54s/it, lr: 1.0e-04 loss: 1.555e-01]hash_cache_v1:  52%|#####2    | 1563/3000 [1:22:25<1:00:51,  2.54s/it, lr: 1.0e-04 loss: 1.555e-01]hash_cache_v1:  52%|#####2    | 1564/3000 [1:22:25<57:51,  2.42s/it, lr: 1.0e-04 loss: 1.555e-01]  hash_cache_v1:  52%|#####2    | 1564/3000 [1:22:25<57:51,  2.42s/it, lr: 1.0e-04 loss: 1.555e-01]  hash_cache_v1:  52%|#####2    | 1564/3000 [1:22:28<57:51,  2.42s/it, lr: 1.0e-04 loss: 4.132e-02]hash_cache_v1:  52%|#####2    | 1564/3000 [1:22:28<57:51,  2.42s/it, lr: 1.0e-04 loss: 4.132e-02]hash_cache_v1:  52%|#####2    | 1565/3000 [1:22:28<1:02:01,  2.59s/it, lr: 1.0e-04 loss: 4.132e-02]hash_cache_v1:  52%|#####2    | 1565/3000 [1:22:28<1:02:01,  2.59s/it, lr: 1.0e-04 loss: 4.132e-02]hash_cache_v1:  52%|#####2    | 1565/3000 [1:22:32<1:02:01,  2.59s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  52%|#####2    | 1565/3000 [1:22:32<1:02:01,  2.59s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  52%|#####2    | 1566/3000 [1:22:32<1:13:24,  3.07s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  52%|#####2    | 1566/3000 [1:22:32<1:13:24,  3.07s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  52%|#####2    | 1566/3000 [1:22:36<1:13:24,  3.07s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  52%|#####2    | 1566/3000 [1:22:36<1:13:24,  3.07s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  52%|#####2    | 1567/3000 [1:22:36<1:21:58,  3.43s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  52%|#####2    | 1567/3000 [1:22:36<1:21:58,  3.43s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  52%|#####2    | 1567/3000 [1:22:39<1:21:58,  3.43s/it, lr: 1.0e-04 loss: 5.057e-02]hash_cache_v1:  52%|#####2    | 1567/3000 [1:22:39<1:21:58,  3.43s/it, lr: 1.0e-04 loss: 5.057e-02]hash_cache_v1:  52%|#####2    | 1568/3000 [1:22:39<1:17:59,  3.27s/it, lr: 1.0e-04 loss: 5.057e-02]hash_cache_v1:  52%|#####2    | 1568/3000 [1:22:39<1:17:59,  3.27s/it, lr: 1.0e-04 loss: 5.057e-02]hash_cache_v1:  52%|#####2    | 1568/3000 [1:22:42<1:17:59,  3.27s/it, lr: 1.0e-04 loss: 2.435e-02]hash_cache_v1:  52%|#####2    | 1568/3000 [1:22:42<1:17:59,  3.27s/it, lr: 1.0e-04 loss: 2.435e-02]hash_cache_v1:  52%|#####2    | 1569/3000 [1:22:42<1:11:30,  3.00s/it, lr: 1.0e-04 loss: 2.435e-02]hash_cache_v1:  52%|#####2    | 1569/3000 [1:22:42<1:11:30,  3.00s/it, lr: 1.0e-04 loss: 2.435e-02]hash_cache_v1:  52%|#####2    | 1569/3000 [1:22:45<1:11:30,  3.00s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  52%|#####2    | 1569/3000 [1:22:45<1:11:30,  3.00s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  52%|#####2    | 1570/3000 [1:22:49<1:11:27,  3.00s/it, lr: 1.0e-04 loss: 7.675e-02]hash_cache_v1:  52%|#####2    | 1570/3000 [1:22:49<1:11:27,  3.00s/it, lr: 1.0e-04 loss: 7.675e-02]hash_cache_v1:  52%|#####2    | 1571/3000 [1:22:49<1:01:39,  2.59s/it, lr: 1.0e-04 loss: 7.675e-02]hash_cache_v1:  52%|#####2    | 1571/3000 [1:22:49<1:01:39,  2.59s/it, lr: 1.0e-04 loss: 7.675e-02]hash_cache_v1:  52%|#####2    | 1571/3000 [1:22:51<1:01:39,  2.59s/it, lr: 1.0e-04 loss: 1.653e-02]hash_cache_v1:  52%|#####2    | 1571/3000 [1:22:51<1:01:39,  2.59s/it, lr: 1.0e-04 loss: 1.653e-02]hash_cache_v1:  52%|#####2    | 1572/3000 [1:22:51<58:43,  2.47s/it, lr: 1.0e-04 loss: 1.653e-02]  hash_cache_v1:  52%|#####2    | 1572/3000 [1:22:51<58:43,  2.47s/it, lr: 1.0e-04 loss: 1.653e-02]  hash_cache_v1:  52%|#####2    | 1572/3000 [1:22:55<58:43,  2.47s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  52%|#####2    | 1572/3000 [1:22:55<58:43,  2.47s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  52%|#####2    | 1573/3000 [1:22:55<1:11:26,  3.00s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  52%|#####2    | 1573/3000 [1:22:55<1:11:26,  3.00s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  52%|#####2    | 1573/3000 [1:22:58<1:11:26,  3.00s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  52%|#####2    | 1573/3000 [1:22:58<1:11:26,  3.00s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  52%|#####2    | 1574/3000 [1:22:58<1:10:38,  2.97s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  52%|#####2    | 1574/3000 [1:22:58<1:10:38,  2.97s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  52%|#####2    | 1574/3000 [1:23:01<1:10:38,  2.97s/it, lr: 1.0e-04 loss: 7.754e-02]hash_cache_v1:  52%|#####2    | 1574/3000 [1:23:01<1:10:38,  2.97s/it, lr: 1.0e-04 loss: 7.754e-02]hash_cache_v1:  52%|#####2    | 1575/3000 [1:23:01<1:09:45,  2.94s/it, lr: 1.0e-04 loss: 7.754e-02]hash_cache_v1:  52%|#####2    | 1575/3000 [1:23:01<1:09:45,  2.94s/it, lr: 1.0e-04 loss: 7.754e-02]hash_cache_v1:  52%|#####2    | 1575/3000 [1:23:03<1:09:45,  2.94s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  52%|#####2    | 1575/3000 [1:23:03<1:09:45,  2.94s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  53%|#####2    | 1576/3000 [1:23:03<1:06:07,  2.79s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  53%|#####2    | 1576/3000 [1:23:03<1:06:07,  2.79s/it, lr: 1.0e-04 loss: 1.503e-01]hash_cache_v1:  53%|#####2    | 1576/3000 [1:23:08<1:06:07,  2.79s/it, lr: 1.0e-04 loss: 8.194e-02]hash_cache_v1:  53%|#####2    | 1576/3000 [1:23:08<1:06:07,  2.79s/it, lr: 1.0e-04 loss: 8.194e-02]hash_cache_v1:  53%|#####2    | 1577/3000 [1:23:08<1:16:32,  3.23s/it, lr: 1.0e-04 loss: 8.194e-02]hash_cache_v1:  53%|#####2    | 1577/3000 [1:23:08<1:16:32,  3.23s/it, lr: 1.0e-04 loss: 8.194e-02]hash_cache_v1:  53%|#####2    | 1577/3000 [1:23:10<1:16:32,  3.23s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  53%|#####2    | 1577/3000 [1:23:10<1:16:32,  3.23s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  53%|#####2    | 1578/3000 [1:23:10<1:08:49,  2.90s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  53%|#####2    | 1578/3000 [1:23:10<1:08:49,  2.90s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  53%|#####2    | 1578/3000 [1:23:13<1:08:49,  2.90s/it, lr: 1.0e-04 loss: 1.544e-01]hash_cache_v1:  53%|#####2    | 1578/3000 [1:23:13<1:08:49,  2.90s/it, lr: 1.0e-04 loss: 1.544e-01]hash_cache_v1:  53%|#####2    | 1579/3000 [1:23:13<1:08:32,  2.89s/it, lr: 1.0e-04 loss: 1.544e-01]hash_cache_v1:  53%|#####2    | 1579/3000 [1:23:13<1:08:32,  2.89s/it, lr: 1.0e-04 loss: 1.544e-01]hash_cache_v1:  53%|#####2    | 1579/3000 [1:23:17<1:08:32,  2.89s/it, lr: 1.0e-04 loss: 8.415e-02]hash_cache_v1:  53%|#####2    | 1579/3000 [1:23:17<1:08:32,  2.89s/it, lr: 1.0e-04 loss: 8.415e-02]hash_cache_v1:  53%|#####2    | 1580/3000 [1:23:20<1:08:29,  2.89s/it, lr: 1.0e-04 loss: 1.334e-01]hash_cache_v1:  53%|#####2    | 1580/3000 [1:23:20<1:08:29,  2.89s/it, lr: 1.0e-04 loss: 1.334e-01]hash_cache_v1:  53%|#####2    | 1581/3000 [1:23:20<52:33,  2.22s/it, lr: 1.0e-04 loss: 1.334e-01]  hash_cache_v1:  53%|#####2    | 1581/3000 [1:23:20<52:33,  2.22s/it, lr: 1.0e-04 loss: 1.334e-01]  hash_cache_v1:  53%|#####2    | 1581/3000 [1:23:23<52:33,  2.22s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  53%|#####2    | 1581/3000 [1:23:23<52:33,  2.22s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  53%|#####2    | 1582/3000 [1:23:23<56:33,  2.39s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  53%|#####2    | 1582/3000 [1:23:23<56:33,  2.39s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  53%|#####2    | 1582/3000 [1:23:26<56:33,  2.39s/it, lr: 1.0e-04 loss: 7.333e-03]hash_cache_v1:  53%|#####2    | 1582/3000 [1:23:26<56:33,  2.39s/it, lr: 1.0e-04 loss: 7.333e-03]hash_cache_v1:  53%|#####2    | 1583/3000 [1:23:26<1:00:44,  2.57s/it, lr: 1.0e-04 loss: 7.333e-03]hash_cache_v1:  53%|#####2    | 1583/3000 [1:23:26<1:00:44,  2.57s/it, lr: 1.0e-04 loss: 7.333e-03]hash_cache_v1:  53%|#####2    | 1583/3000 [1:23:30<1:00:44,  2.57s/it, lr: 1.0e-04 loss: 7.203e-02]hash_cache_v1:  53%|#####2    | 1583/3000 [1:23:30<1:00:44,  2.57s/it, lr: 1.0e-04 loss: 7.203e-02]hash_cache_v1:  53%|#####2    | 1584/3000 [1:23:30<1:11:16,  3.02s/it, lr: 1.0e-04 loss: 7.203e-02]hash_cache_v1:  53%|#####2    | 1584/3000 [1:23:30<1:11:16,  3.02s/it, lr: 1.0e-04 loss: 7.203e-02]hash_cache_v1:  53%|#####2    | 1584/3000 [1:23:33<1:11:16,  3.02s/it, lr: 1.0e-04 loss: 4.721e-02]hash_cache_v1:  53%|#####2    | 1584/3000 [1:23:33<1:11:16,  3.02s/it, lr: 1.0e-04 loss: 4.721e-02]hash_cache_v1:  53%|#####2    | 1585/3000 [1:23:33<1:10:17,  2.98s/it, lr: 1.0e-04 loss: 4.721e-02]hash_cache_v1:  53%|#####2    | 1585/3000 [1:23:33<1:10:17,  2.98s/it, lr: 1.0e-04 loss: 4.721e-02]hash_cache_v1:  53%|#####2    | 1585/3000 [1:23:36<1:10:17,  2.98s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  53%|#####2    | 1585/3000 [1:23:36<1:10:17,  2.98s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  53%|#####2    | 1586/3000 [1:23:36<1:09:17,  2.94s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  53%|#####2    | 1586/3000 [1:23:36<1:09:17,  2.94s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  53%|#####2    | 1586/3000 [1:23:38<1:09:17,  2.94s/it, lr: 1.0e-04 loss: 9.819e-02]hash_cache_v1:  53%|#####2    | 1586/3000 [1:23:38<1:09:17,  2.94s/it, lr: 1.0e-04 loss: 9.819e-02]hash_cache_v1:  53%|#####2    | 1587/3000 [1:23:38<1:05:25,  2.78s/it, lr: 1.0e-04 loss: 9.819e-02]hash_cache_v1:  53%|#####2    | 1587/3000 [1:23:38<1:05:25,  2.78s/it, lr: 1.0e-04 loss: 9.819e-02]hash_cache_v1:  53%|#####2    | 1587/3000 [1:23:43<1:05:25,  2.78s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  53%|#####2    | 1587/3000 [1:23:43<1:05:25,  2.78s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  53%|#####2    | 1588/3000 [1:23:43<1:15:53,  3.22s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  53%|#####2    | 1588/3000 [1:23:43<1:15:53,  3.22s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  53%|#####2    | 1588/3000 [1:23:47<1:15:53,  3.22s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  53%|#####2    | 1588/3000 [1:23:47<1:15:53,  3.22s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  53%|#####2    | 1589/3000 [1:23:47<1:23:31,  3.55s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  53%|#####2    | 1589/3000 [1:23:47<1:23:31,  3.55s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  53%|#####2    | 1589/3000 [1:23:49<1:23:31,  3.55s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  53%|#####2    | 1589/3000 [1:23:49<1:23:31,  3.55s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  53%|#####3    | 1590/3000 [1:23:54<1:23:28,  3.55s/it, lr: 1.0e-04 loss: 4.573e-02]hash_cache_v1:  53%|#####3    | 1590/3000 [1:23:54<1:23:28,  3.55s/it, lr: 1.0e-04 loss: 4.573e-02]hash_cache_v1:  53%|#####3    | 1591/3000 [1:23:54<1:09:30,  2.96s/it, lr: 1.0e-04 loss: 4.573e-02]hash_cache_v1:  53%|#####3    | 1591/3000 [1:23:54<1:09:30,  2.96s/it, lr: 1.0e-04 loss: 4.573e-02]hash_cache_v1:  53%|#####3    | 1591/3000 [1:23:56<1:09:30,  2.96s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  53%|#####3    | 1591/3000 [1:23:56<1:09:30,  2.96s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  53%|#####3    | 1592/3000 [1:23:56<1:04:28,  2.75s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  53%|#####3    | 1592/3000 [1:23:56<1:04:28,  2.75s/it, lr: 1.0e-04 loss: 1.634e-01]hash_cache_v1:  53%|#####3    | 1592/3000 [1:23:59<1:04:28,  2.75s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1592/3000 [1:23:59<1:04:28,  2.75s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1593/3000 [1:23:59<1:05:00,  2.77s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1593/3000 [1:23:59<1:05:00,  2.77s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1593/3000 [1:24:03<1:05:00,  2.77s/it, lr: 1.0e-04 loss: 1.525e-01]hash_cache_v1:  53%|#####3    | 1593/3000 [1:24:03<1:05:00,  2.77s/it, lr: 1.0e-04 loss: 1.525e-01]hash_cache_v1:  53%|#####3    | 1594/3000 [1:24:03<1:15:52,  3.24s/it, lr: 1.0e-04 loss: 1.525e-01]hash_cache_v1:  53%|#####3    | 1594/3000 [1:24:03<1:15:52,  3.24s/it, lr: 1.0e-04 loss: 1.525e-01]hash_cache_v1:  53%|#####3    | 1594/3000 [1:24:05<1:15:52,  3.24s/it, lr: 1.0e-04 loss: 2.128e-01]hash_cache_v1:  53%|#####3    | 1594/3000 [1:24:05<1:15:52,  3.24s/it, lr: 1.0e-04 loss: 2.128e-01]hash_cache_v1:  53%|#####3    | 1595/3000 [1:24:05<1:08:15,  2.91s/it, lr: 1.0e-04 loss: 2.128e-01]hash_cache_v1:  53%|#####3    | 1595/3000 [1:24:05<1:08:15,  2.91s/it, lr: 1.0e-04 loss: 2.128e-01]hash_cache_v1:  53%|#####3    | 1595/3000 [1:24:10<1:08:15,  2.91s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  53%|#####3    | 1595/3000 [1:24:10<1:08:15,  2.91s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  53%|#####3    | 1596/3000 [1:24:10<1:17:34,  3.32s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  53%|#####3    | 1596/3000 [1:24:10<1:17:34,  3.32s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  53%|#####3    | 1596/3000 [1:24:12<1:17:34,  3.32s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1596/3000 [1:24:12<1:17:34,  3.32s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1597/3000 [1:24:12<1:09:13,  2.96s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1597/3000 [1:24:12<1:09:13,  2.96s/it, lr: 1.0e-04 loss: 1.750e-01]hash_cache_v1:  53%|#####3    | 1597/3000 [1:24:15<1:09:13,  2.96s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  53%|#####3    | 1597/3000 [1:24:15<1:09:13,  2.96s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  53%|#####3    | 1598/3000 [1:24:15<1:09:59,  3.00s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  53%|#####3    | 1598/3000 [1:24:15<1:09:59,  3.00s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  53%|#####3    | 1598/3000 [1:24:18<1:09:59,  3.00s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  53%|#####3    | 1598/3000 [1:24:18<1:09:59,  3.00s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  53%|#####3    | 1599/3000 [1:24:18<1:09:04,  2.96s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  53%|#####3    | 1599/3000 [1:24:18<1:09:04,  2.96s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  53%|#####3    | 1599/3000 [1:24:22<1:09:04,  2.96s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  53%|#####3    | 1599/3000 [1:24:22<1:09:04,  2.96s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  53%|#####3    | 1600/3000 [1:24:24<1:09:01,  2.96s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  53%|#####3    | 1600/3000 [1:24:24<1:09:01,  2.96s/it, lr: 1.0e-04 loss: 1.674e-01]hash_cache_v1:  53%|#####3    | 1601/3000 [1:24:24<50:06,  2.15s/it, lr: 1.0e-04 loss: 1.674e-01]  hash_cache_v1:  53%|#####3    | 1601/3000 [1:24:24<50:06,  2.15s/it, lr: 1.0e-04 loss: 1.674e-01]  hash_cache_v1:  53%|#####3    | 1601/3000 [1:24:27<50:06,  2.15s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  53%|#####3    | 1601/3000 [1:24:27<50:06,  2.15s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  53%|#####3    | 1602/3000 [1:24:27<54:12,  2.33s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  53%|#####3    | 1602/3000 [1:24:27<54:12,  2.33s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  53%|#####3    | 1602/3000 [1:24:30<54:12,  2.33s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  53%|#####3    | 1602/3000 [1:24:30<54:12,  2.33s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  53%|#####3    | 1603/3000 [1:24:30<57:19,  2.46s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  53%|#####3    | 1603/3000 [1:24:30<57:19,  2.46s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  53%|#####3    | 1603/3000 [1:24:33<57:19,  2.46s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:  53%|#####3    | 1603/3000 [1:24:33<57:19,  2.46s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:  53%|#####3    | 1604/3000 [1:24:33<59:50,  2.57s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:  53%|#####3    | 1604/3000 [1:24:33<59:50,  2.57s/it, lr: 1.0e-04 loss: 1.755e-01]hash_cache_v1:  53%|#####3    | 1604/3000 [1:24:37<59:50,  2.57s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  53%|#####3    | 1604/3000 [1:24:37<59:50,  2.57s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  54%|#####3    | 1605/3000 [1:24:37<1:12:19,  3.11s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  54%|#####3    | 1605/3000 [1:24:37<1:12:19,  3.11s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  54%|#####3    | 1605/3000 [1:24:42<1:12:19,  3.11s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  54%|#####3    | 1605/3000 [1:24:42<1:12:19,  3.11s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  54%|#####3    | 1606/3000 [1:24:42<1:20:17,  3.46s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  54%|#####3    | 1606/3000 [1:24:42<1:20:17,  3.46s/it, lr: 1.0e-04 loss: 1.569e-01]hash_cache_v1:  54%|#####3    | 1606/3000 [1:24:44<1:20:17,  3.46s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  54%|#####3    | 1606/3000 [1:24:44<1:20:17,  3.46s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  54%|#####3    | 1607/3000 [1:24:44<1:10:59,  3.06s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  54%|#####3    | 1607/3000 [1:24:44<1:10:59,  3.06s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  54%|#####3    | 1607/3000 [1:24:46<1:10:59,  3.06s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  54%|#####3    | 1607/3000 [1:24:46<1:10:59,  3.06s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  54%|#####3    | 1608/3000 [1:24:46<1:06:01,  2.85s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  54%|#####3    | 1608/3000 [1:24:46<1:06:01,  2.85s/it, lr: 1.0e-04 loss: 2.055e-01]hash_cache_v1:  54%|#####3    | 1608/3000 [1:24:48<1:06:01,  2.85s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  54%|#####3    | 1608/3000 [1:24:48<1:06:01,  2.85s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  54%|#####3    | 1609/3000 [1:24:48<1:00:43,  2.62s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  54%|#####3    | 1609/3000 [1:24:48<1:00:43,  2.62s/it, lr: 1.0e-04 loss: 1.726e-01]hash_cache_v1:  54%|#####3    | 1609/3000 [1:24:53<1:00:43,  2.62s/it, lr: 1.0e-04 loss: 1.103e-02]hash_cache_v1:  54%|#####3    | 1609/3000 [1:24:53<1:00:43,  2.62s/it, lr: 1.0e-04 loss: 1.103e-02]hash_cache_v1:  54%|#####3    | 1610/3000 [1:24:55<1:00:40,  2.62s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  54%|#####3    | 1610/3000 [1:24:55<1:00:40,  2.62s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  54%|#####3    | 1611/3000 [1:24:55<48:05,  2.08s/it, lr: 1.0e-04 loss: 1.496e-01]  hash_cache_v1:  54%|#####3    | 1611/3000 [1:24:55<48:05,  2.08s/it, lr: 1.0e-04 loss: 1.496e-01]  hash_cache_v1:  54%|#####3    | 1611/3000 [1:25:00<48:05,  2.08s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  54%|#####3    | 1611/3000 [1:25:00<48:05,  2.08s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  54%|#####3    | 1612/3000 [1:25:00<1:01:39,  2.67s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  54%|#####3    | 1612/3000 [1:25:00<1:01:39,  2.67s/it, lr: 1.0e-04 loss: 1.041e-01]hash_cache_v1:  54%|#####3    | 1612/3000 [1:25:02<1:01:39,  2.67s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  54%|#####3    | 1612/3000 [1:25:02<1:01:39,  2.67s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  54%|#####3    | 1613/3000 [1:25:02<58:02,  2.51s/it, lr: 1.0e-04 loss: 1.467e-01]  hash_cache_v1:  54%|#####3    | 1613/3000 [1:25:02<58:02,  2.51s/it, lr: 1.0e-04 loss: 1.467e-01]  hash_cache_v1:  54%|#####3    | 1613/3000 [1:25:04<58:02,  2.51s/it, lr: 1.0e-04 loss: 1.510e-01]hash_cache_v1:  54%|#####3    | 1613/3000 [1:25:04<58:02,  2.51s/it, lr: 1.0e-04 loss: 1.510e-01]hash_cache_v1:  54%|#####3    | 1614/3000 [1:25:04<55:14,  2.39s/it, lr: 1.0e-04 loss: 1.510e-01]hash_cache_v1:  54%|#####3    | 1614/3000 [1:25:04<55:14,  2.39s/it, lr: 1.0e-04 loss: 1.510e-01]hash_cache_v1:  54%|#####3    | 1614/3000 [1:25:08<55:14,  2.39s/it, lr: 1.0e-04 loss: 2.249e-02]hash_cache_v1:  54%|#####3    | 1614/3000 [1:25:08<55:14,  2.39s/it, lr: 1.0e-04 loss: 2.249e-02]hash_cache_v1:  54%|#####3    | 1615/3000 [1:25:08<1:08:02,  2.95s/it, lr: 1.0e-04 loss: 2.249e-02]hash_cache_v1:  54%|#####3    | 1615/3000 [1:25:08<1:08:02,  2.95s/it, lr: 1.0e-04 loss: 2.249e-02]hash_cache_v1:  54%|#####3    | 1615/3000 [1:25:11<1:08:02,  2.95s/it, lr: 1.0e-04 loss: 9.849e-03]hash_cache_v1:  54%|#####3    | 1615/3000 [1:25:11<1:08:02,  2.95s/it, lr: 1.0e-04 loss: 9.849e-03]hash_cache_v1:  54%|#####3    | 1616/3000 [1:25:11<1:07:30,  2.93s/it, lr: 1.0e-04 loss: 9.849e-03]hash_cache_v1:  54%|#####3    | 1616/3000 [1:25:11<1:07:30,  2.93s/it, lr: 1.0e-04 loss: 9.849e-03]hash_cache_v1:  54%|#####3    | 1616/3000 [1:25:13<1:07:30,  2.93s/it, lr: 1.0e-04 loss: 2.749e-01]hash_cache_v1:  54%|#####3    | 1616/3000 [1:25:13<1:07:30,  2.93s/it, lr: 1.0e-04 loss: 2.749e-01]hash_cache_v1:  54%|#####3    | 1617/3000 [1:25:13<1:01:48,  2.68s/it, lr: 1.0e-04 loss: 2.749e-01]hash_cache_v1:  54%|#####3    | 1617/3000 [1:25:13<1:01:48,  2.68s/it, lr: 1.0e-04 loss: 2.749e-01]hash_cache_v1:  54%|#####3    | 1617/3000 [1:25:15<1:01:48,  2.68s/it, lr: 1.0e-04 loss: 8.317e-02]hash_cache_v1:  54%|#####3    | 1617/3000 [1:25:15<1:01:48,  2.68s/it, lr: 1.0e-04 loss: 8.317e-02]hash_cache_v1:  54%|#####3    | 1618/3000 [1:25:15<57:38,  2.50s/it, lr: 1.0e-04 loss: 8.317e-02]  hash_cache_v1:  54%|#####3    | 1618/3000 [1:25:15<57:38,  2.50s/it, lr: 1.0e-04 loss: 8.317e-02]  hash_cache_v1:  54%|#####3    | 1618/3000 [1:25:18<57:38,  2.50s/it, lr: 1.0e-04 loss: 5.249e-02]hash_cache_v1:  54%|#####3    | 1618/3000 [1:25:18<57:38,  2.50s/it, lr: 1.0e-04 loss: 5.249e-02]hash_cache_v1:  54%|#####3    | 1619/3000 [1:25:18<56:34,  2.46s/it, lr: 1.0e-04 loss: 5.249e-02]hash_cache_v1:  54%|#####3    | 1619/3000 [1:25:18<56:34,  2.46s/it, lr: 1.0e-04 loss: 5.249e-02]hash_cache_v1:  54%|#####3    | 1619/3000 [1:25:22<56:34,  2.46s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  54%|#####3    | 1619/3000 [1:25:22<56:34,  2.46s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  54%|#####4    | 1620/3000 [1:25:25<56:31,  2.46s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:  54%|#####4    | 1620/3000 [1:25:25<56:31,  2.46s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:  54%|#####4    | 1621/3000 [1:25:25<45:44,  1.99s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:  54%|#####4    | 1621/3000 [1:25:25<45:44,  1.99s/it, lr: 1.0e-04 loss: 1.538e-01]hash_cache_v1:  54%|#####4    | 1621/3000 [1:25:27<45:44,  1.99s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  54%|#####4    | 1621/3000 [1:25:27<45:44,  1.99s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  54%|#####4    | 1622/3000 [1:25:27<46:26,  2.02s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  54%|#####4    | 1622/3000 [1:25:27<46:26,  2.02s/it, lr: 1.0e-04 loss: 2.394e-01]hash_cache_v1:  54%|#####4    | 1622/3000 [1:25:32<46:26,  2.02s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  54%|#####4    | 1622/3000 [1:25:32<46:26,  2.02s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  54%|#####4    | 1623/3000 [1:25:32<1:02:06,  2.71s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  54%|#####4    | 1623/3000 [1:25:32<1:02:06,  2.71s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  54%|#####4    | 1623/3000 [1:25:34<1:02:06,  2.71s/it, lr: 1.0e-04 loss: 1.824e-01]hash_cache_v1:  54%|#####4    | 1623/3000 [1:25:34<1:02:06,  2.71s/it, lr: 1.0e-04 loss: 1.824e-01]hash_cache_v1:  54%|#####4    | 1624/3000 [1:25:34<58:16,  2.54s/it, lr: 1.0e-04 loss: 1.824e-01]  hash_cache_v1:  54%|#####4    | 1624/3000 [1:25:34<58:16,  2.54s/it, lr: 1.0e-04 loss: 1.824e-01]  hash_cache_v1:  54%|#####4    | 1624/3000 [1:25:37<58:16,  2.54s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  54%|#####4    | 1624/3000 [1:25:37<58:16,  2.54s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  54%|#####4    | 1625/3000 [1:25:37<1:00:21,  2.63s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  54%|#####4    | 1625/3000 [1:25:37<1:00:21,  2.63s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  54%|#####4    | 1625/3000 [1:25:39<1:00:21,  2.63s/it, lr: 1.0e-04 loss: 5.702e-02]hash_cache_v1:  54%|#####4    | 1625/3000 [1:25:39<1:00:21,  2.63s/it, lr: 1.0e-04 loss: 5.702e-02]hash_cache_v1:  54%|#####4    | 1626/3000 [1:25:39<58:48,  2.57s/it, lr: 1.0e-04 loss: 5.702e-02]  hash_cache_v1:  54%|#####4    | 1626/3000 [1:25:39<58:48,  2.57s/it, lr: 1.0e-04 loss: 5.702e-02]  hash_cache_v1:  54%|#####4    | 1626/3000 [1:25:42<58:48,  2.57s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:  54%|#####4    | 1626/3000 [1:25:42<58:48,  2.57s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:  54%|#####4    | 1627/3000 [1:25:42<1:00:55,  2.66s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:  54%|#####4    | 1627/3000 [1:25:42<1:00:55,  2.66s/it, lr: 1.0e-04 loss: 1.983e-01]hash_cache_v1:  54%|#####4    | 1627/3000 [1:25:44<1:00:55,  2.66s/it, lr: 1.0e-04 loss: 1.423e-01]hash_cache_v1:  54%|#####4    | 1627/3000 [1:25:44<1:00:55,  2.66s/it, lr: 1.0e-04 loss: 1.423e-01]hash_cache_v1:  54%|#####4    | 1628/3000 [1:25:44<57:24,  2.51s/it, lr: 1.0e-04 loss: 1.423e-01]  hash_cache_v1:  54%|#####4    | 1628/3000 [1:25:44<57:24,  2.51s/it, lr: 1.0e-04 loss: 1.423e-01]  hash_cache_v1:  54%|#####4    | 1628/3000 [1:25:47<57:24,  2.51s/it, lr: 1.0e-04 loss: 1.573e-01]hash_cache_v1:  54%|#####4    | 1628/3000 [1:25:47<57:24,  2.51s/it, lr: 1.0e-04 loss: 1.573e-01]hash_cache_v1:  54%|#####4    | 1629/3000 [1:25:47<54:45,  2.40s/it, lr: 1.0e-04 loss: 1.573e-01]hash_cache_v1:  54%|#####4    | 1629/3000 [1:25:47<54:45,  2.40s/it, lr: 1.0e-04 loss: 1.573e-01]hash_cache_v1:  54%|#####4    | 1629/3000 [1:25:51<54:45,  2.40s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  54%|#####4    | 1629/3000 [1:25:51<54:45,  2.40s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  54%|#####4    | 1630/3000 [1:25:54<54:43,  2.40s/it, lr: 1.0e-04 loss: 8.186e-02]hash_cache_v1:  54%|#####4    | 1630/3000 [1:25:54<54:43,  2.40s/it, lr: 1.0e-04 loss: 8.186e-02]hash_cache_v1:  54%|#####4    | 1631/3000 [1:25:54<44:41,  1.96s/it, lr: 1.0e-04 loss: 8.186e-02]hash_cache_v1:  54%|#####4    | 1631/3000 [1:25:54<44:41,  1.96s/it, lr: 1.0e-04 loss: 8.186e-02]hash_cache_v1:  54%|#####4    | 1631/3000 [1:25:56<44:41,  1.96s/it, lr: 1.0e-04 loss: 8.360e-02]hash_cache_v1:  54%|#####4    | 1631/3000 [1:25:56<44:41,  1.96s/it, lr: 1.0e-04 loss: 8.360e-02]hash_cache_v1:  54%|#####4    | 1632/3000 [1:25:56<45:31,  2.00s/it, lr: 1.0e-04 loss: 8.360e-02]hash_cache_v1:  54%|#####4    | 1632/3000 [1:25:56<45:31,  2.00s/it, lr: 1.0e-04 loss: 8.360e-02]hash_cache_v1:  54%|#####4    | 1632/3000 [1:26:00<45:31,  2.00s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  54%|#####4    | 1632/3000 [1:26:00<45:31,  2.00s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  54%|#####4    | 1633/3000 [1:26:00<59:12,  2.60s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  54%|#####4    | 1633/3000 [1:26:00<59:12,  2.60s/it, lr: 1.0e-04 loss: 1.287e-01]hash_cache_v1:  54%|#####4    | 1633/3000 [1:26:03<59:12,  2.60s/it, lr: 1.0e-04 loss: 8.720e-02]hash_cache_v1:  54%|#####4    | 1633/3000 [1:26:03<59:12,  2.60s/it, lr: 1.0e-04 loss: 8.720e-02]hash_cache_v1:  54%|#####4    | 1634/3000 [1:26:03<57:54,  2.54s/it, lr: 1.0e-04 loss: 8.720e-02]hash_cache_v1:  54%|#####4    | 1634/3000 [1:26:03<57:54,  2.54s/it, lr: 1.0e-04 loss: 8.720e-02]hash_cache_v1:  54%|#####4    | 1634/3000 [1:26:07<57:54,  2.54s/it, lr: 1.0e-04 loss: 4.242e-02]hash_cache_v1:  54%|#####4    | 1634/3000 [1:26:07<57:54,  2.54s/it, lr: 1.0e-04 loss: 4.242e-02]hash_cache_v1:  55%|#####4    | 1635/3000 [1:26:07<1:08:24,  3.01s/it, lr: 1.0e-04 loss: 4.242e-02]hash_cache_v1:  55%|#####4    | 1635/3000 [1:26:07<1:08:24,  3.01s/it, lr: 1.0e-04 loss: 4.242e-02]hash_cache_v1:  55%|#####4    | 1635/3000 [1:26:09<1:08:24,  3.01s/it, lr: 1.0e-04 loss: 4.034e-02]hash_cache_v1:  55%|#####4    | 1635/3000 [1:26:09<1:08:24,  3.01s/it, lr: 1.0e-04 loss: 4.034e-02]hash_cache_v1:  55%|#####4    | 1636/3000 [1:26:09<1:02:33,  2.75s/it, lr: 1.0e-04 loss: 4.034e-02]hash_cache_v1:  55%|#####4    | 1636/3000 [1:26:09<1:02:33,  2.75s/it, lr: 1.0e-04 loss: 4.034e-02]hash_cache_v1:  55%|#####4    | 1636/3000 [1:26:12<1:02:33,  2.75s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  55%|#####4    | 1636/3000 [1:26:12<1:02:33,  2.75s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  55%|#####4    | 1637/3000 [1:26:12<1:04:46,  2.85s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  55%|#####4    | 1637/3000 [1:26:12<1:04:46,  2.85s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  55%|#####4    | 1637/3000 [1:26:16<1:04:46,  2.85s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  55%|#####4    | 1637/3000 [1:26:16<1:04:46,  2.85s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  55%|#####4    | 1638/3000 [1:26:16<1:13:44,  3.25s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  55%|#####4    | 1638/3000 [1:26:16<1:13:44,  3.25s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  55%|#####4    | 1638/3000 [1:26:19<1:13:44,  3.25s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  55%|#####4    | 1638/3000 [1:26:19<1:13:44,  3.25s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  55%|#####4    | 1639/3000 [1:26:19<1:11:12,  3.14s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  55%|#####4    | 1639/3000 [1:26:19<1:11:12,  3.14s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  55%|#####4    | 1639/3000 [1:26:21<1:11:12,  3.14s/it, lr: 1.0e-04 loss: 9.286e-02]hash_cache_v1:  55%|#####4    | 1639/3000 [1:26:21<1:11:12,  3.14s/it, lr: 1.0e-04 loss: 9.286e-02]hash_cache_v1:  55%|#####4    | 1640/3000 [1:26:24<1:11:09,  3.14s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  55%|#####4    | 1640/3000 [1:26:24<1:11:09,  3.14s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  55%|#####4    | 1641/3000 [1:26:24<54:30,  2.41s/it, lr: 1.0e-04 loss: 1.317e-01]  hash_cache_v1:  55%|#####4    | 1641/3000 [1:26:24<54:30,  2.41s/it, lr: 1.0e-04 loss: 1.317e-01]  hash_cache_v1:  55%|#####4    | 1641/3000 [1:26:27<54:30,  2.41s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  55%|#####4    | 1641/3000 [1:26:27<54:30,  2.41s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  55%|#####4    | 1642/3000 [1:26:27<52:48,  2.33s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  55%|#####4    | 1642/3000 [1:26:27<52:48,  2.33s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  55%|#####4    | 1642/3000 [1:26:31<52:48,  2.33s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  55%|#####4    | 1642/3000 [1:26:31<52:48,  2.33s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  55%|#####4    | 1643/3000 [1:26:31<1:04:31,  2.85s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  55%|#####4    | 1643/3000 [1:26:31<1:04:31,  2.85s/it, lr: 1.0e-04 loss: 9.790e-02]hash_cache_v1:  55%|#####4    | 1643/3000 [1:26:34<1:04:31,  2.85s/it, lr: 1.0e-04 loss: 3.615e-02]hash_cache_v1:  55%|#####4    | 1643/3000 [1:26:34<1:04:31,  2.85s/it, lr: 1.0e-04 loss: 3.615e-02]hash_cache_v1:  55%|#####4    | 1644/3000 [1:26:34<1:04:40,  2.86s/it, lr: 1.0e-04 loss: 3.615e-02]hash_cache_v1:  55%|#####4    | 1644/3000 [1:26:34<1:04:40,  2.86s/it, lr: 1.0e-04 loss: 3.615e-02]hash_cache_v1:  55%|#####4    | 1644/3000 [1:26:38<1:04:40,  2.86s/it, lr: 1.0e-04 loss: 8.305e-02]hash_cache_v1:  55%|#####4    | 1644/3000 [1:26:38<1:04:40,  2.86s/it, lr: 1.0e-04 loss: 8.305e-02]hash_cache_v1:  55%|#####4    | 1645/3000 [1:26:38<1:14:49,  3.31s/it, lr: 1.0e-04 loss: 8.305e-02]hash_cache_v1:  55%|#####4    | 1645/3000 [1:26:38<1:14:49,  3.31s/it, lr: 1.0e-04 loss: 8.305e-02]hash_cache_v1:  55%|#####4    | 1645/3000 [1:26:42<1:14:49,  3.31s/it, lr: 1.0e-04 loss: 8.957e-02]hash_cache_v1:  55%|#####4    | 1645/3000 [1:26:42<1:14:49,  3.31s/it, lr: 1.0e-04 loss: 8.957e-02]hash_cache_v1:  55%|#####4    | 1646/3000 [1:26:42<1:21:03,  3.59s/it, lr: 1.0e-04 loss: 8.957e-02]hash_cache_v1:  55%|#####4    | 1646/3000 [1:26:42<1:21:03,  3.59s/it, lr: 1.0e-04 loss: 8.957e-02]hash_cache_v1:  55%|#####4    | 1646/3000 [1:26:45<1:21:03,  3.59s/it, lr: 1.0e-04 loss: 8.254e-02]hash_cache_v1:  55%|#####4    | 1646/3000 [1:26:45<1:21:03,  3.59s/it, lr: 1.0e-04 loss: 8.254e-02]hash_cache_v1:  55%|#####4    | 1647/3000 [1:26:45<1:16:05,  3.37s/it, lr: 1.0e-04 loss: 8.254e-02]hash_cache_v1:  55%|#####4    | 1647/3000 [1:26:45<1:16:05,  3.37s/it, lr: 1.0e-04 loss: 8.254e-02]hash_cache_v1:  55%|#####4    | 1647/3000 [1:26:50<1:16:05,  3.37s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  55%|#####4    | 1647/3000 [1:26:50<1:16:05,  3.37s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  55%|#####4    | 1648/3000 [1:26:50<1:23:35,  3.71s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  55%|#####4    | 1648/3000 [1:26:50<1:23:35,  3.71s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  55%|#####4    | 1648/3000 [1:26:53<1:23:35,  3.71s/it, lr: 1.0e-04 loss: 1.557e-01]hash_cache_v1:  55%|#####4    | 1648/3000 [1:26:53<1:23:35,  3.71s/it, lr: 1.0e-04 loss: 1.557e-01]hash_cache_v1:  55%|#####4    | 1649/3000 [1:26:53<1:17:55,  3.46s/it, lr: 1.0e-04 loss: 1.557e-01]hash_cache_v1:  55%|#####4    | 1649/3000 [1:26:53<1:17:55,  3.46s/it, lr: 1.0e-04 loss: 1.557e-01]hash_cache_v1:  55%|#####4    | 1649/3000 [1:26:57<1:17:55,  3.46s/it, lr: 1.0e-04 loss: 1.290e-01]hash_cache_v1:  55%|#####4    | 1649/3000 [1:26:57<1:17:55,  3.46s/it, lr: 1.0e-04 loss: 1.290e-01]hash_cache_v1:  55%|#####5    | 1650/3000 [1:27:00<1:17:52,  3.46s/it, lr: 1.0e-04 loss: 1.250e-01]hash_cache_v1:  55%|#####5    | 1650/3000 [1:27:00<1:17:52,  3.46s/it, lr: 1.0e-04 loss: 1.250e-01]hash_cache_v1:  55%|#####5    | 1651/3000 [1:27:00<56:57,  2.53s/it, lr: 1.0e-04 loss: 1.250e-01]  hash_cache_v1:  55%|#####5    | 1651/3000 [1:27:00<56:57,  2.53s/it, lr: 1.0e-04 loss: 1.250e-01]  hash_cache_v1:  55%|#####5    | 1651/3000 [1:27:04<56:57,  2.53s/it, lr: 1.0e-04 loss: 1.509e-01]hash_cache_v1:  55%|#####5    | 1651/3000 [1:27:04<56:57,  2.53s/it, lr: 1.0e-04 loss: 1.509e-01]hash_cache_v1:  55%|#####5    | 1652/3000 [1:27:04<1:07:54,  3.02s/it, lr: 1.0e-04 loss: 1.509e-01]hash_cache_v1:  55%|#####5    | 1652/3000 [1:27:04<1:07:54,  3.02s/it, lr: 1.0e-04 loss: 1.509e-01]hash_cache_v1:  55%|#####5    | 1652/3000 [1:27:07<1:07:54,  3.02s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  55%|#####5    | 1652/3000 [1:27:07<1:07:54,  3.02s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  55%|#####5    | 1653/3000 [1:27:07<1:02:33,  2.79s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  55%|#####5    | 1653/3000 [1:27:07<1:02:33,  2.79s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  55%|#####5    | 1653/3000 [1:27:11<1:02:33,  2.79s/it, lr: 1.0e-04 loss: 6.972e-02]hash_cache_v1:  55%|#####5    | 1653/3000 [1:27:11<1:02:33,  2.79s/it, lr: 1.0e-04 loss: 6.972e-02]hash_cache_v1:  55%|#####5    | 1654/3000 [1:27:11<1:11:52,  3.20s/it, lr: 1.0e-04 loss: 6.972e-02]hash_cache_v1:  55%|#####5    | 1654/3000 [1:27:11<1:11:52,  3.20s/it, lr: 1.0e-04 loss: 6.972e-02]hash_cache_v1:  55%|#####5    | 1654/3000 [1:27:14<1:11:52,  3.20s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  55%|#####5    | 1654/3000 [1:27:14<1:11:52,  3.20s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  55%|#####5    | 1655/3000 [1:27:14<1:10:53,  3.16s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  55%|#####5    | 1655/3000 [1:27:14<1:10:53,  3.16s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  55%|#####5    | 1655/3000 [1:27:16<1:10:53,  3.16s/it, lr: 1.0e-04 loss: 1.273e-01]hash_cache_v1:  55%|#####5    | 1655/3000 [1:27:16<1:10:53,  3.16s/it, lr: 1.0e-04 loss: 1.273e-01]hash_cache_v1:  55%|#####5    | 1656/3000 [1:27:16<1:04:07,  2.86s/it, lr: 1.0e-04 loss: 1.273e-01]hash_cache_v1:  55%|#####5    | 1656/3000 [1:27:16<1:04:07,  2.86s/it, lr: 1.0e-04 loss: 1.273e-01]hash_cache_v1:  55%|#####5    | 1656/3000 [1:27:18<1:04:07,  2.86s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  55%|#####5    | 1656/3000 [1:27:18<1:04:07,  2.86s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  55%|#####5    | 1657/3000 [1:27:18<59:05,  2.64s/it, lr: 1.0e-04 loss: 1.280e-01]  hash_cache_v1:  55%|#####5    | 1657/3000 [1:27:18<59:05,  2.64s/it, lr: 1.0e-04 loss: 1.280e-01]  hash_cache_v1:  55%|#####5    | 1657/3000 [1:27:20<59:05,  2.64s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  55%|#####5    | 1657/3000 [1:27:20<59:05,  2.64s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  55%|#####5    | 1658/3000 [1:27:20<55:35,  2.49s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  55%|#####5    | 1658/3000 [1:27:20<55:35,  2.49s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  55%|#####5    | 1658/3000 [1:27:23<55:35,  2.49s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  55%|#####5    | 1658/3000 [1:27:23<55:35,  2.49s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  55%|#####5    | 1659/3000 [1:27:23<59:21,  2.66s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  55%|#####5    | 1659/3000 [1:27:23<59:21,  2.66s/it, lr: 1.0e-04 loss: 1.705e-01]hash_cache_v1:  55%|#####5    | 1659/3000 [1:27:26<59:21,  2.66s/it, lr: 1.0e-04 loss: 3.141e-02]hash_cache_v1:  55%|#####5    | 1659/3000 [1:27:26<59:21,  2.66s/it, lr: 1.0e-04 loss: 3.141e-02]hash_cache_v1:  55%|#####5    | 1660/3000 [1:27:30<59:18,  2.66s/it, lr: 1.0e-04 loss: 1.924e-01]hash_cache_v1:  55%|#####5    | 1660/3000 [1:27:30<59:18,  2.66s/it, lr: 1.0e-04 loss: 1.924e-01]hash_cache_v1:  55%|#####5    | 1661/3000 [1:27:30<54:20,  2.44s/it, lr: 1.0e-04 loss: 1.924e-01]hash_cache_v1:  55%|#####5    | 1661/3000 [1:27:30<54:20,  2.44s/it, lr: 1.0e-04 loss: 1.924e-01]hash_cache_v1:  55%|#####5    | 1661/3000 [1:27:33<54:20,  2.44s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  55%|#####5    | 1661/3000 [1:27:33<54:20,  2.44s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  55%|#####5    | 1662/3000 [1:27:33<56:39,  2.54s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  55%|#####5    | 1662/3000 [1:27:33<56:39,  2.54s/it, lr: 1.0e-04 loss: 1.608e-01]hash_cache_v1:  55%|#####5    | 1662/3000 [1:27:38<56:39,  2.54s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  55%|#####5    | 1662/3000 [1:27:38<56:39,  2.54s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  55%|#####5    | 1663/3000 [1:27:38<1:08:04,  3.06s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  55%|#####5    | 1663/3000 [1:27:38<1:08:04,  3.06s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  55%|#####5    | 1663/3000 [1:27:42<1:08:04,  3.06s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  55%|#####5    | 1663/3000 [1:27:42<1:08:04,  3.06s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  55%|#####5    | 1664/3000 [1:27:42<1:15:39,  3.40s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  55%|#####5    | 1664/3000 [1:27:42<1:15:39,  3.40s/it, lr: 1.0e-04 loss: 1.594e-01]hash_cache_v1:  55%|#####5    | 1664/3000 [1:27:47<1:15:39,  3.40s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  55%|#####5    | 1664/3000 [1:27:47<1:15:39,  3.40s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  56%|#####5    | 1665/3000 [1:27:47<1:21:19,  3.65s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  56%|#####5    | 1665/3000 [1:27:47<1:21:19,  3.65s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  56%|#####5    | 1665/3000 [1:27:50<1:21:19,  3.65s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  56%|#####5    | 1665/3000 [1:27:50<1:21:19,  3.65s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  56%|#####5    | 1666/3000 [1:27:50<1:17:30,  3.49s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  56%|#####5    | 1666/3000 [1:27:50<1:17:30,  3.49s/it, lr: 1.0e-04 loss: 1.558e-01]hash_cache_v1:  56%|#####5    | 1666/3000 [1:27:52<1:17:30,  3.49s/it, lr: 1.0e-04 loss: 1.827e-01]hash_cache_v1:  56%|#####5    | 1666/3000 [1:27:52<1:17:30,  3.49s/it, lr: 1.0e-04 loss: 1.827e-01]hash_cache_v1:  56%|#####5    | 1667/3000 [1:27:52<1:08:37,  3.09s/it, lr: 1.0e-04 loss: 1.827e-01]hash_cache_v1:  56%|#####5    | 1667/3000 [1:27:52<1:08:37,  3.09s/it, lr: 1.0e-04 loss: 1.827e-01]hash_cache_v1:  56%|#####5    | 1667/3000 [1:27:55<1:08:37,  3.09s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  56%|#####5    | 1667/3000 [1:27:55<1:08:37,  3.09s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  56%|#####5    | 1668/3000 [1:27:55<1:07:12,  3.03s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  56%|#####5    | 1668/3000 [1:27:55<1:07:12,  3.03s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  56%|#####5    | 1668/3000 [1:27:57<1:07:12,  3.03s/it, lr: 1.0e-04 loss: 5.797e-02]hash_cache_v1:  56%|#####5    | 1668/3000 [1:27:57<1:07:12,  3.03s/it, lr: 1.0e-04 loss: 5.797e-02]hash_cache_v1:  56%|#####5    | 1669/3000 [1:27:57<1:06:11,  2.98s/it, lr: 1.0e-04 loss: 5.797e-02]hash_cache_v1:  56%|#####5    | 1669/3000 [1:27:57<1:06:11,  2.98s/it, lr: 1.0e-04 loss: 5.797e-02]hash_cache_v1:  56%|#####5    | 1669/3000 [1:28:01<1:06:11,  2.98s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  56%|#####5    | 1669/3000 [1:28:01<1:06:11,  2.98s/it, lr: 1.0e-04 loss: 1.611e-01]hash_cache_v1:  56%|#####5    | 1670/3000 [1:28:03<1:06:08,  2.98s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  56%|#####5    | 1670/3000 [1:28:03<1:06:08,  2.98s/it, lr: 1.0e-04 loss: 1.619e-01]hash_cache_v1:  56%|#####5    | 1671/3000 [1:28:03<46:33,  2.10s/it, lr: 1.0e-04 loss: 1.619e-01]  hash_cache_v1:  56%|#####5    | 1671/3000 [1:28:03<46:33,  2.10s/it, lr: 1.0e-04 loss: 1.619e-01]  hash_cache_v1:  56%|#####5    | 1671/3000 [1:28:05<46:33,  2.10s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  56%|#####5    | 1671/3000 [1:28:05<46:33,  2.10s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  56%|#####5    | 1672/3000 [1:28:05<50:34,  2.28s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  56%|#####5    | 1672/3000 [1:28:05<50:34,  2.28s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  56%|#####5    | 1672/3000 [1:28:08<50:34,  2.28s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  56%|#####5    | 1672/3000 [1:28:08<50:34,  2.28s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  56%|#####5    | 1673/3000 [1:28:08<49:31,  2.24s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  56%|#####5    | 1673/3000 [1:28:08<49:31,  2.24s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  56%|#####5    | 1673/3000 [1:28:11<49:31,  2.24s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  56%|#####5    | 1673/3000 [1:28:11<49:31,  2.24s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  56%|#####5    | 1674/3000 [1:28:11<54:50,  2.48s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  56%|#####5    | 1674/3000 [1:28:11<54:50,  2.48s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  56%|#####5    | 1674/3000 [1:28:14<54:50,  2.48s/it, lr: 1.0e-04 loss: 9.303e-02]hash_cache_v1:  56%|#####5    | 1674/3000 [1:28:14<54:50,  2.48s/it, lr: 1.0e-04 loss: 9.303e-02]hash_cache_v1:  56%|#####5    | 1675/3000 [1:28:14<57:00,  2.58s/it, lr: 1.0e-04 loss: 9.303e-02]hash_cache_v1:  56%|#####5    | 1675/3000 [1:28:14<57:00,  2.58s/it, lr: 1.0e-04 loss: 9.303e-02]hash_cache_v1:  56%|#####5    | 1675/3000 [1:28:16<57:00,  2.58s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  56%|#####5    | 1675/3000 [1:28:16<57:00,  2.58s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  56%|#####5    | 1676/3000 [1:28:16<53:59,  2.45s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  56%|#####5    | 1676/3000 [1:28:16<53:59,  2.45s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  56%|#####5    | 1676/3000 [1:28:19<53:59,  2.45s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  56%|#####5    | 1676/3000 [1:28:19<53:59,  2.45s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  56%|#####5    | 1677/3000 [1:28:19<58:04,  2.63s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  56%|#####5    | 1677/3000 [1:28:19<58:04,  2.63s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  56%|#####5    | 1677/3000 [1:28:23<58:04,  2.63s/it, lr: 1.0e-04 loss: 8.774e-02]hash_cache_v1:  56%|#####5    | 1677/3000 [1:28:23<58:04,  2.63s/it, lr: 1.0e-04 loss: 8.774e-02]hash_cache_v1:  56%|#####5    | 1678/3000 [1:28:23<1:08:53,  3.13s/it, lr: 1.0e-04 loss: 8.774e-02]hash_cache_v1:  56%|#####5    | 1678/3000 [1:28:23<1:08:53,  3.13s/it, lr: 1.0e-04 loss: 8.774e-02]hash_cache_v1:  56%|#####5    | 1678/3000 [1:28:27<1:08:53,  3.13s/it, lr: 1.0e-04 loss: 9.742e-02]hash_cache_v1:  56%|#####5    | 1678/3000 [1:28:27<1:08:53,  3.13s/it, lr: 1.0e-04 loss: 9.742e-02]hash_cache_v1:  56%|#####5    | 1679/3000 [1:28:27<1:16:40,  3.48s/it, lr: 1.0e-04 loss: 9.742e-02]hash_cache_v1:  56%|#####5    | 1679/3000 [1:28:27<1:16:40,  3.48s/it, lr: 1.0e-04 loss: 9.742e-02]hash_cache_v1:  56%|#####5    | 1679/3000 [1:28:30<1:16:40,  3.48s/it, lr: 1.0e-04 loss: 7.368e-02]hash_cache_v1:  56%|#####5    | 1679/3000 [1:28:30<1:16:40,  3.48s/it, lr: 1.0e-04 loss: 7.368e-02]hash_cache_v1:  56%|#####6    | 1680/3000 [1:28:34<1:16:37,  3.48s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  56%|#####6    | 1680/3000 [1:28:34<1:16:37,  3.48s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  56%|#####6    | 1681/3000 [1:28:34<1:04:14,  2.92s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  56%|#####6    | 1681/3000 [1:28:34<1:04:14,  2.92s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  56%|#####6    | 1681/3000 [1:28:36<1:04:14,  2.92s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  56%|#####6    | 1681/3000 [1:28:36<1:04:14,  2.92s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  56%|#####6    | 1682/3000 [1:28:36<59:46,  2.72s/it, lr: 1.0e-04 loss: 1.652e-01]  hash_cache_v1:  56%|#####6    | 1682/3000 [1:28:36<59:46,  2.72s/it, lr: 1.0e-04 loss: 1.652e-01]  hash_cache_v1:  56%|#####6    | 1682/3000 [1:28:40<59:46,  2.72s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  56%|#####6    | 1682/3000 [1:28:40<59:46,  2.72s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  56%|#####6    | 1683/3000 [1:28:40<1:08:10,  3.11s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  56%|#####6    | 1683/3000 [1:28:40<1:08:10,  3.11s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  56%|#####6    | 1683/3000 [1:28:45<1:08:10,  3.11s/it, lr: 1.0e-04 loss: 1.767e-01]hash_cache_v1:  56%|#####6    | 1683/3000 [1:28:45<1:08:10,  3.11s/it, lr: 1.0e-04 loss: 1.767e-01]hash_cache_v1:  56%|#####6    | 1684/3000 [1:28:45<1:16:30,  3.49s/it, lr: 1.0e-04 loss: 1.767e-01]hash_cache_v1:  56%|#####6    | 1684/3000 [1:28:45<1:16:30,  3.49s/it, lr: 1.0e-04 loss: 1.767e-01]hash_cache_v1:  56%|#####6    | 1684/3000 [1:28:47<1:16:30,  3.49s/it, lr: 1.0e-04 loss: 1.832e-02]hash_cache_v1:  56%|#####6    | 1684/3000 [1:28:47<1:16:30,  3.49s/it, lr: 1.0e-04 loss: 1.832e-02]hash_cache_v1:  56%|#####6    | 1685/3000 [1:28:47<1:07:50,  3.10s/it, lr: 1.0e-04 loss: 1.832e-02]hash_cache_v1:  56%|#####6    | 1685/3000 [1:28:47<1:07:50,  3.10s/it, lr: 1.0e-04 loss: 1.832e-02]hash_cache_v1:  56%|#####6    | 1685/3000 [1:28:51<1:07:50,  3.10s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  56%|#####6    | 1685/3000 [1:28:51<1:07:50,  3.10s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  56%|#####6    | 1686/3000 [1:28:51<1:15:40,  3.46s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  56%|#####6    | 1686/3000 [1:28:51<1:15:40,  3.46s/it, lr: 1.0e-04 loss: 1.097e-01]hash_cache_v1:  56%|#####6    | 1686/3000 [1:28:53<1:15:40,  3.46s/it, lr: 1.0e-04 loss: 4.936e-02]hash_cache_v1:  56%|#####6    | 1686/3000 [1:28:53<1:15:40,  3.46s/it, lr: 1.0e-04 loss: 4.936e-02]hash_cache_v1:  56%|#####6    | 1687/3000 [1:28:53<1:06:55,  3.06s/it, lr: 1.0e-04 loss: 4.936e-02]hash_cache_v1:  56%|#####6    | 1687/3000 [1:28:53<1:06:55,  3.06s/it, lr: 1.0e-04 loss: 4.936e-02]hash_cache_v1:  56%|#####6    | 1687/3000 [1:28:56<1:06:55,  3.06s/it, lr: 1.0e-04 loss: 4.916e-02]hash_cache_v1:  56%|#####6    | 1687/3000 [1:28:56<1:06:55,  3.06s/it, lr: 1.0e-04 loss: 4.916e-02]hash_cache_v1:  56%|#####6    | 1688/3000 [1:28:56<1:06:48,  3.06s/it, lr: 1.0e-04 loss: 4.916e-02]hash_cache_v1:  56%|#####6    | 1688/3000 [1:28:56<1:06:48,  3.06s/it, lr: 1.0e-04 loss: 4.916e-02]hash_cache_v1:  56%|#####6    | 1688/3000 [1:28:59<1:06:48,  3.06s/it, lr: 1.0e-04 loss: 1.696e-01]hash_cache_v1:  56%|#####6    | 1688/3000 [1:28:59<1:06:48,  3.06s/it, lr: 1.0e-04 loss: 1.696e-01]hash_cache_v1:  56%|#####6    | 1689/3000 [1:28:59<1:00:30,  2.77s/it, lr: 1.0e-04 loss: 1.696e-01]hash_cache_v1:  56%|#####6    | 1689/3000 [1:28:59<1:00:30,  2.77s/it, lr: 1.0e-04 loss: 1.696e-01]hash_cache_v1:  56%|#####6    | 1689/3000 [1:29:01<1:00:30,  2.77s/it, lr: 1.0e-04 loss: 8.126e-02]hash_cache_v1:  56%|#####6    | 1689/3000 [1:29:01<1:00:30,  2.77s/it, lr: 1.0e-04 loss: 8.126e-02]hash_cache_v1:  56%|#####6    | 1690/3000 [1:29:04<1:00:27,  2.77s/it, lr: 1.0e-04 loss: 1.191e-01]hash_cache_v1:  56%|#####6    | 1690/3000 [1:29:04<1:00:27,  2.77s/it, lr: 1.0e-04 loss: 1.191e-01]hash_cache_v1:  56%|#####6    | 1691/3000 [1:29:04<46:55,  2.15s/it, lr: 1.0e-04 loss: 1.191e-01]  hash_cache_v1:  56%|#####6    | 1691/3000 [1:29:04<46:55,  2.15s/it, lr: 1.0e-04 loss: 1.191e-01]  hash_cache_v1:  56%|#####6    | 1691/3000 [1:29:09<46:55,  2.15s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  56%|#####6    | 1691/3000 [1:29:09<46:55,  2.15s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  56%|#####6    | 1692/3000 [1:29:09<59:17,  2.72s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  56%|#####6    | 1692/3000 [1:29:09<59:17,  2.72s/it, lr: 1.0e-04 loss: 1.174e-01]hash_cache_v1:  56%|#####6    | 1692/3000 [1:29:11<59:17,  2.72s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  56%|#####6    | 1692/3000 [1:29:11<59:17,  2.72s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  56%|#####6    | 1693/3000 [1:29:11<55:31,  2.55s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  56%|#####6    | 1693/3000 [1:29:11<55:31,  2.55s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  56%|#####6    | 1693/3000 [1:29:13<55:31,  2.55s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  56%|#####6    | 1693/3000 [1:29:13<55:31,  2.55s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  56%|#####6    | 1694/3000 [1:29:13<52:42,  2.42s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  56%|#####6    | 1694/3000 [1:29:13<52:42,  2.42s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  56%|#####6    | 1694/3000 [1:29:17<52:42,  2.42s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  56%|#####6    | 1694/3000 [1:29:17<52:42,  2.42s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  56%|#####6    | 1695/3000 [1:29:17<1:04:57,  2.99s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  56%|#####6    | 1695/3000 [1:29:17<1:04:57,  2.99s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  56%|#####6    | 1695/3000 [1:29:22<1:04:57,  2.99s/it, lr: 1.0e-04 loss: 7.505e-02]hash_cache_v1:  56%|#####6    | 1695/3000 [1:29:22<1:04:57,  2.99s/it, lr: 1.0e-04 loss: 7.505e-02]hash_cache_v1:  57%|#####6    | 1696/3000 [1:29:22<1:12:52,  3.35s/it, lr: 1.0e-04 loss: 7.505e-02]hash_cache_v1:  57%|#####6    | 1696/3000 [1:29:22<1:12:52,  3.35s/it, lr: 1.0e-04 loss: 7.505e-02]hash_cache_v1:  57%|#####6    | 1696/3000 [1:29:24<1:12:52,  3.35s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  57%|#####6    | 1696/3000 [1:29:24<1:12:52,  3.35s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  57%|#####6    | 1697/3000 [1:29:24<1:09:47,  3.21s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  57%|#####6    | 1697/3000 [1:29:24<1:09:47,  3.21s/it, lr: 1.0e-04 loss: 1.572e-01]hash_cache_v1:  57%|#####6    | 1697/3000 [1:29:29<1:09:47,  3.21s/it, lr: 1.0e-04 loss: 9.736e-02]hash_cache_v1:  57%|#####6    | 1697/3000 [1:29:29<1:09:47,  3.21s/it, lr: 1.0e-04 loss: 9.736e-02]hash_cache_v1:  57%|#####6    | 1698/3000 [1:29:29<1:16:44,  3.54s/it, lr: 1.0e-04 loss: 9.736e-02]hash_cache_v1:  57%|#####6    | 1698/3000 [1:29:29<1:16:44,  3.54s/it, lr: 1.0e-04 loss: 9.736e-02]hash_cache_v1:  57%|#####6    | 1698/3000 [1:29:33<1:16:44,  3.54s/it, lr: 1.0e-04 loss: 1.610e-01]hash_cache_v1:  57%|#####6    | 1698/3000 [1:29:33<1:16:44,  3.54s/it, lr: 1.0e-04 loss: 1.610e-01]hash_cache_v1:  57%|#####6    | 1699/3000 [1:29:33<1:22:52,  3.82s/it, lr: 1.0e-04 loss: 1.610e-01]hash_cache_v1:  57%|#####6    | 1699/3000 [1:29:33<1:22:52,  3.82s/it, lr: 1.0e-04 loss: 1.610e-01]hash_cache_v1:  57%|#####6    | 1699/3000 [1:29:35<1:22:52,  3.82s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  57%|#####6    | 1699/3000 [1:29:35<1:22:52,  3.82s/it, lr: 1.0e-04 loss: 1.799e-01]hash_cache_v1:  57%|#####6    | 1700/3000 [1:29:38<1:22:48,  3.82s/it, lr: 1.0e-04 loss: 1.603e-01]hash_cache_v1:  57%|#####6    | 1700/3000 [1:29:38<1:22:48,  3.82s/it, lr: 1.0e-04 loss: 1.603e-01]hash_cache_v1:  57%|#####6    | 1701/3000 [1:29:38<59:12,  2.73s/it, lr: 1.0e-04 loss: 1.603e-01]  hash_cache_v1:  57%|#####6    | 1701/3000 [1:29:38<59:12,  2.73s/it, lr: 1.0e-04 loss: 1.603e-01]  hash_cache_v1:  57%|#####6    | 1701/3000 [1:29:41<59:12,  2.73s/it, lr: 1.0e-04 loss: 1.726e-02]hash_cache_v1:  57%|#####6    | 1701/3000 [1:29:41<59:12,  2.73s/it, lr: 1.0e-04 loss: 1.726e-02]hash_cache_v1:  57%|#####6    | 1702/3000 [1:29:41<57:22,  2.65s/it, lr: 1.0e-04 loss: 1.726e-02]hash_cache_v1:  57%|#####6    | 1702/3000 [1:29:41<57:22,  2.65s/it, lr: 1.0e-04 loss: 1.726e-02]hash_cache_v1:  57%|#####6    | 1702/3000 [1:29:43<57:22,  2.65s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  57%|#####6    | 1702/3000 [1:29:43<57:22,  2.65s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  57%|#####6    | 1703/3000 [1:29:43<58:30,  2.71s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  57%|#####6    | 1703/3000 [1:29:43<58:30,  2.71s/it, lr: 1.0e-04 loss: 1.717e-01]hash_cache_v1:  57%|#####6    | 1703/3000 [1:29:48<58:30,  2.71s/it, lr: 1.0e-04 loss: 1.203e-01]hash_cache_v1:  57%|#####6    | 1703/3000 [1:29:48<58:30,  2.71s/it, lr: 1.0e-04 loss: 1.203e-01]hash_cache_v1:  57%|#####6    | 1704/3000 [1:29:48<1:07:42,  3.13s/it, lr: 1.0e-04 loss: 1.203e-01]hash_cache_v1:  57%|#####6    | 1704/3000 [1:29:48<1:07:42,  3.13s/it, lr: 1.0e-04 loss: 1.203e-01]hash_cache_v1:  57%|#####6    | 1704/3000 [1:29:50<1:07:42,  3.13s/it, lr: 1.0e-04 loss: 8.167e-02]hash_cache_v1:  57%|#####6    | 1704/3000 [1:29:50<1:07:42,  3.13s/it, lr: 1.0e-04 loss: 8.167e-02]hash_cache_v1:  57%|#####6    | 1705/3000 [1:29:50<1:01:26,  2.85s/it, lr: 1.0e-04 loss: 8.167e-02]hash_cache_v1:  57%|#####6    | 1705/3000 [1:29:50<1:01:26,  2.85s/it, lr: 1.0e-04 loss: 8.167e-02]hash_cache_v1:  57%|#####6    | 1705/3000 [1:29:52<1:01:26,  2.85s/it, lr: 1.0e-04 loss: 2.206e-01]hash_cache_v1:  57%|#####6    | 1705/3000 [1:29:52<1:01:26,  2.85s/it, lr: 1.0e-04 loss: 2.206e-01]hash_cache_v1:  57%|#####6    | 1706/3000 [1:29:52<58:36,  2.72s/it, lr: 1.0e-04 loss: 2.206e-01]  hash_cache_v1:  57%|#####6    | 1706/3000 [1:29:52<58:36,  2.72s/it, lr: 1.0e-04 loss: 2.206e-01]  hash_cache_v1:  57%|#####6    | 1706/3000 [1:29:57<58:36,  2.72s/it, lr: 1.0e-04 loss: 6.508e-02]hash_cache_v1:  57%|#####6    | 1706/3000 [1:29:57<58:36,  2.72s/it, lr: 1.0e-04 loss: 6.508e-02]hash_cache_v1:  57%|#####6    | 1707/3000 [1:29:57<1:08:25,  3.18s/it, lr: 1.0e-04 loss: 6.508e-02]hash_cache_v1:  57%|#####6    | 1707/3000 [1:29:57<1:08:25,  3.18s/it, lr: 1.0e-04 loss: 6.508e-02]hash_cache_v1:  57%|#####6    | 1707/3000 [1:29:59<1:08:25,  3.18s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  57%|#####6    | 1707/3000 [1:29:59<1:08:25,  3.18s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  57%|#####6    | 1708/3000 [1:29:59<1:06:30,  3.09s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  57%|#####6    | 1708/3000 [1:29:59<1:06:30,  3.09s/it, lr: 1.0e-04 loss: 1.272e-01]hash_cache_v1:  57%|#####6    | 1708/3000 [1:30:02<1:06:30,  3.09s/it, lr: 1.0e-04 loss: 2.441e-01]hash_cache_v1:  57%|#####6    | 1708/3000 [1:30:02<1:06:30,  3.09s/it, lr: 1.0e-04 loss: 2.441e-01]hash_cache_v1:  57%|#####6    | 1709/3000 [1:30:02<1:01:56,  2.88s/it, lr: 1.0e-04 loss: 2.441e-01]hash_cache_v1:  57%|#####6    | 1709/3000 [1:30:02<1:01:56,  2.88s/it, lr: 1.0e-04 loss: 2.441e-01]hash_cache_v1:  57%|#####6    | 1709/3000 [1:30:05<1:01:56,  2.88s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  57%|#####6    | 1709/3000 [1:30:05<1:01:56,  2.88s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  57%|#####6    | 1710/3000 [1:30:09<1:01:53,  2.88s/it, lr: 1.0e-04 loss: 4.779e-02]hash_cache_v1:  57%|#####6    | 1710/3000 [1:30:09<1:01:53,  2.88s/it, lr: 1.0e-04 loss: 4.779e-02]hash_cache_v1:  57%|#####7    | 1711/3000 [1:30:09<54:47,  2.55s/it, lr: 1.0e-04 loss: 4.779e-02]  hash_cache_v1:  57%|#####7    | 1711/3000 [1:30:09<54:47,  2.55s/it, lr: 1.0e-04 loss: 4.779e-02]  hash_cache_v1:  57%|#####7    | 1711/3000 [1:30:12<54:47,  2.55s/it, lr: 1.0e-04 loss: 9.133e-02]hash_cache_v1:  57%|#####7    | 1711/3000 [1:30:12<54:47,  2.55s/it, lr: 1.0e-04 loss: 9.133e-02]hash_cache_v1:  57%|#####7    | 1712/3000 [1:30:12<56:26,  2.63s/it, lr: 1.0e-04 loss: 9.133e-02]hash_cache_v1:  57%|#####7    | 1712/3000 [1:30:12<56:26,  2.63s/it, lr: 1.0e-04 loss: 9.133e-02]hash_cache_v1:  57%|#####7    | 1712/3000 [1:30:15<56:26,  2.63s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  57%|#####7    | 1712/3000 [1:30:15<56:26,  2.63s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  57%|#####7    | 1713/3000 [1:30:15<59:01,  2.75s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  57%|#####7    | 1713/3000 [1:30:15<59:01,  2.75s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  57%|#####7    | 1713/3000 [1:30:18<59:01,  2.75s/it, lr: 1.0e-04 loss: 1.111e-01]hash_cache_v1:  57%|#####7    | 1713/3000 [1:30:18<59:01,  2.75s/it, lr: 1.0e-04 loss: 1.111e-01]hash_cache_v1:  57%|#####7    | 1714/3000 [1:30:18<59:46,  2.79s/it, lr: 1.0e-04 loss: 1.111e-01]hash_cache_v1:  57%|#####7    | 1714/3000 [1:30:18<59:46,  2.79s/it, lr: 1.0e-04 loss: 1.111e-01]hash_cache_v1:  57%|#####7    | 1714/3000 [1:30:20<59:46,  2.79s/it, lr: 1.0e-04 loss: 2.135e-01]hash_cache_v1:  57%|#####7    | 1714/3000 [1:30:20<59:46,  2.79s/it, lr: 1.0e-04 loss: 2.135e-01]hash_cache_v1:  57%|#####7    | 1715/3000 [1:30:20<55:41,  2.60s/it, lr: 1.0e-04 loss: 2.135e-01]hash_cache_v1:  57%|#####7    | 1715/3000 [1:30:20<55:41,  2.60s/it, lr: 1.0e-04 loss: 2.135e-01]hash_cache_v1:  57%|#####7    | 1715/3000 [1:30:23<55:41,  2.60s/it, lr: 1.0e-04 loss: 7.301e-02]hash_cache_v1:  57%|#####7    | 1715/3000 [1:30:23<55:41,  2.60s/it, lr: 1.0e-04 loss: 7.301e-02]hash_cache_v1:  57%|#####7    | 1716/3000 [1:30:23<58:28,  2.73s/it, lr: 1.0e-04 loss: 7.301e-02]hash_cache_v1:  57%|#####7    | 1716/3000 [1:30:23<58:28,  2.73s/it, lr: 1.0e-04 loss: 7.301e-02]hash_cache_v1:  57%|#####7    | 1716/3000 [1:30:25<58:28,  2.73s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  57%|#####7    | 1716/3000 [1:30:25<58:28,  2.73s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  57%|#####7    | 1717/3000 [1:30:25<54:34,  2.55s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  57%|#####7    | 1717/3000 [1:30:25<54:34,  2.55s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  57%|#####7    | 1717/3000 [1:30:30<54:34,  2.55s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  57%|#####7    | 1717/3000 [1:30:30<54:34,  2.55s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  57%|#####7    | 1718/3000 [1:30:30<1:04:59,  3.04s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  57%|#####7    | 1718/3000 [1:30:30<1:04:59,  3.04s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  57%|#####7    | 1718/3000 [1:30:32<1:04:59,  3.04s/it, lr: 1.0e-04 loss: 2.248e-01]hash_cache_v1:  57%|#####7    | 1718/3000 [1:30:32<1:04:59,  3.04s/it, lr: 1.0e-04 loss: 2.248e-01]hash_cache_v1:  57%|#####7    | 1719/3000 [1:30:32<59:02,  2.77s/it, lr: 1.0e-04 loss: 2.248e-01]  hash_cache_v1:  57%|#####7    | 1719/3000 [1:30:32<59:02,  2.77s/it, lr: 1.0e-04 loss: 2.248e-01]  hash_cache_v1:  57%|#####7    | 1719/3000 [1:30:34<59:02,  2.77s/it, lr: 1.0e-04 loss: 9.802e-02]hash_cache_v1:  57%|#####7    | 1719/3000 [1:30:34<59:02,  2.77s/it, lr: 1.0e-04 loss: 9.802e-02]hash_cache_v1:  57%|#####7    | 1720/3000 [1:30:38<58:59,  2.77s/it, lr: 1.0e-04 loss: 8.954e-02]hash_cache_v1:  57%|#####7    | 1720/3000 [1:30:38<58:59,  2.77s/it, lr: 1.0e-04 loss: 8.954e-02]hash_cache_v1:  57%|#####7    | 1721/3000 [1:30:38<52:58,  2.49s/it, lr: 1.0e-04 loss: 8.954e-02]hash_cache_v1:  57%|#####7    | 1721/3000 [1:30:38<52:58,  2.49s/it, lr: 1.0e-04 loss: 8.954e-02]hash_cache_v1:  57%|#####7    | 1721/3000 [1:30:43<52:58,  2.49s/it, lr: 1.0e-04 loss: 6.136e-02]hash_cache_v1:  57%|#####7    | 1721/3000 [1:30:43<52:58,  2.49s/it, lr: 1.0e-04 loss: 6.136e-02]hash_cache_v1:  57%|#####7    | 1722/3000 [1:30:43<1:02:33,  2.94s/it, lr: 1.0e-04 loss: 6.136e-02]hash_cache_v1:  57%|#####7    | 1722/3000 [1:30:43<1:02:33,  2.94s/it, lr: 1.0e-04 loss: 6.136e-02]hash_cache_v1:  57%|#####7    | 1722/3000 [1:30:46<1:02:33,  2.94s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  57%|#####7    | 1722/3000 [1:30:46<1:02:33,  2.94s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  57%|#####7    | 1723/3000 [1:30:46<1:02:07,  2.92s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  57%|#####7    | 1723/3000 [1:30:46<1:02:07,  2.92s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  57%|#####7    | 1723/3000 [1:30:48<1:02:07,  2.92s/it, lr: 1.0e-04 loss: 3.917e-02]hash_cache_v1:  57%|#####7    | 1723/3000 [1:30:48<1:02:07,  2.92s/it, lr: 1.0e-04 loss: 3.917e-02]hash_cache_v1:  57%|#####7    | 1724/3000 [1:30:48<58:57,  2.77s/it, lr: 1.0e-04 loss: 3.917e-02]  hash_cache_v1:  57%|#####7    | 1724/3000 [1:30:48<58:57,  2.77s/it, lr: 1.0e-04 loss: 3.917e-02]  hash_cache_v1:  57%|#####7    | 1724/3000 [1:30:51<58:57,  2.77s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  57%|#####7    | 1724/3000 [1:30:51<58:57,  2.77s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  57%|#####7    | 1725/3000 [1:30:51<59:27,  2.80s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  57%|#####7    | 1725/3000 [1:30:51<59:27,  2.80s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  57%|#####7    | 1725/3000 [1:30:55<59:27,  2.80s/it, lr: 1.0e-04 loss: 7.488e-02]hash_cache_v1:  57%|#####7    | 1725/3000 [1:30:55<59:27,  2.80s/it, lr: 1.0e-04 loss: 7.488e-02]hash_cache_v1:  58%|#####7    | 1726/3000 [1:30:55<1:08:33,  3.23s/it, lr: 1.0e-04 loss: 7.488e-02]hash_cache_v1:  58%|#####7    | 1726/3000 [1:30:55<1:08:33,  3.23s/it, lr: 1.0e-04 loss: 7.488e-02]hash_cache_v1:  58%|#####7    | 1726/3000 [1:30:58<1:08:33,  3.23s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  58%|#####7    | 1726/3000 [1:30:58<1:08:33,  3.23s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  58%|#####7    | 1727/3000 [1:30:58<1:07:35,  3.19s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  58%|#####7    | 1727/3000 [1:30:58<1:07:35,  3.19s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  58%|#####7    | 1727/3000 [1:31:01<1:07:35,  3.19s/it, lr: 1.0e-04 loss: 1.694e-01]hash_cache_v1:  58%|#####7    | 1727/3000 [1:31:01<1:07:35,  3.19s/it, lr: 1.0e-04 loss: 1.694e-01]hash_cache_v1:  58%|#####7    | 1728/3000 [1:31:01<1:05:35,  3.09s/it, lr: 1.0e-04 loss: 1.694e-01]hash_cache_v1:  58%|#####7    | 1728/3000 [1:31:01<1:05:35,  3.09s/it, lr: 1.0e-04 loss: 1.694e-01]hash_cache_v1:  58%|#####7    | 1728/3000 [1:31:04<1:05:35,  3.09s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  58%|#####7    | 1728/3000 [1:31:04<1:05:35,  3.09s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  58%|#####7    | 1729/3000 [1:31:04<1:04:13,  3.03s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  58%|#####7    | 1729/3000 [1:31:04<1:04:13,  3.03s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  58%|#####7    | 1729/3000 [1:31:08<1:04:13,  3.03s/it, lr: 1.0e-04 loss: 5.854e-02]hash_cache_v1:  58%|#####7    | 1729/3000 [1:31:08<1:04:13,  3.03s/it, lr: 1.0e-04 loss: 5.854e-02]hash_cache_v1:  58%|#####7    | 1730/3000 [1:31:11<1:04:09,  3.03s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  58%|#####7    | 1730/3000 [1:31:11<1:04:09,  3.03s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  58%|#####7    | 1731/3000 [1:31:11<49:39,  2.35s/it, lr: 1.0e-04 loss: 1.388e-01]  hash_cache_v1:  58%|#####7    | 1731/3000 [1:31:11<49:39,  2.35s/it, lr: 1.0e-04 loss: 1.388e-01]  hash_cache_v1:  58%|#####7    | 1731/3000 [1:31:14<49:39,  2.35s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  58%|#####7    | 1731/3000 [1:31:14<49:39,  2.35s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  58%|#####7    | 1732/3000 [1:31:14<52:11,  2.47s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  58%|#####7    | 1732/3000 [1:31:14<52:11,  2.47s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  58%|#####7    | 1732/3000 [1:31:17<52:11,  2.47s/it, lr: 1.0e-04 loss: 4.616e-02]hash_cache_v1:  58%|#####7    | 1732/3000 [1:31:17<52:11,  2.47s/it, lr: 1.0e-04 loss: 4.616e-02]hash_cache_v1:  58%|#####7    | 1733/3000 [1:31:17<54:12,  2.57s/it, lr: 1.0e-04 loss: 4.616e-02]hash_cache_v1:  58%|#####7    | 1733/3000 [1:31:17<54:12,  2.57s/it, lr: 1.0e-04 loss: 4.616e-02]hash_cache_v1:  58%|#####7    | 1733/3000 [1:31:20<54:12,  2.57s/it, lr: 1.0e-04 loss: 1.506e-01]hash_cache_v1:  58%|#####7    | 1733/3000 [1:31:20<54:12,  2.57s/it, lr: 1.0e-04 loss: 1.506e-01]hash_cache_v1:  58%|#####7    | 1734/3000 [1:31:20<55:56,  2.65s/it, lr: 1.0e-04 loss: 1.506e-01]hash_cache_v1:  58%|#####7    | 1734/3000 [1:31:20<55:56,  2.65s/it, lr: 1.0e-04 loss: 1.506e-01]hash_cache_v1:  58%|#####7    | 1734/3000 [1:31:24<55:56,  2.65s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  58%|#####7    | 1734/3000 [1:31:24<55:56,  2.65s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  58%|#####7    | 1735/3000 [1:31:24<1:06:51,  3.17s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  58%|#####7    | 1735/3000 [1:31:24<1:06:51,  3.17s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  58%|#####7    | 1735/3000 [1:31:27<1:06:51,  3.17s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  58%|#####7    | 1735/3000 [1:31:27<1:06:51,  3.17s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  58%|#####7    | 1736/3000 [1:31:27<1:04:57,  3.08s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  58%|#####7    | 1736/3000 [1:31:27<1:04:57,  3.08s/it, lr: 1.0e-04 loss: 1.588e-01]hash_cache_v1:  58%|#####7    | 1736/3000 [1:31:29<1:04:57,  3.08s/it, lr: 1.0e-04 loss: 1.398e-01]hash_cache_v1:  58%|#####7    | 1736/3000 [1:31:29<1:04:57,  3.08s/it, lr: 1.0e-04 loss: 1.398e-01]hash_cache_v1:  58%|#####7    | 1737/3000 [1:31:29<58:51,  2.80s/it, lr: 1.0e-04 loss: 1.398e-01]  hash_cache_v1:  58%|#####7    | 1737/3000 [1:31:29<58:51,  2.80s/it, lr: 1.0e-04 loss: 1.398e-01]  hash_cache_v1:  58%|#####7    | 1737/3000 [1:31:32<58:51,  2.80s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  58%|#####7    | 1737/3000 [1:31:32<58:51,  2.80s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  58%|#####7    | 1738/3000 [1:31:32<56:17,  2.68s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  58%|#####7    | 1738/3000 [1:31:32<56:17,  2.68s/it, lr: 1.0e-04 loss: 1.668e-01]hash_cache_v1:  58%|#####7    | 1738/3000 [1:31:35<56:17,  2.68s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  58%|#####7    | 1738/3000 [1:31:35<56:17,  2.68s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  58%|#####7    | 1739/3000 [1:31:35<57:13,  2.72s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  58%|#####7    | 1739/3000 [1:31:35<57:13,  2.72s/it, lr: 1.0e-04 loss: 1.218e-01]hash_cache_v1:  58%|#####7    | 1739/3000 [1:31:37<57:13,  2.72s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  58%|#####7    | 1739/3000 [1:31:37<57:13,  2.72s/it, lr: 1.0e-04 loss: 1.650e-01]hash_cache_v1:  58%|#####8    | 1740/3000 [1:31:39<57:11,  2.72s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  58%|#####8    | 1740/3000 [1:31:39<57:11,  2.72s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  58%|#####8    | 1741/3000 [1:31:39<41:05,  1.96s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  58%|#####8    | 1741/3000 [1:31:39<41:05,  1.96s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  58%|#####8    | 1741/3000 [1:31:42<41:05,  1.96s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  58%|#####8    | 1741/3000 [1:31:42<41:05,  1.96s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  58%|#####8    | 1742/3000 [1:31:42<46:37,  2.22s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  58%|#####8    | 1742/3000 [1:31:42<46:37,  2.22s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  58%|#####8    | 1742/3000 [1:31:45<46:37,  2.22s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  58%|#####8    | 1742/3000 [1:31:45<46:37,  2.22s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  58%|#####8    | 1743/3000 [1:31:45<50:15,  2.40s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  58%|#####8    | 1743/3000 [1:31:45<50:15,  2.40s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  58%|#####8    | 1743/3000 [1:31:49<50:15,  2.40s/it, lr: 1.0e-04 loss: 1.123e-01]hash_cache_v1:  58%|#####8    | 1743/3000 [1:31:49<50:15,  2.40s/it, lr: 1.0e-04 loss: 1.123e-01]hash_cache_v1:  58%|#####8    | 1744/3000 [1:31:49<1:01:12,  2.92s/it, lr: 1.0e-04 loss: 1.123e-01]hash_cache_v1:  58%|#####8    | 1744/3000 [1:31:49<1:01:12,  2.92s/it, lr: 1.0e-04 loss: 1.123e-01]hash_cache_v1:  58%|#####8    | 1744/3000 [1:31:52<1:01:12,  2.92s/it, lr: 1.0e-04 loss: 6.705e-02]hash_cache_v1:  58%|#####8    | 1744/3000 [1:31:52<1:01:12,  2.92s/it, lr: 1.0e-04 loss: 6.705e-02]hash_cache_v1:  58%|#####8    | 1745/3000 [1:31:52<1:00:44,  2.90s/it, lr: 1.0e-04 loss: 6.705e-02]hash_cache_v1:  58%|#####8    | 1745/3000 [1:31:52<1:00:44,  2.90s/it, lr: 1.0e-04 loss: 6.705e-02]hash_cache_v1:  58%|#####8    | 1745/3000 [1:31:56<1:00:44,  2.90s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  58%|#####8    | 1745/3000 [1:31:56<1:00:44,  2.90s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  58%|#####8    | 1746/3000 [1:31:56<1:10:22,  3.37s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  58%|#####8    | 1746/3000 [1:31:56<1:10:22,  3.37s/it, lr: 1.0e-04 loss: 1.781e-01]hash_cache_v1:  58%|#####8    | 1746/3000 [1:31:59<1:10:22,  3.37s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  58%|#####8    | 1746/3000 [1:31:59<1:10:22,  3.37s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  58%|#####8    | 1747/3000 [1:31:59<1:02:46,  3.01s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  58%|#####8    | 1747/3000 [1:31:59<1:02:46,  3.01s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  58%|#####8    | 1747/3000 [1:32:01<1:02:46,  3.01s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  58%|#####8    | 1747/3000 [1:32:01<1:02:46,  3.01s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  58%|#####8    | 1748/3000 [1:32:01<57:15,  2.74s/it, lr: 1.0e-04 loss: 1.165e-01]  hash_cache_v1:  58%|#####8    | 1748/3000 [1:32:01<57:15,  2.74s/it, lr: 1.0e-04 loss: 1.165e-01]  hash_cache_v1:  58%|#####8    | 1748/3000 [1:32:03<57:15,  2.74s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  58%|#####8    | 1748/3000 [1:32:03<57:15,  2.74s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  58%|#####8    | 1749/3000 [1:32:03<55:04,  2.64s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  58%|#####8    | 1749/3000 [1:32:03<55:04,  2.64s/it, lr: 1.0e-04 loss: 1.027e-01]hash_cache_v1:  58%|#####8    | 1749/3000 [1:32:05<55:04,  2.64s/it, lr: 1.0e-04 loss: 1.704e-01]hash_cache_v1:  58%|#####8    | 1749/3000 [1:32:05<55:04,  2.64s/it, lr: 1.0e-04 loss: 1.704e-01]
+Saving at step 1750
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001750.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000000750.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.99s/it]Generating Images:  25%|##5       | 1/4 [01:11<03:35, 71.99s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.24s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.24s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.31s/it]Generating Images:  75%|#######5  | 3/4 [03:36<01:12, 72.31s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.31s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.31s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  58%|#####8    | 1750/3000 [1:32:08<55:02,  2.64s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  58%|#####8    | 1750/3000 [1:32:08<55:02,  2.64s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  58%|#####8    | 1751/3000 [1:32:08<44:44,  2.15s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  58%|#####8    | 1751/3000 [1:32:08<44:44,  2.15s/it, lr: 1.0e-04 loss: 1.559e-01]hash_cache_v1:  58%|#####8    | 1751/3000 [1:32:13<44:44,  2.15s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  58%|#####8    | 1751/3000 [1:32:13<44:44,  2.15s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  58%|#####8    | 1752/3000 [1:32:13<55:50,  2.68s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  58%|#####8    | 1752/3000 [1:32:13<55:50,  2.68s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  58%|#####8    | 1752/3000 [1:32:15<55:50,  2.68s/it, lr: 1.0e-04 loss: 6.977e-02]hash_cache_v1:  58%|#####8    | 1752/3000 [1:32:15<55:50,  2.68s/it, lr: 1.0e-04 loss: 6.977e-02]hash_cache_v1:  58%|#####8    | 1753/3000 [1:32:15<52:40,  2.53s/it, lr: 1.0e-04 loss: 6.977e-02]hash_cache_v1:  58%|#####8    | 1753/3000 [1:32:15<52:40,  2.53s/it, lr: 1.0e-04 loss: 6.977e-02]hash_cache_v1:  58%|#####8    | 1753/3000 [1:32:19<52:40,  2.53s/it, lr: 1.0e-04 loss: 1.055e-01]hash_cache_v1:  58%|#####8    | 1753/3000 [1:32:19<52:40,  2.53s/it, lr: 1.0e-04 loss: 1.055e-01]hash_cache_v1:  58%|#####8    | 1754/3000 [1:32:19<1:03:38,  3.06s/it, lr: 1.0e-04 loss: 1.055e-01]hash_cache_v1:  58%|#####8    | 1754/3000 [1:32:19<1:03:38,  3.06s/it, lr: 1.0e-04 loss: 1.055e-01]hash_cache_v1:  58%|#####8    | 1754/3000 [1:32:21<1:03:38,  3.06s/it, lr: 1.0e-04 loss: 1.413e-01]hash_cache_v1:  58%|#####8    | 1754/3000 [1:32:21<1:03:38,  3.06s/it, lr: 1.0e-04 loss: 1.413e-01]hash_cache_v1:  58%|#####8    | 1755/3000 [1:32:21<58:00,  2.80s/it, lr: 1.0e-04 loss: 1.413e-01]  hash_cache_v1:  58%|#####8    | 1755/3000 [1:32:21<58:00,  2.80s/it, lr: 1.0e-04 loss: 1.413e-01]  hash_cache_v1:  58%|#####8    | 1755/3000 [1:32:26<58:00,  2.80s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  58%|#####8    | 1755/3000 [1:32:26<58:00,  2.80s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  59%|#####8    | 1756/3000 [1:32:26<1:06:54,  3.23s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  59%|#####8    | 1756/3000 [1:32:26<1:06:54,  3.23s/it, lr: 1.0e-04 loss: 1.102e-01]hash_cache_v1:  59%|#####8    | 1756/3000 [1:32:28<1:06:54,  3.23s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  59%|#####8    | 1756/3000 [1:32:28<1:06:54,  3.23s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  59%|#####8    | 1757/3000 [1:32:28<1:01:53,  2.99s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  59%|#####8    | 1757/3000 [1:32:28<1:01:53,  2.99s/it, lr: 1.0e-04 loss: 1.943e-01]hash_cache_v1:  59%|#####8    | 1757/3000 [1:32:32<1:01:53,  2.99s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  59%|#####8    | 1757/3000 [1:32:32<1:01:53,  2.99s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  59%|#####8    | 1758/3000 [1:32:32<1:09:53,  3.38s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  59%|#####8    | 1758/3000 [1:32:32<1:09:53,  3.38s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  59%|#####8    | 1758/3000 [1:32:37<1:09:53,  3.38s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  59%|#####8    | 1758/3000 [1:32:37<1:09:53,  3.38s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  59%|#####8    | 1759/3000 [1:32:37<1:15:30,  3.65s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  59%|#####8    | 1759/3000 [1:32:37<1:15:30,  3.65s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  59%|#####8    | 1759/3000 [1:32:39<1:15:30,  3.65s/it, lr: 1.0e-04 loss: 1.100e-01]hash_cache_v1:  59%|#####8    | 1759/3000 [1:32:39<1:15:30,  3.65s/it, lr: 1.0e-04 loss: 1.100e-01]hash_cache_v1:  59%|#####8    | 1760/3000 [1:32:41<1:15:26,  3.65s/it, lr: 1.0e-04 loss: 1.905e-01]hash_cache_v1:  59%|#####8    | 1760/3000 [1:32:41<1:15:26,  3.65s/it, lr: 1.0e-04 loss: 1.905e-01]hash_cache_v1:  59%|#####8    | 1761/3000 [1:32:41<52:09,  2.53s/it, lr: 1.0e-04 loss: 1.905e-01]  hash_cache_v1:  59%|#####8    | 1761/3000 [1:32:41<52:09,  2.53s/it, lr: 1.0e-04 loss: 1.905e-01]  hash_cache_v1:  59%|#####8    | 1761/3000 [1:32:43<52:09,  2.53s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  59%|#####8    | 1761/3000 [1:32:43<52:09,  2.53s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  59%|#####8    | 1762/3000 [1:32:43<49:53,  2.42s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  59%|#####8    | 1762/3000 [1:32:43<49:53,  2.42s/it, lr: 1.0e-04 loss: 1.776e-01]hash_cache_v1:  59%|#####8    | 1762/3000 [1:32:46<49:53,  2.42s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  59%|#####8    | 1762/3000 [1:32:46<49:53,  2.42s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  59%|#####8    | 1763/3000 [1:32:46<52:16,  2.54s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  59%|#####8    | 1763/3000 [1:32:46<52:16,  2.54s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  59%|#####8    | 1763/3000 [1:32:50<52:16,  2.54s/it, lr: 1.0e-04 loss: 1.989e-02]hash_cache_v1:  59%|#####8    | 1763/3000 [1:32:50<52:16,  2.54s/it, lr: 1.0e-04 loss: 1.989e-02]hash_cache_v1:  59%|#####8    | 1764/3000 [1:32:50<1:02:11,  3.02s/it, lr: 1.0e-04 loss: 1.989e-02]hash_cache_v1:  59%|#####8    | 1764/3000 [1:32:50<1:02:11,  3.02s/it, lr: 1.0e-04 loss: 1.989e-02]hash_cache_v1:  59%|#####8    | 1764/3000 [1:32:53<1:02:11,  3.02s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  59%|#####8    | 1764/3000 [1:32:53<1:02:11,  3.02s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  59%|#####8    | 1765/3000 [1:32:53<1:02:35,  3.04s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  59%|#####8    | 1765/3000 [1:32:53<1:02:35,  3.04s/it, lr: 1.0e-04 loss: 2.148e-01]hash_cache_v1:  59%|#####8    | 1765/3000 [1:32:56<1:02:35,  3.04s/it, lr: 1.0e-04 loss: 1.504e-02]hash_cache_v1:  59%|#####8    | 1765/3000 [1:32:56<1:02:35,  3.04s/it, lr: 1.0e-04 loss: 1.504e-02]hash_cache_v1:  59%|#####8    | 1766/3000 [1:32:56<57:03,  2.77s/it, lr: 1.0e-04 loss: 1.504e-02]  hash_cache_v1:  59%|#####8    | 1766/3000 [1:32:56<57:03,  2.77s/it, lr: 1.0e-04 loss: 1.504e-02]  hash_cache_v1:  59%|#####8    | 1766/3000 [1:33:00<57:03,  2.77s/it, lr: 1.0e-04 loss: 1.019e-01]hash_cache_v1:  59%|#####8    | 1766/3000 [1:33:00<57:03,  2.77s/it, lr: 1.0e-04 loss: 1.019e-01]hash_cache_v1:  59%|#####8    | 1767/3000 [1:33:00<1:06:04,  3.22s/it, lr: 1.0e-04 loss: 1.019e-01]hash_cache_v1:  59%|#####8    | 1767/3000 [1:33:00<1:06:04,  3.22s/it, lr: 1.0e-04 loss: 1.019e-01]hash_cache_v1:  59%|#####8    | 1767/3000 [1:33:02<1:06:04,  3.22s/it, lr: 1.0e-04 loss: 2.413e-02]hash_cache_v1:  59%|#####8    | 1767/3000 [1:33:02<1:06:04,  3.22s/it, lr: 1.0e-04 loss: 2.413e-02]hash_cache_v1:  59%|#####8    | 1768/3000 [1:33:02<1:00:57,  2.97s/it, lr: 1.0e-04 loss: 2.413e-02]hash_cache_v1:  59%|#####8    | 1768/3000 [1:33:02<1:00:57,  2.97s/it, lr: 1.0e-04 loss: 2.413e-02]hash_cache_v1:  59%|#####8    | 1768/3000 [1:33:05<1:00:57,  2.97s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  59%|#####8    | 1768/3000 [1:33:05<1:00:57,  2.97s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  59%|#####8    | 1769/3000 [1:33:05<1:00:16,  2.94s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  59%|#####8    | 1769/3000 [1:33:05<1:00:16,  2.94s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  59%|#####8    | 1769/3000 [1:33:08<1:00:16,  2.94s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  59%|#####8    | 1769/3000 [1:33:08<1:00:16,  2.94s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  59%|#####8    | 1770/3000 [1:33:11<1:00:13,  2.94s/it, lr: 1.0e-04 loss: 7.959e-02]hash_cache_v1:  59%|#####8    | 1770/3000 [1:33:11<1:00:13,  2.94s/it, lr: 1.0e-04 loss: 7.959e-02]hash_cache_v1:  59%|#####9    | 1771/3000 [1:33:11<46:08,  2.25s/it, lr: 1.0e-04 loss: 7.959e-02]  hash_cache_v1:  59%|#####9    | 1771/3000 [1:33:11<46:08,  2.25s/it, lr: 1.0e-04 loss: 7.959e-02]  hash_cache_v1:  59%|#####9    | 1771/3000 [1:33:13<46:08,  2.25s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:  59%|#####9    | 1771/3000 [1:33:13<46:08,  2.25s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:  59%|#####9    | 1772/3000 [1:33:13<46:44,  2.28s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:  59%|#####9    | 1772/3000 [1:33:13<46:44,  2.28s/it, lr: 1.0e-04 loss: 1.965e-01]hash_cache_v1:  59%|#####9    | 1772/3000 [1:33:15<46:44,  2.28s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  59%|#####9    | 1772/3000 [1:33:15<46:44,  2.28s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  59%|#####9    | 1773/3000 [1:33:15<45:44,  2.24s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  59%|#####9    | 1773/3000 [1:33:15<45:44,  2.24s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  59%|#####9    | 1773/3000 [1:33:17<45:44,  2.24s/it, lr: 1.0e-04 loss: 6.240e-02]hash_cache_v1:  59%|#####9    | 1773/3000 [1:33:17<45:44,  2.24s/it, lr: 1.0e-04 loss: 6.240e-02]hash_cache_v1:  59%|#####9    | 1774/3000 [1:33:17<44:57,  2.20s/it, lr: 1.0e-04 loss: 6.240e-02]hash_cache_v1:  59%|#####9    | 1774/3000 [1:33:17<44:57,  2.20s/it, lr: 1.0e-04 loss: 6.240e-02]hash_cache_v1:  59%|#####9    | 1774/3000 [1:33:22<44:57,  2.20s/it, lr: 1.0e-04 loss: 9.255e-02]hash_cache_v1:  59%|#####9    | 1774/3000 [1:33:22<44:57,  2.20s/it, lr: 1.0e-04 loss: 9.255e-02]hash_cache_v1:  59%|#####9    | 1775/3000 [1:33:22<56:41,  2.78s/it, lr: 1.0e-04 loss: 9.255e-02]hash_cache_v1:  59%|#####9    | 1775/3000 [1:33:22<56:41,  2.78s/it, lr: 1.0e-04 loss: 9.255e-02]hash_cache_v1:  59%|#####9    | 1775/3000 [1:33:24<56:41,  2.78s/it, lr: 1.0e-04 loss: 7.112e-02]hash_cache_v1:  59%|#####9    | 1775/3000 [1:33:24<56:41,  2.78s/it, lr: 1.0e-04 loss: 7.112e-02]hash_cache_v1:  59%|#####9    | 1776/3000 [1:33:24<54:16,  2.66s/it, lr: 1.0e-04 loss: 7.112e-02]hash_cache_v1:  59%|#####9    | 1776/3000 [1:33:24<54:16,  2.66s/it, lr: 1.0e-04 loss: 7.112e-02]hash_cache_v1:  59%|#####9    | 1776/3000 [1:33:28<54:16,  2.66s/it, lr: 1.0e-04 loss: 8.595e-02]hash_cache_v1:  59%|#####9    | 1776/3000 [1:33:28<54:16,  2.66s/it, lr: 1.0e-04 loss: 8.595e-02]hash_cache_v1:  59%|#####9    | 1777/3000 [1:33:28<1:03:43,  3.13s/it, lr: 1.0e-04 loss: 8.595e-02]hash_cache_v1:  59%|#####9    | 1777/3000 [1:33:28<1:03:43,  3.13s/it, lr: 1.0e-04 loss: 8.595e-02]hash_cache_v1:  59%|#####9    | 1777/3000 [1:33:33<1:03:43,  3.13s/it, lr: 1.0e-04 loss: 6.831e-02]hash_cache_v1:  59%|#####9    | 1777/3000 [1:33:33<1:03:43,  3.13s/it, lr: 1.0e-04 loss: 6.831e-02]hash_cache_v1:  59%|#####9    | 1778/3000 [1:33:33<1:10:50,  3.48s/it, lr: 1.0e-04 loss: 6.831e-02]hash_cache_v1:  59%|#####9    | 1778/3000 [1:33:33<1:10:50,  3.48s/it, lr: 1.0e-04 loss: 6.831e-02]hash_cache_v1:  59%|#####9    | 1778/3000 [1:33:37<1:10:50,  3.48s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  59%|#####9    | 1778/3000 [1:33:37<1:10:50,  3.48s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  59%|#####9    | 1779/3000 [1:33:37<1:16:47,  3.77s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  59%|#####9    | 1779/3000 [1:33:37<1:16:47,  3.77s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  59%|#####9    | 1779/3000 [1:33:41<1:16:47,  3.77s/it, lr: 1.0e-04 loss: 1.675e-01]hash_cache_v1:  59%|#####9    | 1779/3000 [1:33:41<1:16:47,  3.77s/it, lr: 1.0e-04 loss: 1.675e-01]hash_cache_v1:  59%|#####9    | 1780/3000 [1:33:46<1:16:44,  3.77s/it, lr: 1.0e-04 loss: 1.095e-01]hash_cache_v1:  59%|#####9    | 1780/3000 [1:33:46<1:16:44,  3.77s/it, lr: 1.0e-04 loss: 1.095e-01]hash_cache_v1:  59%|#####9    | 1781/3000 [1:33:46<1:01:37,  3.03s/it, lr: 1.0e-04 loss: 1.095e-01]hash_cache_v1:  59%|#####9    | 1781/3000 [1:33:46<1:01:37,  3.03s/it, lr: 1.0e-04 loss: 1.095e-01]hash_cache_v1:  59%|#####9    | 1781/3000 [1:33:49<1:01:37,  3.03s/it, lr: 1.0e-04 loss: 8.317e-02]hash_cache_v1:  59%|#####9    | 1781/3000 [1:33:49<1:01:37,  3.03s/it, lr: 1.0e-04 loss: 8.317e-02]hash_cache_v1:  59%|#####9    | 1782/3000 [1:33:49<1:00:44,  2.99s/it, lr: 1.0e-04 loss: 8.317e-02]hash_cache_v1:  59%|#####9    | 1782/3000 [1:33:49<1:00:44,  2.99s/it, lr: 1.0e-04 loss: 8.317e-02]hash_cache_v1:  59%|#####9    | 1782/3000 [1:33:53<1:00:44,  2.99s/it, lr: 1.0e-04 loss: 6.290e-02]hash_cache_v1:  59%|#####9    | 1782/3000 [1:33:53<1:00:44,  2.99s/it, lr: 1.0e-04 loss: 6.290e-02]hash_cache_v1:  59%|#####9    | 1783/3000 [1:33:53<1:08:38,  3.38s/it, lr: 1.0e-04 loss: 6.290e-02]hash_cache_v1:  59%|#####9    | 1783/3000 [1:33:53<1:08:38,  3.38s/it, lr: 1.0e-04 loss: 6.290e-02]hash_cache_v1:  59%|#####9    | 1783/3000 [1:33:57<1:08:38,  3.38s/it, lr: 1.0e-04 loss: 6.860e-02]hash_cache_v1:  59%|#####9    | 1783/3000 [1:33:57<1:08:38,  3.38s/it, lr: 1.0e-04 loss: 6.860e-02]hash_cache_v1:  59%|#####9    | 1784/3000 [1:33:57<1:13:45,  3.64s/it, lr: 1.0e-04 loss: 6.860e-02]hash_cache_v1:  59%|#####9    | 1784/3000 [1:33:57<1:13:45,  3.64s/it, lr: 1.0e-04 loss: 6.860e-02]hash_cache_v1:  59%|#####9    | 1784/3000 [1:34:00<1:13:45,  3.64s/it, lr: 1.0e-04 loss: 8.990e-02]hash_cache_v1:  59%|#####9    | 1784/3000 [1:34:00<1:13:45,  3.64s/it, lr: 1.0e-04 loss: 8.990e-02]hash_cache_v1:  60%|#####9    | 1785/3000 [1:34:00<1:09:06,  3.41s/it, lr: 1.0e-04 loss: 8.990e-02]hash_cache_v1:  60%|#####9    | 1785/3000 [1:34:00<1:09:06,  3.41s/it, lr: 1.0e-04 loss: 8.990e-02]hash_cache_v1:  60%|#####9    | 1785/3000 [1:34:05<1:09:06,  3.41s/it, lr: 1.0e-04 loss: 1.088e-01]hash_cache_v1:  60%|#####9    | 1785/3000 [1:34:05<1:09:06,  3.41s/it, lr: 1.0e-04 loss: 1.088e-01]hash_cache_v1:  60%|#####9    | 1786/3000 [1:34:05<1:15:02,  3.71s/it, lr: 1.0e-04 loss: 1.088e-01]hash_cache_v1:  60%|#####9    | 1786/3000 [1:34:05<1:15:02,  3.71s/it, lr: 1.0e-04 loss: 1.088e-01]hash_cache_v1:  60%|#####9    | 1786/3000 [1:34:07<1:15:02,  3.71s/it, lr: 1.0e-04 loss: 2.036e-01]hash_cache_v1:  60%|#####9    | 1786/3000 [1:34:07<1:15:02,  3.71s/it, lr: 1.0e-04 loss: 2.036e-01]hash_cache_v1:  60%|#####9    | 1787/3000 [1:34:07<1:05:39,  3.25s/it, lr: 1.0e-04 loss: 2.036e-01]hash_cache_v1:  60%|#####9    | 1787/3000 [1:34:07<1:05:39,  3.25s/it, lr: 1.0e-04 loss: 2.036e-01]hash_cache_v1:  60%|#####9    | 1787/3000 [1:34:10<1:05:39,  3.25s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  60%|#####9    | 1787/3000 [1:34:10<1:05:39,  3.25s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  60%|#####9    | 1788/3000 [1:34:10<1:03:27,  3.14s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  60%|#####9    | 1788/3000 [1:34:10<1:03:27,  3.14s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  60%|#####9    | 1788/3000 [1:34:14<1:03:27,  3.14s/it, lr: 1.0e-04 loss: 1.347e-01]hash_cache_v1:  60%|#####9    | 1788/3000 [1:34:14<1:03:27,  3.14s/it, lr: 1.0e-04 loss: 1.347e-01]hash_cache_v1:  60%|#####9    | 1789/3000 [1:34:14<1:10:25,  3.49s/it, lr: 1.0e-04 loss: 1.347e-01]hash_cache_v1:  60%|#####9    | 1789/3000 [1:34:14<1:10:25,  3.49s/it, lr: 1.0e-04 loss: 1.347e-01]hash_cache_v1:  60%|#####9    | 1789/3000 [1:34:16<1:10:25,  3.49s/it, lr: 1.0e-04 loss: 1.708e-01]hash_cache_v1:  60%|#####9    | 1789/3000 [1:34:16<1:10:25,  3.49s/it, lr: 1.0e-04 loss: 1.708e-01]hash_cache_v1:  60%|#####9    | 1790/3000 [1:34:21<1:10:21,  3.49s/it, lr: 1.0e-04 loss: 9.149e-02]hash_cache_v1:  60%|#####9    | 1790/3000 [1:34:21<1:10:21,  3.49s/it, lr: 1.0e-04 loss: 9.149e-02]hash_cache_v1:  60%|#####9    | 1791/3000 [1:34:21<57:53,  2.87s/it, lr: 1.0e-04 loss: 9.149e-02]  hash_cache_v1:  60%|#####9    | 1791/3000 [1:34:21<57:53,  2.87s/it, lr: 1.0e-04 loss: 9.149e-02]  hash_cache_v1:  60%|#####9    | 1791/3000 [1:34:23<57:53,  2.87s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  60%|#####9    | 1791/3000 [1:34:23<57:53,  2.87s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  60%|#####9    | 1792/3000 [1:34:23<54:01,  2.68s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  60%|#####9    | 1792/3000 [1:34:23<54:01,  2.68s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  60%|#####9    | 1792/3000 [1:34:27<54:01,  2.68s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  60%|#####9    | 1792/3000 [1:34:27<54:01,  2.68s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  60%|#####9    | 1793/3000 [1:34:27<1:02:28,  3.11s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  60%|#####9    | 1793/3000 [1:34:27<1:02:28,  3.11s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  60%|#####9    | 1793/3000 [1:34:32<1:02:28,  3.11s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  60%|#####9    | 1793/3000 [1:34:32<1:02:28,  3.11s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  60%|#####9    | 1794/3000 [1:34:32<1:09:58,  3.48s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  60%|#####9    | 1794/3000 [1:34:32<1:09:58,  3.48s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  60%|#####9    | 1794/3000 [1:34:34<1:09:58,  3.48s/it, lr: 1.0e-04 loss: 7.596e-02]hash_cache_v1:  60%|#####9    | 1794/3000 [1:34:34<1:09:58,  3.48s/it, lr: 1.0e-04 loss: 7.596e-02]hash_cache_v1:  60%|#####9    | 1795/3000 [1:34:34<1:06:31,  3.31s/it, lr: 1.0e-04 loss: 7.596e-02]hash_cache_v1:  60%|#####9    | 1795/3000 [1:34:34<1:06:31,  3.31s/it, lr: 1.0e-04 loss: 7.596e-02]hash_cache_v1:  60%|#####9    | 1795/3000 [1:34:37<1:06:31,  3.31s/it, lr: 1.0e-04 loss: 1.676e-01]hash_cache_v1:  60%|#####9    | 1795/3000 [1:34:37<1:06:31,  3.31s/it, lr: 1.0e-04 loss: 1.676e-01]hash_cache_v1:  60%|#####9    | 1796/3000 [1:34:37<59:32,  2.97s/it, lr: 1.0e-04 loss: 1.676e-01]  hash_cache_v1:  60%|#####9    | 1796/3000 [1:34:37<59:32,  2.97s/it, lr: 1.0e-04 loss: 1.676e-01]  hash_cache_v1:  60%|#####9    | 1796/3000 [1:34:41<59:32,  2.97s/it, lr: 1.0e-04 loss: 6.850e-02]hash_cache_v1:  60%|#####9    | 1796/3000 [1:34:41<59:32,  2.97s/it, lr: 1.0e-04 loss: 6.850e-02]hash_cache_v1:  60%|#####9    | 1797/3000 [1:34:41<1:08:25,  3.41s/it, lr: 1.0e-04 loss: 6.850e-02]hash_cache_v1:  60%|#####9    | 1797/3000 [1:34:41<1:08:25,  3.41s/it, lr: 1.0e-04 loss: 6.850e-02]hash_cache_v1:  60%|#####9    | 1797/3000 [1:34:44<1:08:25,  3.41s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  60%|#####9    | 1797/3000 [1:34:44<1:08:25,  3.41s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  60%|#####9    | 1798/3000 [1:34:44<1:05:02,  3.25s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  60%|#####9    | 1798/3000 [1:34:44<1:05:02,  3.25s/it, lr: 1.0e-04 loss: 1.568e-01]hash_cache_v1:  60%|#####9    | 1798/3000 [1:34:46<1:05:02,  3.25s/it, lr: 1.0e-04 loss: 1.748e-01]hash_cache_v1:  60%|#####9    | 1798/3000 [1:34:46<1:05:02,  3.25s/it, lr: 1.0e-04 loss: 1.748e-01]hash_cache_v1:  60%|#####9    | 1799/3000 [1:34:46<58:17,  2.91s/it, lr: 1.0e-04 loss: 1.748e-01]  hash_cache_v1:  60%|#####9    | 1799/3000 [1:34:46<58:17,  2.91s/it, lr: 1.0e-04 loss: 1.748e-01]  hash_cache_v1:  60%|#####9    | 1799/3000 [1:34:49<58:17,  2.91s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  60%|#####9    | 1799/3000 [1:34:49<58:17,  2.91s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  60%|######    | 1800/3000 [1:34:52<58:14,  2.91s/it, lr: 1.0e-04 loss: 1.580e-01]hash_cache_v1:  60%|######    | 1800/3000 [1:34:52<58:14,  2.91s/it, lr: 1.0e-04 loss: 1.580e-01]hash_cache_v1:  60%|######    | 1801/3000 [1:34:52<43:14,  2.16s/it, lr: 1.0e-04 loss: 1.580e-01]hash_cache_v1:  60%|######    | 1801/3000 [1:34:52<43:14,  2.16s/it, lr: 1.0e-04 loss: 1.580e-01]hash_cache_v1:  60%|######    | 1801/3000 [1:34:54<43:14,  2.16s/it, lr: 1.0e-04 loss: 2.185e-01]hash_cache_v1:  60%|######    | 1801/3000 [1:34:54<43:14,  2.16s/it, lr: 1.0e-04 loss: 2.185e-01]hash_cache_v1:  60%|######    | 1802/3000 [1:34:54<43:01,  2.15s/it, lr: 1.0e-04 loss: 2.185e-01]hash_cache_v1:  60%|######    | 1802/3000 [1:34:54<43:01,  2.15s/it, lr: 1.0e-04 loss: 2.185e-01]hash_cache_v1:  60%|######    | 1802/3000 [1:34:57<43:01,  2.15s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  60%|######    | 1802/3000 [1:34:57<43:01,  2.15s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  60%|######    | 1803/3000 [1:34:57<46:40,  2.34s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  60%|######    | 1803/3000 [1:34:57<46:40,  2.34s/it, lr: 1.0e-04 loss: 1.441e-01]hash_cache_v1:  60%|######    | 1803/3000 [1:35:00<46:40,  2.34s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  60%|######    | 1803/3000 [1:35:00<46:40,  2.34s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  60%|######    | 1804/3000 [1:35:00<49:32,  2.49s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  60%|######    | 1804/3000 [1:35:00<49:32,  2.49s/it, lr: 1.0e-04 loss: 1.735e-01]hash_cache_v1:  60%|######    | 1804/3000 [1:35:02<49:32,  2.49s/it, lr: 1.0e-04 loss: 3.085e-02]hash_cache_v1:  60%|######    | 1804/3000 [1:35:02<49:32,  2.49s/it, lr: 1.0e-04 loss: 3.085e-02]hash_cache_v1:  60%|######    | 1805/3000 [1:35:02<48:55,  2.46s/it, lr: 1.0e-04 loss: 3.085e-02]hash_cache_v1:  60%|######    | 1805/3000 [1:35:02<48:55,  2.46s/it, lr: 1.0e-04 loss: 3.085e-02]hash_cache_v1:  60%|######    | 1805/3000 [1:35:05<48:55,  2.46s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  60%|######    | 1805/3000 [1:35:05<48:55,  2.46s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  60%|######    | 1806/3000 [1:35:05<51:12,  2.57s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  60%|######    | 1806/3000 [1:35:05<51:12,  2.57s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  60%|######    | 1806/3000 [1:35:08<51:12,  2.57s/it, lr: 1.0e-04 loss: 5.477e-02]hash_cache_v1:  60%|######    | 1806/3000 [1:35:08<51:12,  2.57s/it, lr: 1.0e-04 loss: 5.477e-02]hash_cache_v1:  60%|######    | 1807/3000 [1:35:08<52:14,  2.63s/it, lr: 1.0e-04 loss: 5.477e-02]hash_cache_v1:  60%|######    | 1807/3000 [1:35:08<52:14,  2.63s/it, lr: 1.0e-04 loss: 5.477e-02]hash_cache_v1:  60%|######    | 1807/3000 [1:35:10<52:14,  2.63s/it, lr: 1.0e-04 loss: 4.451e-02]hash_cache_v1:  60%|######    | 1807/3000 [1:35:10<52:14,  2.63s/it, lr: 1.0e-04 loss: 4.451e-02]hash_cache_v1:  60%|######    | 1808/3000 [1:35:10<50:52,  2.56s/it, lr: 1.0e-04 loss: 4.451e-02]hash_cache_v1:  60%|######    | 1808/3000 [1:35:10<50:52,  2.56s/it, lr: 1.0e-04 loss: 4.451e-02]hash_cache_v1:  60%|######    | 1808/3000 [1:35:12<50:52,  2.56s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  60%|######    | 1808/3000 [1:35:12<50:52,  2.56s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  60%|######    | 1809/3000 [1:35:12<48:07,  2.42s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  60%|######    | 1809/3000 [1:35:12<48:07,  2.42s/it, lr: 1.0e-04 loss: 1.843e-01]hash_cache_v1:  60%|######    | 1809/3000 [1:35:17<48:07,  2.42s/it, lr: 1.0e-04 loss: 1.487e-01]hash_cache_v1:  60%|######    | 1809/3000 [1:35:17<48:07,  2.42s/it, lr: 1.0e-04 loss: 1.487e-01]hash_cache_v1:  60%|######    | 1810/3000 [1:35:21<48:05,  2.42s/it, lr: 1.0e-04 loss: 8.596e-02]hash_cache_v1:  60%|######    | 1810/3000 [1:35:21<48:05,  2.42s/it, lr: 1.0e-04 loss: 8.596e-02]hash_cache_v1:  60%|######    | 1811/3000 [1:35:21<45:24,  2.29s/it, lr: 1.0e-04 loss: 8.596e-02]hash_cache_v1:  60%|######    | 1811/3000 [1:35:21<45:24,  2.29s/it, lr: 1.0e-04 loss: 8.596e-02]hash_cache_v1:  60%|######    | 1811/3000 [1:35:23<45:24,  2.29s/it, lr: 1.0e-04 loss: 2.328e-01]hash_cache_v1:  60%|######    | 1811/3000 [1:35:23<45:24,  2.29s/it, lr: 1.0e-04 loss: 2.328e-01]hash_cache_v1:  60%|######    | 1812/3000 [1:35:23<45:38,  2.30s/it, lr: 1.0e-04 loss: 2.328e-01]hash_cache_v1:  60%|######    | 1812/3000 [1:35:23<45:38,  2.30s/it, lr: 1.0e-04 loss: 2.328e-01]hash_cache_v1:  60%|######    | 1812/3000 [1:35:26<45:38,  2.30s/it, lr: 1.0e-04 loss: 4.179e-02]hash_cache_v1:  60%|######    | 1812/3000 [1:35:26<45:38,  2.30s/it, lr: 1.0e-04 loss: 4.179e-02]hash_cache_v1:  60%|######    | 1813/3000 [1:35:26<48:25,  2.45s/it, lr: 1.0e-04 loss: 4.179e-02]hash_cache_v1:  60%|######    | 1813/3000 [1:35:26<48:25,  2.45s/it, lr: 1.0e-04 loss: 4.179e-02]hash_cache_v1:  60%|######    | 1813/3000 [1:35:29<48:25,  2.45s/it, lr: 1.0e-04 loss: 6.338e-02]hash_cache_v1:  60%|######    | 1813/3000 [1:35:29<48:25,  2.45s/it, lr: 1.0e-04 loss: 6.338e-02]hash_cache_v1:  60%|######    | 1814/3000 [1:35:29<50:34,  2.56s/it, lr: 1.0e-04 loss: 6.338e-02]hash_cache_v1:  60%|######    | 1814/3000 [1:35:29<50:34,  2.56s/it, lr: 1.0e-04 loss: 6.338e-02]hash_cache_v1:  60%|######    | 1814/3000 [1:35:31<50:34,  2.56s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  60%|######    | 1814/3000 [1:35:31<50:34,  2.56s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  60%|######    | 1815/3000 [1:35:31<47:59,  2.43s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  60%|######    | 1815/3000 [1:35:31<47:59,  2.43s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  60%|######    | 1815/3000 [1:35:34<47:59,  2.43s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  60%|######    | 1815/3000 [1:35:34<47:59,  2.43s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  61%|######    | 1816/3000 [1:35:34<51:22,  2.60s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  61%|######    | 1816/3000 [1:35:34<51:22,  2.60s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  61%|######    | 1816/3000 [1:35:38<51:22,  2.60s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  61%|######    | 1816/3000 [1:35:38<51:22,  2.60s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  61%|######    | 1817/3000 [1:35:38<1:00:48,  3.08s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  61%|######    | 1817/3000 [1:35:38<1:00:48,  3.08s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  61%|######    | 1817/3000 [1:35:43<1:00:48,  3.08s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  61%|######    | 1817/3000 [1:35:43<1:00:48,  3.08s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  61%|######    | 1818/3000 [1:35:43<1:08:02,  3.45s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  61%|######    | 1818/3000 [1:35:43<1:08:02,  3.45s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  61%|######    | 1818/3000 [1:35:46<1:08:02,  3.45s/it, lr: 1.0e-04 loss: 2.441e-02]hash_cache_v1:  61%|######    | 1818/3000 [1:35:46<1:08:02,  3.45s/it, lr: 1.0e-04 loss: 2.441e-02]hash_cache_v1:  61%|######    | 1819/3000 [1:35:46<1:05:47,  3.34s/it, lr: 1.0e-04 loss: 2.441e-02]hash_cache_v1:  61%|######    | 1819/3000 [1:35:46<1:05:47,  3.34s/it, lr: 1.0e-04 loss: 2.441e-02]hash_cache_v1:  61%|######    | 1819/3000 [1:35:48<1:05:47,  3.34s/it, lr: 1.0e-04 loss: 2.194e-02]hash_cache_v1:  61%|######    | 1819/3000 [1:35:48<1:05:47,  3.34s/it, lr: 1.0e-04 loss: 2.194e-02]hash_cache_v1:  61%|######    | 1820/3000 [1:35:51<1:05:44,  3.34s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  61%|######    | 1820/3000 [1:35:51<1:05:44,  3.34s/it, lr: 1.0e-04 loss: 1.419e-01]hash_cache_v1:  61%|######    | 1821/3000 [1:35:51<48:33,  2.47s/it, lr: 1.0e-04 loss: 1.419e-01]  hash_cache_v1:  61%|######    | 1821/3000 [1:35:51<48:33,  2.47s/it, lr: 1.0e-04 loss: 1.419e-01]  hash_cache_v1:  61%|######    | 1821/3000 [1:35:55<48:33,  2.47s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  61%|######    | 1821/3000 [1:35:55<48:33,  2.47s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  61%|######    | 1822/3000 [1:35:55<57:27,  2.93s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  61%|######    | 1822/3000 [1:35:55<57:27,  2.93s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  61%|######    | 1822/3000 [1:35:58<57:27,  2.93s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  61%|######    | 1822/3000 [1:35:58<57:27,  2.93s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  61%|######    | 1823/3000 [1:35:58<58:05,  2.96s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  61%|######    | 1823/3000 [1:35:58<58:05,  2.96s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  61%|######    | 1823/3000 [1:36:01<58:05,  2.96s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  61%|######    | 1823/3000 [1:36:01<58:05,  2.96s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  61%|######    | 1824/3000 [1:36:01<57:35,  2.94s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  61%|######    | 1824/3000 [1:36:01<57:35,  2.94s/it, lr: 1.0e-04 loss: 1.556e-01]hash_cache_v1:  61%|######    | 1824/3000 [1:36:04<57:35,  2.94s/it, lr: 1.0e-04 loss: 1.159e-01]hash_cache_v1:  61%|######    | 1824/3000 [1:36:04<57:35,  2.94s/it, lr: 1.0e-04 loss: 1.159e-01]hash_cache_v1:  61%|######    | 1825/3000 [1:36:04<57:10,  2.92s/it, lr: 1.0e-04 loss: 1.159e-01]hash_cache_v1:  61%|######    | 1825/3000 [1:36:04<57:10,  2.92s/it, lr: 1.0e-04 loss: 1.159e-01]hash_cache_v1:  61%|######    | 1825/3000 [1:36:06<57:10,  2.92s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######    | 1825/3000 [1:36:06<57:10,  2.92s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######    | 1826/3000 [1:36:06<52:37,  2.69s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######    | 1826/3000 [1:36:06<52:37,  2.69s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######    | 1826/3000 [1:36:10<52:37,  2.69s/it, lr: 1.0e-04 loss: 1.033e-01]hash_cache_v1:  61%|######    | 1826/3000 [1:36:10<52:37,  2.69s/it, lr: 1.0e-04 loss: 1.033e-01]hash_cache_v1:  61%|######    | 1827/3000 [1:36:10<1:02:54,  3.22s/it, lr: 1.0e-04 loss: 1.033e-01]hash_cache_v1:  61%|######    | 1827/3000 [1:36:10<1:02:54,  3.22s/it, lr: 1.0e-04 loss: 1.033e-01]hash_cache_v1:  61%|######    | 1827/3000 [1:36:13<1:02:54,  3.22s/it, lr: 1.0e-04 loss: 1.576e-01]hash_cache_v1:  61%|######    | 1827/3000 [1:36:13<1:02:54,  3.22s/it, lr: 1.0e-04 loss: 1.576e-01]hash_cache_v1:  61%|######    | 1828/3000 [1:36:13<1:00:58,  3.12s/it, lr: 1.0e-04 loss: 1.576e-01]hash_cache_v1:  61%|######    | 1828/3000 [1:36:13<1:00:58,  3.12s/it, lr: 1.0e-04 loss: 1.576e-01]hash_cache_v1:  61%|######    | 1828/3000 [1:36:16<1:00:58,  3.12s/it, lr: 1.0e-04 loss: 6.254e-02]hash_cache_v1:  61%|######    | 1828/3000 [1:36:16<1:00:58,  3.12s/it, lr: 1.0e-04 loss: 6.254e-02]hash_cache_v1:  61%|######    | 1829/3000 [1:36:16<59:29,  3.05s/it, lr: 1.0e-04 loss: 6.254e-02]  hash_cache_v1:  61%|######    | 1829/3000 [1:36:16<59:29,  3.05s/it, lr: 1.0e-04 loss: 6.254e-02]  hash_cache_v1:  61%|######    | 1829/3000 [1:36:21<59:29,  3.05s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  61%|######    | 1829/3000 [1:36:21<59:29,  3.05s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  61%|######1   | 1830/3000 [1:36:25<59:26,  3.05s/it, lr: 1.0e-04 loss: 3.930e-02]hash_cache_v1:  61%|######1   | 1830/3000 [1:36:25<59:26,  3.05s/it, lr: 1.0e-04 loss: 3.930e-02]hash_cache_v1:  61%|######1   | 1831/3000 [1:36:25<51:20,  2.64s/it, lr: 1.0e-04 loss: 3.930e-02]hash_cache_v1:  61%|######1   | 1831/3000 [1:36:25<51:20,  2.64s/it, lr: 1.0e-04 loss: 3.930e-02]hash_cache_v1:  61%|######1   | 1831/3000 [1:36:27<51:20,  2.64s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  61%|######1   | 1831/3000 [1:36:27<51:20,  2.64s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  61%|######1   | 1832/3000 [1:36:27<48:50,  2.51s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  61%|######1   | 1832/3000 [1:36:27<48:50,  2.51s/it, lr: 1.0e-04 loss: 1.609e-01]hash_cache_v1:  61%|######1   | 1832/3000 [1:36:31<48:50,  2.51s/it, lr: 1.0e-04 loss: 8.141e-02]hash_cache_v1:  61%|######1   | 1832/3000 [1:36:31<48:50,  2.51s/it, lr: 1.0e-04 loss: 8.141e-02]hash_cache_v1:  61%|######1   | 1833/3000 [1:36:31<57:56,  2.98s/it, lr: 1.0e-04 loss: 8.141e-02]hash_cache_v1:  61%|######1   | 1833/3000 [1:36:31<57:56,  2.98s/it, lr: 1.0e-04 loss: 8.141e-02]hash_cache_v1:  61%|######1   | 1833/3000 [1:36:36<57:56,  2.98s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######1   | 1833/3000 [1:36:36<57:56,  2.98s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######1   | 1834/3000 [1:36:36<1:05:47,  3.39s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######1   | 1834/3000 [1:36:36<1:05:47,  3.39s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  61%|######1   | 1834/3000 [1:36:40<1:05:47,  3.39s/it, lr: 1.0e-04 loss: 1.446e-02]hash_cache_v1:  61%|######1   | 1834/3000 [1:36:40<1:05:47,  3.39s/it, lr: 1.0e-04 loss: 1.446e-02]hash_cache_v1:  61%|######1   | 1835/3000 [1:36:40<1:10:41,  3.64s/it, lr: 1.0e-04 loss: 1.446e-02]hash_cache_v1:  61%|######1   | 1835/3000 [1:36:40<1:10:41,  3.64s/it, lr: 1.0e-04 loss: 1.446e-02]hash_cache_v1:  61%|######1   | 1835/3000 [1:36:42<1:10:41,  3.64s/it, lr: 1.0e-04 loss: 1.812e-01]hash_cache_v1:  61%|######1   | 1835/3000 [1:36:42<1:10:41,  3.64s/it, lr: 1.0e-04 loss: 1.812e-01]hash_cache_v1:  61%|######1   | 1836/3000 [1:36:42<1:02:15,  3.21s/it, lr: 1.0e-04 loss: 1.812e-01]hash_cache_v1:  61%|######1   | 1836/3000 [1:36:42<1:02:15,  3.21s/it, lr: 1.0e-04 loss: 1.812e-01]hash_cache_v1:  61%|######1   | 1836/3000 [1:36:45<1:02:15,  3.21s/it, lr: 1.0e-04 loss: 3.119e-03]hash_cache_v1:  61%|######1   | 1836/3000 [1:36:45<1:02:15,  3.21s/it, lr: 1.0e-04 loss: 3.119e-03]hash_cache_v1:  61%|######1   | 1837/3000 [1:36:45<1:01:12,  3.16s/it, lr: 1.0e-04 loss: 3.119e-03]hash_cache_v1:  61%|######1   | 1837/3000 [1:36:45<1:01:12,  3.16s/it, lr: 1.0e-04 loss: 3.119e-03]hash_cache_v1:  61%|######1   | 1837/3000 [1:36:48<1:01:12,  3.16s/it, lr: 1.0e-04 loss: 8.187e-02]hash_cache_v1:  61%|######1   | 1837/3000 [1:36:48<1:01:12,  3.16s/it, lr: 1.0e-04 loss: 8.187e-02]hash_cache_v1:  61%|######1   | 1838/3000 [1:36:48<59:23,  3.07s/it, lr: 1.0e-04 loss: 8.187e-02]  hash_cache_v1:  61%|######1   | 1838/3000 [1:36:48<59:23,  3.07s/it, lr: 1.0e-04 loss: 8.187e-02]  hash_cache_v1:  61%|######1   | 1838/3000 [1:36:51<59:23,  3.07s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  61%|######1   | 1838/3000 [1:36:51<59:23,  3.07s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  61%|######1   | 1839/3000 [1:36:51<58:00,  3.00s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  61%|######1   | 1839/3000 [1:36:51<58:00,  3.00s/it, lr: 1.0e-04 loss: 1.405e-01]hash_cache_v1:  61%|######1   | 1839/3000 [1:36:55<58:00,  3.00s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  61%|######1   | 1839/3000 [1:36:55<58:00,  3.00s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  61%|######1   | 1840/3000 [1:36:58<57:57,  3.00s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  61%|######1   | 1840/3000 [1:36:58<57:57,  3.00s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  61%|######1   | 1841/3000 [1:36:58<41:55,  2.17s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  61%|######1   | 1841/3000 [1:36:58<41:55,  2.17s/it, lr: 1.0e-04 loss: 2.016e-01]hash_cache_v1:  61%|######1   | 1841/3000 [1:37:02<41:55,  2.17s/it, lr: 1.0e-04 loss: 1.119e-01]hash_cache_v1:  61%|######1   | 1841/3000 [1:37:02<41:55,  2.17s/it, lr: 1.0e-04 loss: 1.119e-01]hash_cache_v1:  61%|######1   | 1842/3000 [1:37:02<51:59,  2.69s/it, lr: 1.0e-04 loss: 1.119e-01]hash_cache_v1:  61%|######1   | 1842/3000 [1:37:02<51:59,  2.69s/it, lr: 1.0e-04 loss: 1.119e-01]hash_cache_v1:  61%|######1   | 1842/3000 [1:37:04<51:59,  2.69s/it, lr: 1.0e-04 loss: 1.898e-01]hash_cache_v1:  61%|######1   | 1842/3000 [1:37:04<51:59,  2.69s/it, lr: 1.0e-04 loss: 1.898e-01]hash_cache_v1:  61%|######1   | 1843/3000 [1:37:04<48:52,  2.54s/it, lr: 1.0e-04 loss: 1.898e-01]hash_cache_v1:  61%|######1   | 1843/3000 [1:37:04<48:52,  2.54s/it, lr: 1.0e-04 loss: 1.898e-01]hash_cache_v1:  61%|######1   | 1843/3000 [1:37:06<48:52,  2.54s/it, lr: 1.0e-04 loss: 1.854e-01]hash_cache_v1:  61%|######1   | 1843/3000 [1:37:06<48:52,  2.54s/it, lr: 1.0e-04 loss: 1.854e-01]hash_cache_v1:  61%|######1   | 1844/3000 [1:37:06<48:01,  2.49s/it, lr: 1.0e-04 loss: 1.854e-01]hash_cache_v1:  61%|######1   | 1844/3000 [1:37:06<48:01,  2.49s/it, lr: 1.0e-04 loss: 1.854e-01]hash_cache_v1:  61%|######1   | 1844/3000 [1:37:11<48:01,  2.49s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  61%|######1   | 1844/3000 [1:37:11<48:01,  2.49s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  62%|######1   | 1845/3000 [1:37:11<57:43,  3.00s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  62%|######1   | 1845/3000 [1:37:11<57:43,  3.00s/it, lr: 1.0e-04 loss: 1.596e-01]hash_cache_v1:  62%|######1   | 1845/3000 [1:37:13<57:43,  3.00s/it, lr: 1.0e-04 loss: 9.729e-02]hash_cache_v1:  62%|######1   | 1845/3000 [1:37:13<57:43,  3.00s/it, lr: 1.0e-04 loss: 9.729e-02]hash_cache_v1:  62%|######1   | 1846/3000 [1:37:13<52:48,  2.75s/it, lr: 1.0e-04 loss: 9.729e-02]hash_cache_v1:  62%|######1   | 1846/3000 [1:37:13<52:48,  2.75s/it, lr: 1.0e-04 loss: 9.729e-02]hash_cache_v1:  62%|######1   | 1846/3000 [1:37:15<52:48,  2.75s/it, lr: 1.0e-04 loss: 1.221e-01]hash_cache_v1:  62%|######1   | 1846/3000 [1:37:15<52:48,  2.75s/it, lr: 1.0e-04 loss: 1.221e-01]hash_cache_v1:  62%|######1   | 1847/3000 [1:37:15<49:12,  2.56s/it, lr: 1.0e-04 loss: 1.221e-01]hash_cache_v1:  62%|######1   | 1847/3000 [1:37:15<49:12,  2.56s/it, lr: 1.0e-04 loss: 1.221e-01]hash_cache_v1:  62%|######1   | 1847/3000 [1:37:17<49:12,  2.56s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  62%|######1   | 1847/3000 [1:37:17<49:12,  2.56s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  62%|######1   | 1848/3000 [1:37:17<48:13,  2.51s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  62%|######1   | 1848/3000 [1:37:17<48:13,  2.51s/it, lr: 1.0e-04 loss: 1.692e-01]hash_cache_v1:  62%|######1   | 1848/3000 [1:37:22<48:13,  2.51s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  62%|######1   | 1848/3000 [1:37:22<48:13,  2.51s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  62%|######1   | 1849/3000 [1:37:22<58:19,  3.04s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  62%|######1   | 1849/3000 [1:37:22<58:19,  3.04s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  62%|######1   | 1849/3000 [1:37:25<58:19,  3.04s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  62%|######1   | 1849/3000 [1:37:25<58:19,  3.04s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  62%|######1   | 1850/3000 [1:37:29<58:16,  3.04s/it, lr: 1.0e-04 loss: 1.298e-03]hash_cache_v1:  62%|######1   | 1850/3000 [1:37:29<58:16,  3.04s/it, lr: 1.0e-04 loss: 1.298e-03]hash_cache_v1:  62%|######1   | 1851/3000 [1:37:29<50:28,  2.64s/it, lr: 1.0e-04 loss: 1.298e-03]hash_cache_v1:  62%|######1   | 1851/3000 [1:37:29<50:28,  2.64s/it, lr: 1.0e-04 loss: 1.298e-03]hash_cache_v1:  62%|######1   | 1851/3000 [1:37:32<50:28,  2.64s/it, lr: 1.0e-04 loss: 1.104e-02]hash_cache_v1:  62%|######1   | 1851/3000 [1:37:32<50:28,  2.64s/it, lr: 1.0e-04 loss: 1.104e-02]hash_cache_v1:  62%|######1   | 1852/3000 [1:37:32<52:29,  2.74s/it, lr: 1.0e-04 loss: 1.104e-02]hash_cache_v1:  62%|######1   | 1852/3000 [1:37:32<52:29,  2.74s/it, lr: 1.0e-04 loss: 1.104e-02]hash_cache_v1:  62%|######1   | 1852/3000 [1:37:36<52:29,  2.74s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  62%|######1   | 1852/3000 [1:37:36<52:29,  2.74s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  62%|######1   | 1853/3000 [1:37:36<59:59,  3.14s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  62%|######1   | 1853/3000 [1:37:36<59:59,  3.14s/it, lr: 1.0e-04 loss: 9.376e-02]hash_cache_v1:  62%|######1   | 1853/3000 [1:37:39<59:59,  3.14s/it, lr: 1.0e-04 loss: 1.448e-01]hash_cache_v1:  62%|######1   | 1853/3000 [1:37:39<59:59,  3.14s/it, lr: 1.0e-04 loss: 1.448e-01]hash_cache_v1:  62%|######1   | 1854/3000 [1:37:39<58:21,  3.06s/it, lr: 1.0e-04 loss: 1.448e-01]hash_cache_v1:  62%|######1   | 1854/3000 [1:37:39<58:21,  3.06s/it, lr: 1.0e-04 loss: 1.448e-01]hash_cache_v1:  62%|######1   | 1854/3000 [1:37:41<58:21,  3.06s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  62%|######1   | 1854/3000 [1:37:41<58:21,  3.06s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  62%|######1   | 1855/3000 [1:37:41<54:40,  2.87s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  62%|######1   | 1855/3000 [1:37:41<54:40,  2.87s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  62%|######1   | 1855/3000 [1:37:43<54:40,  2.87s/it, lr: 1.0e-04 loss: 1.047e-02]hash_cache_v1:  62%|######1   | 1855/3000 [1:37:43<54:40,  2.87s/it, lr: 1.0e-04 loss: 1.047e-02]hash_cache_v1:  62%|######1   | 1856/3000 [1:37:43<50:29,  2.65s/it, lr: 1.0e-04 loss: 1.047e-02]hash_cache_v1:  62%|######1   | 1856/3000 [1:37:43<50:29,  2.65s/it, lr: 1.0e-04 loss: 1.047e-02]hash_cache_v1:  62%|######1   | 1856/3000 [1:37:48<50:29,  2.65s/it, lr: 1.0e-04 loss: 1.515e-02]hash_cache_v1:  62%|######1   | 1856/3000 [1:37:48<50:29,  2.65s/it, lr: 1.0e-04 loss: 1.515e-02]hash_cache_v1:  62%|######1   | 1857/3000 [1:37:48<59:38,  3.13s/it, lr: 1.0e-04 loss: 1.515e-02]hash_cache_v1:  62%|######1   | 1857/3000 [1:37:48<59:38,  3.13s/it, lr: 1.0e-04 loss: 1.515e-02]hash_cache_v1:  62%|######1   | 1857/3000 [1:37:52<59:38,  3.13s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  62%|######1   | 1857/3000 [1:37:52<59:38,  3.13s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  62%|######1   | 1858/3000 [1:37:52<1:06:11,  3.48s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  62%|######1   | 1858/3000 [1:37:52<1:06:11,  3.48s/it, lr: 1.0e-04 loss: 1.279e-01]hash_cache_v1:  62%|######1   | 1858/3000 [1:37:55<1:06:11,  3.48s/it, lr: 1.0e-04 loss: 1.866e-02]hash_cache_v1:  62%|######1   | 1858/3000 [1:37:55<1:06:11,  3.48s/it, lr: 1.0e-04 loss: 1.866e-02]hash_cache_v1:  62%|######1   | 1859/3000 [1:37:55<59:58,  3.15s/it, lr: 1.0e-04 loss: 1.866e-02]  hash_cache_v1:  62%|######1   | 1859/3000 [1:37:55<59:58,  3.15s/it, lr: 1.0e-04 loss: 1.866e-02]  hash_cache_v1:  62%|######1   | 1859/3000 [1:37:57<59:58,  3.15s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  62%|######1   | 1859/3000 [1:37:57<59:58,  3.15s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  62%|######2   | 1860/3000 [1:38:01<59:55,  3.15s/it, lr: 1.0e-04 loss: 4.941e-02]hash_cache_v1:  62%|######2   | 1860/3000 [1:38:01<59:55,  3.15s/it, lr: 1.0e-04 loss: 4.941e-02]hash_cache_v1:  62%|######2   | 1861/3000 [1:38:01<50:43,  2.67s/it, lr: 1.0e-04 loss: 4.941e-02]hash_cache_v1:  62%|######2   | 1861/3000 [1:38:01<50:43,  2.67s/it, lr: 1.0e-04 loss: 4.941e-02]hash_cache_v1:  62%|######2   | 1861/3000 [1:38:05<50:43,  2.67s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  62%|######2   | 1861/3000 [1:38:05<50:43,  2.67s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  62%|######2   | 1862/3000 [1:38:05<58:14,  3.07s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  62%|######2   | 1862/3000 [1:38:05<58:14,  3.07s/it, lr: 1.0e-04 loss: 1.378e-01]hash_cache_v1:  62%|######2   | 1862/3000 [1:38:10<58:14,  3.07s/it, lr: 1.0e-04 loss: 4.739e-02]hash_cache_v1:  62%|######2   | 1862/3000 [1:38:10<58:14,  3.07s/it, lr: 1.0e-04 loss: 4.739e-02]hash_cache_v1:  62%|######2   | 1863/3000 [1:38:10<1:05:10,  3.44s/it, lr: 1.0e-04 loss: 4.739e-02]hash_cache_v1:  62%|######2   | 1863/3000 [1:38:10<1:05:10,  3.44s/it, lr: 1.0e-04 loss: 4.739e-02]hash_cache_v1:  62%|######2   | 1863/3000 [1:38:12<1:05:10,  3.44s/it, lr: 1.0e-04 loss: 9.472e-02]hash_cache_v1:  62%|######2   | 1863/3000 [1:38:12<1:05:10,  3.44s/it, lr: 1.0e-04 loss: 9.472e-02]hash_cache_v1:  62%|######2   | 1864/3000 [1:38:12<1:02:06,  3.28s/it, lr: 1.0e-04 loss: 9.472e-02]hash_cache_v1:  62%|######2   | 1864/3000 [1:38:12<1:02:06,  3.28s/it, lr: 1.0e-04 loss: 9.472e-02]hash_cache_v1:  62%|######2   | 1864/3000 [1:38:15<1:02:06,  3.28s/it, lr: 1.0e-04 loss: 9.283e-02]hash_cache_v1:  62%|######2   | 1864/3000 [1:38:15<1:02:06,  3.28s/it, lr: 1.0e-04 loss: 9.283e-02]hash_cache_v1:  62%|######2   | 1865/3000 [1:38:15<55:50,  2.95s/it, lr: 1.0e-04 loss: 9.283e-02]  hash_cache_v1:  62%|######2   | 1865/3000 [1:38:15<55:50,  2.95s/it, lr: 1.0e-04 loss: 9.283e-02]  hash_cache_v1:  62%|######2   | 1865/3000 [1:38:17<55:50,  2.95s/it, lr: 1.0e-04 loss: 5.871e-02]hash_cache_v1:  62%|######2   | 1865/3000 [1:38:17<55:50,  2.95s/it, lr: 1.0e-04 loss: 5.871e-02]hash_cache_v1:  62%|######2   | 1866/3000 [1:38:17<52:41,  2.79s/it, lr: 1.0e-04 loss: 5.871e-02]hash_cache_v1:  62%|######2   | 1866/3000 [1:38:17<52:41,  2.79s/it, lr: 1.0e-04 loss: 5.871e-02]hash_cache_v1:  62%|######2   | 1866/3000 [1:38:21<52:41,  2.79s/it, lr: 1.0e-04 loss: 3.294e-02]hash_cache_v1:  62%|######2   | 1866/3000 [1:38:21<52:41,  2.79s/it, lr: 1.0e-04 loss: 3.294e-02]hash_cache_v1:  62%|######2   | 1867/3000 [1:38:21<1:00:57,  3.23s/it, lr: 1.0e-04 loss: 3.294e-02]hash_cache_v1:  62%|######2   | 1867/3000 [1:38:21<1:00:57,  3.23s/it, lr: 1.0e-04 loss: 3.294e-02]hash_cache_v1:  62%|######2   | 1867/3000 [1:38:24<1:00:57,  3.23s/it, lr: 1.0e-04 loss: 5.053e-02]hash_cache_v1:  62%|######2   | 1867/3000 [1:38:24<1:00:57,  3.23s/it, lr: 1.0e-04 loss: 5.053e-02]hash_cache_v1:  62%|######2   | 1868/3000 [1:38:24<58:53,  3.12s/it, lr: 1.0e-04 loss: 5.053e-02]  hash_cache_v1:  62%|######2   | 1868/3000 [1:38:24<58:53,  3.12s/it, lr: 1.0e-04 loss: 5.053e-02]  hash_cache_v1:  62%|######2   | 1868/3000 [1:38:27<58:53,  3.12s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  62%|######2   | 1868/3000 [1:38:27<58:53,  3.12s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  62%|######2   | 1869/3000 [1:38:27<56:48,  3.01s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  62%|######2   | 1869/3000 [1:38:27<56:48,  3.01s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  62%|######2   | 1869/3000 [1:38:29<56:48,  3.01s/it, lr: 1.0e-04 loss: 1.812e-01]hash_cache_v1:  62%|######2   | 1869/3000 [1:38:29<56:48,  3.01s/it, lr: 1.0e-04 loss: 1.812e-01]hash_cache_v1:  62%|######2   | 1870/3000 [1:38:32<56:45,  3.01s/it, lr: 1.0e-04 loss: 1.459e-01]hash_cache_v1:  62%|######2   | 1870/3000 [1:38:32<56:45,  3.01s/it, lr: 1.0e-04 loss: 1.459e-01]hash_cache_v1:  62%|######2   | 1871/3000 [1:38:32<43:10,  2.29s/it, lr: 1.0e-04 loss: 1.459e-01]hash_cache_v1:  62%|######2   | 1871/3000 [1:38:32<43:10,  2.29s/it, lr: 1.0e-04 loss: 1.459e-01]hash_cache_v1:  62%|######2   | 1871/3000 [1:38:34<43:10,  2.29s/it, lr: 1.0e-04 loss: 1.198e-01]hash_cache_v1:  62%|######2   | 1871/3000 [1:38:34<43:10,  2.29s/it, lr: 1.0e-04 loss: 1.198e-01]hash_cache_v1:  62%|######2   | 1872/3000 [1:38:34<42:16,  2.25s/it, lr: 1.0e-04 loss: 1.198e-01]hash_cache_v1:  62%|######2   | 1872/3000 [1:38:34<42:16,  2.25s/it, lr: 1.0e-04 loss: 1.198e-01]hash_cache_v1:  62%|######2   | 1872/3000 [1:38:38<42:16,  2.25s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  62%|######2   | 1872/3000 [1:38:38<42:16,  2.25s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  62%|######2   | 1873/3000 [1:38:38<52:07,  2.77s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  62%|######2   | 1873/3000 [1:38:38<52:07,  2.77s/it, lr: 1.0e-04 loss: 1.362e-01]hash_cache_v1:  62%|######2   | 1873/3000 [1:38:41<52:07,  2.77s/it, lr: 1.0e-04 loss: 4.744e-02]hash_cache_v1:  62%|######2   | 1873/3000 [1:38:41<52:07,  2.77s/it, lr: 1.0e-04 loss: 4.744e-02]hash_cache_v1:  62%|######2   | 1874/3000 [1:38:41<50:06,  2.67s/it, lr: 1.0e-04 loss: 4.744e-02]hash_cache_v1:  62%|######2   | 1874/3000 [1:38:41<50:06,  2.67s/it, lr: 1.0e-04 loss: 4.744e-02]hash_cache_v1:  62%|######2   | 1874/3000 [1:38:44<50:06,  2.67s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  62%|######2   | 1874/3000 [1:38:44<50:06,  2.67s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  62%|######2   | 1875/3000 [1:38:44<50:55,  2.72s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  62%|######2   | 1875/3000 [1:38:44<50:55,  2.72s/it, lr: 1.0e-04 loss: 1.805e-01]hash_cache_v1:  62%|######2   | 1875/3000 [1:38:48<50:55,  2.72s/it, lr: 1.0e-04 loss: 1.488e-01]hash_cache_v1:  62%|######2   | 1875/3000 [1:38:48<50:55,  2.72s/it, lr: 1.0e-04 loss: 1.488e-01]hash_cache_v1:  63%|######2   | 1876/3000 [1:38:48<59:25,  3.17s/it, lr: 1.0e-04 loss: 1.488e-01]hash_cache_v1:  63%|######2   | 1876/3000 [1:38:48<59:25,  3.17s/it, lr: 1.0e-04 loss: 1.488e-01]hash_cache_v1:  63%|######2   | 1876/3000 [1:38:53<59:25,  3.17s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  63%|######2   | 1876/3000 [1:38:53<59:25,  3.17s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  63%|######2   | 1877/3000 [1:38:53<1:06:40,  3.56s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  63%|######2   | 1877/3000 [1:38:53<1:06:40,  3.56s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  63%|######2   | 1877/3000 [1:38:55<1:06:40,  3.56s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  63%|######2   | 1877/3000 [1:38:55<1:06:40,  3.56s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  63%|######2   | 1878/3000 [1:38:55<1:02:42,  3.35s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  63%|######2   | 1878/3000 [1:38:55<1:02:42,  3.35s/it, lr: 1.0e-04 loss: 1.606e-01]hash_cache_v1:  63%|######2   | 1878/3000 [1:38:58<1:02:42,  3.35s/it, lr: 1.0e-04 loss: 6.521e-02]hash_cache_v1:  63%|######2   | 1878/3000 [1:38:58<1:02:42,  3.35s/it, lr: 1.0e-04 loss: 6.521e-02]hash_cache_v1:  63%|######2   | 1879/3000 [1:38:58<1:00:01,  3.21s/it, lr: 1.0e-04 loss: 6.521e-02]hash_cache_v1:  63%|######2   | 1879/3000 [1:38:58<1:00:01,  3.21s/it, lr: 1.0e-04 loss: 6.521e-02]hash_cache_v1:  63%|######2   | 1879/3000 [1:39:00<1:00:01,  3.21s/it, lr: 1.0e-04 loss: 1.258e-01]hash_cache_v1:  63%|######2   | 1879/3000 [1:39:00<1:00:01,  3.21s/it, lr: 1.0e-04 loss: 1.258e-01]hash_cache_v1:  63%|######2   | 1880/3000 [1:39:05<59:58,  3.21s/it, lr: 1.0e-04 loss: 3.579e-03]  hash_cache_v1:  63%|######2   | 1880/3000 [1:39:05<59:58,  3.21s/it, lr: 1.0e-04 loss: 3.579e-03]  hash_cache_v1:  63%|######2   | 1881/3000 [1:39:05<51:43,  2.77s/it, lr: 1.0e-04 loss: 3.579e-03]hash_cache_v1:  63%|######2   | 1881/3000 [1:39:05<51:43,  2.77s/it, lr: 1.0e-04 loss: 3.579e-03]hash_cache_v1:  63%|######2   | 1881/3000 [1:39:09<51:43,  2.77s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  63%|######2   | 1881/3000 [1:39:09<51:43,  2.77s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  63%|######2   | 1882/3000 [1:39:09<58:33,  3.14s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  63%|######2   | 1882/3000 [1:39:09<58:33,  3.14s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  63%|######2   | 1882/3000 [1:39:12<58:33,  3.14s/it, lr: 1.0e-04 loss: 2.726e-02]hash_cache_v1:  63%|######2   | 1882/3000 [1:39:12<58:33,  3.14s/it, lr: 1.0e-04 loss: 2.726e-02]hash_cache_v1:  63%|######2   | 1883/3000 [1:39:12<57:02,  3.06s/it, lr: 1.0e-04 loss: 2.726e-02]hash_cache_v1:  63%|######2   | 1883/3000 [1:39:12<57:02,  3.06s/it, lr: 1.0e-04 loss: 2.726e-02]hash_cache_v1:  63%|######2   | 1883/3000 [1:39:15<57:02,  3.06s/it, lr: 1.0e-04 loss: 8.784e-02]hash_cache_v1:  63%|######2   | 1883/3000 [1:39:15<57:02,  3.06s/it, lr: 1.0e-04 loss: 8.784e-02]hash_cache_v1:  63%|######2   | 1884/3000 [1:39:15<57:10,  3.07s/it, lr: 1.0e-04 loss: 8.784e-02]hash_cache_v1:  63%|######2   | 1884/3000 [1:39:15<57:10,  3.07s/it, lr: 1.0e-04 loss: 8.784e-02]hash_cache_v1:  63%|######2   | 1884/3000 [1:39:19<57:10,  3.07s/it, lr: 1.0e-04 loss: 4.736e-02]hash_cache_v1:  63%|######2   | 1884/3000 [1:39:19<57:10,  3.07s/it, lr: 1.0e-04 loss: 4.736e-02]hash_cache_v1:  63%|######2   | 1885/3000 [1:39:19<1:03:34,  3.42s/it, lr: 1.0e-04 loss: 4.736e-02]hash_cache_v1:  63%|######2   | 1885/3000 [1:39:19<1:03:34,  3.42s/it, lr: 1.0e-04 loss: 4.736e-02]hash_cache_v1:  63%|######2   | 1885/3000 [1:39:22<1:03:34,  3.42s/it, lr: 1.0e-04 loss: 1.811e-01]hash_cache_v1:  63%|######2   | 1885/3000 [1:39:22<1:03:34,  3.42s/it, lr: 1.0e-04 loss: 1.811e-01]hash_cache_v1:  63%|######2   | 1886/3000 [1:39:22<56:32,  3.05s/it, lr: 1.0e-04 loss: 1.811e-01]  hash_cache_v1:  63%|######2   | 1886/3000 [1:39:22<56:32,  3.05s/it, lr: 1.0e-04 loss: 1.811e-01]  hash_cache_v1:  63%|######2   | 1886/3000 [1:39:26<56:32,  3.05s/it, lr: 1.0e-04 loss: 4.189e-02]hash_cache_v1:  63%|######2   | 1886/3000 [1:39:26<56:32,  3.05s/it, lr: 1.0e-04 loss: 4.189e-02]hash_cache_v1:  63%|######2   | 1887/3000 [1:39:26<1:03:17,  3.41s/it, lr: 1.0e-04 loss: 4.189e-02]hash_cache_v1:  63%|######2   | 1887/3000 [1:39:26<1:03:17,  3.41s/it, lr: 1.0e-04 loss: 4.189e-02]hash_cache_v1:  63%|######2   | 1887/3000 [1:39:28<1:03:17,  3.41s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  63%|######2   | 1887/3000 [1:39:28<1:03:17,  3.41s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  63%|######2   | 1888/3000 [1:39:28<57:41,  3.11s/it, lr: 1.0e-04 loss: 1.155e-01]  hash_cache_v1:  63%|######2   | 1888/3000 [1:39:28<57:41,  3.11s/it, lr: 1.0e-04 loss: 1.155e-01]  hash_cache_v1:  63%|######2   | 1888/3000 [1:39:30<57:41,  3.11s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  63%|######2   | 1888/3000 [1:39:30<57:41,  3.11s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  63%|######2   | 1889/3000 [1:39:30<52:06,  2.81s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  63%|######2   | 1889/3000 [1:39:30<52:06,  2.81s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  63%|######2   | 1889/3000 [1:39:35<52:06,  2.81s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  63%|######2   | 1889/3000 [1:39:35<52:06,  2.81s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  63%|######3   | 1890/3000 [1:39:39<52:03,  2.81s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  63%|######3   | 1890/3000 [1:39:39<52:03,  2.81s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  63%|######3   | 1891/3000 [1:39:39<46:17,  2.50s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  63%|######3   | 1891/3000 [1:39:39<46:17,  2.50s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  63%|######3   | 1891/3000 [1:39:44<46:17,  2.50s/it, lr: 1.0e-04 loss: 6.353e-02]hash_cache_v1:  63%|######3   | 1891/3000 [1:39:44<46:17,  2.50s/it, lr: 1.0e-04 loss: 6.353e-02]hash_cache_v1:  63%|######3   | 1892/3000 [1:39:44<55:56,  3.03s/it, lr: 1.0e-04 loss: 6.353e-02]hash_cache_v1:  63%|######3   | 1892/3000 [1:39:44<55:56,  3.03s/it, lr: 1.0e-04 loss: 6.353e-02]hash_cache_v1:  63%|######3   | 1892/3000 [1:39:46<55:56,  3.03s/it, lr: 1.0e-04 loss: 9.319e-02]hash_cache_v1:  63%|######3   | 1892/3000 [1:39:46<55:56,  3.03s/it, lr: 1.0e-04 loss: 9.319e-02]hash_cache_v1:  63%|######3   | 1893/3000 [1:39:46<51:24,  2.79s/it, lr: 1.0e-04 loss: 9.319e-02]hash_cache_v1:  63%|######3   | 1893/3000 [1:39:46<51:24,  2.79s/it, lr: 1.0e-04 loss: 9.319e-02]hash_cache_v1:  63%|######3   | 1893/3000 [1:39:50<51:24,  2.79s/it, lr: 1.0e-04 loss: 6.845e-02]hash_cache_v1:  63%|######3   | 1893/3000 [1:39:50<51:24,  2.79s/it, lr: 1.0e-04 loss: 6.845e-02]hash_cache_v1:  63%|######3   | 1894/3000 [1:39:50<58:59,  3.20s/it, lr: 1.0e-04 loss: 6.845e-02]hash_cache_v1:  63%|######3   | 1894/3000 [1:39:50<58:59,  3.20s/it, lr: 1.0e-04 loss: 6.845e-02]hash_cache_v1:  63%|######3   | 1894/3000 [1:39:55<58:59,  3.20s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  63%|######3   | 1894/3000 [1:39:55<58:59,  3.20s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  63%|######3   | 1895/3000 [1:39:55<1:05:24,  3.55s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  63%|######3   | 1895/3000 [1:39:55<1:05:24,  3.55s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  63%|######3   | 1895/3000 [1:39:58<1:05:24,  3.55s/it, lr: 1.0e-04 loss: 1.542e-01]hash_cache_v1:  63%|######3   | 1895/3000 [1:39:58<1:05:24,  3.55s/it, lr: 1.0e-04 loss: 1.542e-01]hash_cache_v1:  63%|######3   | 1896/3000 [1:39:58<1:01:36,  3.35s/it, lr: 1.0e-04 loss: 1.542e-01]hash_cache_v1:  63%|######3   | 1896/3000 [1:39:58<1:01:36,  3.35s/it, lr: 1.0e-04 loss: 1.542e-01]hash_cache_v1:  63%|######3   | 1896/3000 [1:40:00<1:01:36,  3.35s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  63%|######3   | 1896/3000 [1:40:00<1:01:36,  3.35s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  63%|######3   | 1897/3000 [1:40:00<59:02,  3.21s/it, lr: 1.0e-04 loss: 1.402e-01]  hash_cache_v1:  63%|######3   | 1897/3000 [1:40:00<59:02,  3.21s/it, lr: 1.0e-04 loss: 1.402e-01]  hash_cache_v1:  63%|######3   | 1897/3000 [1:40:03<59:02,  3.21s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  63%|######3   | 1897/3000 [1:40:03<59:02,  3.21s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  63%|######3   | 1898/3000 [1:40:03<57:22,  3.12s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  63%|######3   | 1898/3000 [1:40:03<57:22,  3.12s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  63%|######3   | 1898/3000 [1:40:08<57:22,  3.12s/it, lr: 1.0e-04 loss: 4.789e-02]hash_cache_v1:  63%|######3   | 1898/3000 [1:40:08<57:22,  3.12s/it, lr: 1.0e-04 loss: 4.789e-02]hash_cache_v1:  63%|######3   | 1899/3000 [1:40:08<1:04:15,  3.50s/it, lr: 1.0e-04 loss: 4.789e-02]hash_cache_v1:  63%|######3   | 1899/3000 [1:40:08<1:04:15,  3.50s/it, lr: 1.0e-04 loss: 4.789e-02]hash_cache_v1:  63%|######3   | 1899/3000 [1:40:10<1:04:15,  3.50s/it, lr: 1.0e-04 loss: 1.950e-01]hash_cache_v1:  63%|######3   | 1899/3000 [1:40:10<1:04:15,  3.50s/it, lr: 1.0e-04 loss: 1.950e-01]hash_cache_v1:  63%|######3   | 1900/3000 [1:40:13<1:04:11,  3.50s/it, lr: 1.0e-04 loss: 2.994e-03]hash_cache_v1:  63%|######3   | 1900/3000 [1:40:13<1:04:11,  3.50s/it, lr: 1.0e-04 loss: 2.994e-03]hash_cache_v1:  63%|######3   | 1901/3000 [1:40:13<46:40,  2.55s/it, lr: 1.0e-04 loss: 2.994e-03]  hash_cache_v1:  63%|######3   | 1901/3000 [1:40:13<46:40,  2.55s/it, lr: 1.0e-04 loss: 2.994e-03]  hash_cache_v1:  63%|######3   | 1901/3000 [1:40:15<46:40,  2.55s/it, lr: 1.0e-04 loss: 2.294e-01]hash_cache_v1:  63%|######3   | 1901/3000 [1:40:15<46:40,  2.55s/it, lr: 1.0e-04 loss: 2.294e-01]hash_cache_v1:  63%|######3   | 1902/3000 [1:40:15<44:39,  2.44s/it, lr: 1.0e-04 loss: 2.294e-01]hash_cache_v1:  63%|######3   | 1902/3000 [1:40:15<44:39,  2.44s/it, lr: 1.0e-04 loss: 2.294e-01]hash_cache_v1:  63%|######3   | 1902/3000 [1:40:17<44:39,  2.44s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  63%|######3   | 1902/3000 [1:40:17<44:39,  2.44s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  63%|######3   | 1903/3000 [1:40:17<44:19,  2.42s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  63%|######3   | 1903/3000 [1:40:17<44:19,  2.42s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  63%|######3   | 1903/3000 [1:40:20<44:19,  2.42s/it, lr: 1.0e-04 loss: 1.143e-01]hash_cache_v1:  63%|######3   | 1903/3000 [1:40:20<44:19,  2.42s/it, lr: 1.0e-04 loss: 1.143e-01]hash_cache_v1:  63%|######3   | 1904/3000 [1:40:20<46:23,  2.54s/it, lr: 1.0e-04 loss: 1.143e-01]hash_cache_v1:  63%|######3   | 1904/3000 [1:40:20<46:23,  2.54s/it, lr: 1.0e-04 loss: 1.143e-01]hash_cache_v1:  63%|######3   | 1904/3000 [1:40:23<46:23,  2.54s/it, lr: 1.0e-04 loss: 4.442e-02]hash_cache_v1:  63%|######3   | 1904/3000 [1:40:23<46:23,  2.54s/it, lr: 1.0e-04 loss: 4.442e-02]hash_cache_v1:  64%|######3   | 1905/3000 [1:40:23<47:51,  2.62s/it, lr: 1.0e-04 loss: 4.442e-02]hash_cache_v1:  64%|######3   | 1905/3000 [1:40:23<47:51,  2.62s/it, lr: 1.0e-04 loss: 4.442e-02]hash_cache_v1:  64%|######3   | 1905/3000 [1:40:27<47:51,  2.62s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  64%|######3   | 1905/3000 [1:40:27<47:51,  2.62s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  64%|######3   | 1906/3000 [1:40:27<57:41,  3.16s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  64%|######3   | 1906/3000 [1:40:27<57:41,  3.16s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  64%|######3   | 1906/3000 [1:40:29<57:41,  3.16s/it, lr: 1.0e-04 loss: 9.978e-02]hash_cache_v1:  64%|######3   | 1906/3000 [1:40:29<57:41,  3.16s/it, lr: 1.0e-04 loss: 9.978e-02]hash_cache_v1:  64%|######3   | 1907/3000 [1:40:29<52:11,  2.86s/it, lr: 1.0e-04 loss: 9.978e-02]hash_cache_v1:  64%|######3   | 1907/3000 [1:40:29<52:11,  2.86s/it, lr: 1.0e-04 loss: 9.978e-02]hash_cache_v1:  64%|######3   | 1907/3000 [1:40:32<52:11,  2.86s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  64%|######3   | 1907/3000 [1:40:32<52:11,  2.86s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  64%|######3   | 1908/3000 [1:40:32<52:16,  2.87s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  64%|######3   | 1908/3000 [1:40:32<52:16,  2.87s/it, lr: 1.0e-04 loss: 1.581e-01]hash_cache_v1:  64%|######3   | 1908/3000 [1:40:37<52:16,  2.87s/it, lr: 1.0e-04 loss: 6.133e-02]hash_cache_v1:  64%|######3   | 1908/3000 [1:40:37<52:16,  2.87s/it, lr: 1.0e-04 loss: 6.133e-02]hash_cache_v1:  64%|######3   | 1909/3000 [1:40:37<59:54,  3.29s/it, lr: 1.0e-04 loss: 6.133e-02]hash_cache_v1:  64%|######3   | 1909/3000 [1:40:37<59:54,  3.29s/it, lr: 1.0e-04 loss: 6.133e-02]hash_cache_v1:  64%|######3   | 1909/3000 [1:40:39<59:54,  3.29s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  64%|######3   | 1909/3000 [1:40:39<59:54,  3.29s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  64%|######3   | 1910/3000 [1:40:42<59:51,  3.29s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  64%|######3   | 1910/3000 [1:40:42<59:51,  3.29s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  64%|######3   | 1911/3000 [1:40:42<44:24,  2.45s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  64%|######3   | 1911/3000 [1:40:42<44:24,  2.45s/it, lr: 1.0e-04 loss: 1.455e-01]hash_cache_v1:  64%|######3   | 1911/3000 [1:40:44<44:24,  2.45s/it, lr: 1.0e-04 loss: 2.195e-01]hash_cache_v1:  64%|######3   | 1911/3000 [1:40:44<44:24,  2.45s/it, lr: 1.0e-04 loss: 2.195e-01]hash_cache_v1:  64%|######3   | 1912/3000 [1:40:44<42:52,  2.36s/it, lr: 1.0e-04 loss: 2.195e-01]hash_cache_v1:  64%|######3   | 1912/3000 [1:40:44<42:52,  2.36s/it, lr: 1.0e-04 loss: 2.195e-01]hash_cache_v1:  64%|######3   | 1912/3000 [1:40:46<42:52,  2.36s/it, lr: 1.0e-04 loss: 2.088e-01]hash_cache_v1:  64%|######3   | 1912/3000 [1:40:46<42:52,  2.36s/it, lr: 1.0e-04 loss: 2.088e-01]hash_cache_v1:  64%|######3   | 1913/3000 [1:40:46<41:39,  2.30s/it, lr: 1.0e-04 loss: 2.088e-01]hash_cache_v1:  64%|######3   | 1913/3000 [1:40:46<41:39,  2.30s/it, lr: 1.0e-04 loss: 2.088e-01]hash_cache_v1:  64%|######3   | 1913/3000 [1:40:49<41:39,  2.30s/it, lr: 1.0e-04 loss: 9.493e-02]hash_cache_v1:  64%|######3   | 1913/3000 [1:40:49<41:39,  2.30s/it, lr: 1.0e-04 loss: 9.493e-02]hash_cache_v1:  64%|######3   | 1914/3000 [1:40:49<45:32,  2.52s/it, lr: 1.0e-04 loss: 9.493e-02]hash_cache_v1:  64%|######3   | 1914/3000 [1:40:49<45:32,  2.52s/it, lr: 1.0e-04 loss: 9.493e-02]hash_cache_v1:  64%|######3   | 1914/3000 [1:40:54<45:32,  2.52s/it, lr: 1.0e-04 loss: 4.709e-02]hash_cache_v1:  64%|######3   | 1914/3000 [1:40:54<45:32,  2.52s/it, lr: 1.0e-04 loss: 4.709e-02]hash_cache_v1:  64%|######3   | 1915/3000 [1:40:54<54:23,  3.01s/it, lr: 1.0e-04 loss: 4.709e-02]hash_cache_v1:  64%|######3   | 1915/3000 [1:40:54<54:23,  3.01s/it, lr: 1.0e-04 loss: 4.709e-02]hash_cache_v1:  64%|######3   | 1915/3000 [1:40:58<54:23,  3.01s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  64%|######3   | 1915/3000 [1:40:58<54:23,  3.01s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  64%|######3   | 1916/3000 [1:40:58<1:00:47,  3.36s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  64%|######3   | 1916/3000 [1:40:58<1:00:47,  3.36s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  64%|######3   | 1916/3000 [1:41:01<1:00:47,  3.36s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  64%|######3   | 1916/3000 [1:41:01<1:00:47,  3.36s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  64%|######3   | 1917/3000 [1:41:01<59:02,  3.27s/it, lr: 1.0e-04 loss: 1.267e-01]  hash_cache_v1:  64%|######3   | 1917/3000 [1:41:01<59:02,  3.27s/it, lr: 1.0e-04 loss: 1.267e-01]  hash_cache_v1:  64%|######3   | 1917/3000 [1:41:03<59:02,  3.27s/it, lr: 1.0e-04 loss: 9.500e-02]hash_cache_v1:  64%|######3   | 1917/3000 [1:41:03<59:02,  3.27s/it, lr: 1.0e-04 loss: 9.500e-02]hash_cache_v1:  64%|######3   | 1918/3000 [1:41:03<52:45,  2.93s/it, lr: 1.0e-04 loss: 9.500e-02]hash_cache_v1:  64%|######3   | 1918/3000 [1:41:03<52:45,  2.93s/it, lr: 1.0e-04 loss: 9.500e-02]hash_cache_v1:  64%|######3   | 1918/3000 [1:41:05<52:45,  2.93s/it, lr: 1.0e-04 loss: 1.933e-01]hash_cache_v1:  64%|######3   | 1918/3000 [1:41:05<52:45,  2.93s/it, lr: 1.0e-04 loss: 1.933e-01]hash_cache_v1:  64%|######3   | 1919/3000 [1:41:05<48:20,  2.68s/it, lr: 1.0e-04 loss: 1.933e-01]hash_cache_v1:  64%|######3   | 1919/3000 [1:41:05<48:20,  2.68s/it, lr: 1.0e-04 loss: 1.933e-01]hash_cache_v1:  64%|######3   | 1919/3000 [1:41:08<48:20,  2.68s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  64%|######3   | 1919/3000 [1:41:08<48:20,  2.68s/it, lr: 1.0e-04 loss: 1.713e-01]hash_cache_v1:  64%|######4   | 1920/3000 [1:41:10<48:17,  2.68s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  64%|######4   | 1920/3000 [1:41:10<48:17,  2.68s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  64%|######4   | 1921/3000 [1:41:10<35:57,  2.00s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  64%|######4   | 1921/3000 [1:41:10<35:57,  2.00s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  64%|######4   | 1921/3000 [1:41:15<35:57,  2.00s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  64%|######4   | 1921/3000 [1:41:15<35:57,  2.00s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  64%|######4   | 1922/3000 [1:41:15<45:54,  2.55s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  64%|######4   | 1922/3000 [1:41:15<45:54,  2.55s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  64%|######4   | 1922/3000 [1:41:17<45:54,  2.55s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  64%|######4   | 1922/3000 [1:41:17<45:54,  2.55s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  64%|######4   | 1923/3000 [1:41:17<43:41,  2.43s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  64%|######4   | 1923/3000 [1:41:17<43:41,  2.43s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  64%|######4   | 1923/3000 [1:41:19<43:41,  2.43s/it, lr: 1.0e-04 loss: 1.655e-01]hash_cache_v1:  64%|######4   | 1923/3000 [1:41:19<43:41,  2.43s/it, lr: 1.0e-04 loss: 1.655e-01]hash_cache_v1:  64%|######4   | 1924/3000 [1:41:19<43:20,  2.42s/it, lr: 1.0e-04 loss: 1.655e-01]hash_cache_v1:  64%|######4   | 1924/3000 [1:41:19<43:20,  2.42s/it, lr: 1.0e-04 loss: 1.655e-01]hash_cache_v1:  64%|######4   | 1924/3000 [1:41:23<43:20,  2.42s/it, lr: 1.0e-04 loss: 2.579e-02]hash_cache_v1:  64%|######4   | 1924/3000 [1:41:23<43:20,  2.42s/it, lr: 1.0e-04 loss: 2.579e-02]hash_cache_v1:  64%|######4   | 1925/3000 [1:41:23<52:50,  2.95s/it, lr: 1.0e-04 loss: 2.579e-02]hash_cache_v1:  64%|######4   | 1925/3000 [1:41:23<52:50,  2.95s/it, lr: 1.0e-04 loss: 2.579e-02]hash_cache_v1:  64%|######4   | 1925/3000 [1:41:28<52:50,  2.95s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  64%|######4   | 1925/3000 [1:41:28<52:50,  2.95s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  64%|######4   | 1926/3000 [1:41:28<59:54,  3.35s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  64%|######4   | 1926/3000 [1:41:28<59:54,  3.35s/it, lr: 1.0e-04 loss: 1.402e-01]hash_cache_v1:  64%|######4   | 1926/3000 [1:41:32<59:54,  3.35s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  64%|######4   | 1926/3000 [1:41:32<59:54,  3.35s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  64%|######4   | 1927/3000 [1:41:32<1:04:54,  3.63s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  64%|######4   | 1927/3000 [1:41:32<1:04:54,  3.63s/it, lr: 1.0e-04 loss: 1.177e-01]hash_cache_v1:  64%|######4   | 1927/3000 [1:41:35<1:04:54,  3.63s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  64%|######4   | 1927/3000 [1:41:35<1:04:54,  3.63s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  64%|######4   | 1928/3000 [1:41:35<1:01:56,  3.47s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  64%|######4   | 1928/3000 [1:41:35<1:01:56,  3.47s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  64%|######4   | 1928/3000 [1:41:39<1:01:56,  3.47s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  64%|######4   | 1928/3000 [1:41:39<1:01:56,  3.47s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  64%|######4   | 1929/3000 [1:41:39<1:06:16,  3.71s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  64%|######4   | 1929/3000 [1:41:39<1:06:16,  3.71s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  64%|######4   | 1929/3000 [1:41:42<1:06:16,  3.71s/it, lr: 1.0e-04 loss: 1.489e-01]hash_cache_v1:  64%|######4   | 1929/3000 [1:41:42<1:06:16,  3.71s/it, lr: 1.0e-04 loss: 1.489e-01]hash_cache_v1:  64%|######4   | 1930/3000 [1:41:47<1:06:12,  3.71s/it, lr: 1.0e-04 loss: 1.282e-01]hash_cache_v1:  64%|######4   | 1930/3000 [1:41:47<1:06:12,  3.71s/it, lr: 1.0e-04 loss: 1.282e-01]hash_cache_v1:  64%|######4   | 1931/3000 [1:41:47<53:30,  3.00s/it, lr: 1.0e-04 loss: 1.282e-01]  hash_cache_v1:  64%|######4   | 1931/3000 [1:41:47<53:30,  3.00s/it, lr: 1.0e-04 loss: 1.282e-01]  hash_cache_v1:  64%|######4   | 1931/3000 [1:41:51<53:30,  3.00s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  64%|######4   | 1931/3000 [1:41:51<53:30,  3.00s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  64%|######4   | 1932/3000 [1:41:51<1:00:07,  3.38s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  64%|######4   | 1932/3000 [1:41:51<1:00:07,  3.38s/it, lr: 1.0e-04 loss: 1.418e-01]hash_cache_v1:  64%|######4   | 1932/3000 [1:41:55<1:00:07,  3.38s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  64%|######4   | 1932/3000 [1:41:55<1:00:07,  3.38s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  64%|######4   | 1933/3000 [1:41:55<1:04:23,  3.62s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  64%|######4   | 1933/3000 [1:41:55<1:04:23,  3.62s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  64%|######4   | 1933/3000 [1:42:00<1:04:23,  3.62s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  64%|######4   | 1933/3000 [1:42:00<1:04:23,  3.62s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  64%|######4   | 1934/3000 [1:42:00<1:07:43,  3.81s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  64%|######4   | 1934/3000 [1:42:00<1:07:43,  3.81s/it, lr: 1.0e-04 loss: 1.851e-01]hash_cache_v1:  64%|######4   | 1934/3000 [1:42:04<1:07:43,  3.81s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  64%|######4   | 1934/3000 [1:42:04<1:07:43,  3.81s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  64%|######4   | 1935/3000 [1:42:04<1:11:11,  4.01s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  64%|######4   | 1935/3000 [1:42:04<1:11:11,  4.01s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  64%|######4   | 1935/3000 [1:42:06<1:11:11,  4.01s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  64%|######4   | 1935/3000 [1:42:06<1:11:11,  4.01s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  65%|######4   | 1936/3000 [1:42:06<1:01:32,  3.47s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  65%|######4   | 1936/3000 [1:42:06<1:01:32,  3.47s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  65%|######4   | 1936/3000 [1:42:09<1:01:32,  3.47s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######4   | 1936/3000 [1:42:09<1:01:32,  3.47s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######4   | 1937/3000 [1:42:09<58:32,  3.30s/it, lr: 1.0e-04 loss: 1.278e-01]  hash_cache_v1:  65%|######4   | 1937/3000 [1:42:09<58:32,  3.30s/it, lr: 1.0e-04 loss: 1.278e-01]  hash_cache_v1:  65%|######4   | 1937/3000 [1:42:13<58:32,  3.30s/it, lr: 1.0e-04 loss: 4.981e-02]hash_cache_v1:  65%|######4   | 1937/3000 [1:42:13<58:32,  3.30s/it, lr: 1.0e-04 loss: 4.981e-02]hash_cache_v1:  65%|######4   | 1938/3000 [1:42:13<1:03:13,  3.57s/it, lr: 1.0e-04 loss: 4.981e-02]hash_cache_v1:  65%|######4   | 1938/3000 [1:42:13<1:03:13,  3.57s/it, lr: 1.0e-04 loss: 4.981e-02]hash_cache_v1:  65%|######4   | 1938/3000 [1:42:17<1:03:13,  3.57s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  65%|######4   | 1938/3000 [1:42:17<1:03:13,  3.57s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  65%|######4   | 1939/3000 [1:42:17<1:00:41,  3.43s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  65%|######4   | 1939/3000 [1:42:17<1:00:41,  3.43s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  65%|######4   | 1939/3000 [1:42:21<1:00:41,  3.43s/it, lr: 1.0e-04 loss: 9.561e-02]hash_cache_v1:  65%|######4   | 1939/3000 [1:42:21<1:00:41,  3.43s/it, lr: 1.0e-04 loss: 9.561e-02]hash_cache_v1:  65%|######4   | 1940/3000 [1:42:23<1:00:38,  3.43s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  65%|######4   | 1940/3000 [1:42:23<1:00:38,  3.43s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  65%|######4   | 1941/3000 [1:42:23<41:25,  2.35s/it, lr: 1.0e-04 loss: 1.547e-01]  hash_cache_v1:  65%|######4   | 1941/3000 [1:42:23<41:25,  2.35s/it, lr: 1.0e-04 loss: 1.547e-01]  hash_cache_v1:  65%|######4   | 1941/3000 [1:42:26<41:25,  2.35s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  65%|######4   | 1941/3000 [1:42:26<41:25,  2.35s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  65%|######4   | 1942/3000 [1:42:26<43:41,  2.48s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  65%|######4   | 1942/3000 [1:42:26<43:41,  2.48s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  65%|######4   | 1942/3000 [1:42:30<43:41,  2.48s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  65%|######4   | 1942/3000 [1:42:30<43:41,  2.48s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  65%|######4   | 1943/3000 [1:42:30<53:02,  3.01s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  65%|######4   | 1943/3000 [1:42:30<53:02,  3.01s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  65%|######4   | 1943/3000 [1:42:33<53:02,  3.01s/it, lr: 1.0e-04 loss: 8.267e-02]hash_cache_v1:  65%|######4   | 1943/3000 [1:42:33<53:02,  3.01s/it, lr: 1.0e-04 loss: 8.267e-02]hash_cache_v1:  65%|######4   | 1944/3000 [1:42:33<52:09,  2.96s/it, lr: 1.0e-04 loss: 8.267e-02]hash_cache_v1:  65%|######4   | 1944/3000 [1:42:33<52:09,  2.96s/it, lr: 1.0e-04 loss: 8.267e-02]hash_cache_v1:  65%|######4   | 1944/3000 [1:42:36<52:09,  2.96s/it, lr: 1.0e-04 loss: 7.042e-02]hash_cache_v1:  65%|######4   | 1944/3000 [1:42:36<52:09,  2.96s/it, lr: 1.0e-04 loss: 7.042e-02]hash_cache_v1:  65%|######4   | 1945/3000 [1:42:36<51:41,  2.94s/it, lr: 1.0e-04 loss: 7.042e-02]hash_cache_v1:  65%|######4   | 1945/3000 [1:42:36<51:41,  2.94s/it, lr: 1.0e-04 loss: 7.042e-02]hash_cache_v1:  65%|######4   | 1945/3000 [1:42:38<51:41,  2.94s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  65%|######4   | 1945/3000 [1:42:38<51:41,  2.94s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  65%|######4   | 1946/3000 [1:42:38<49:03,  2.79s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  65%|######4   | 1946/3000 [1:42:38<49:03,  2.79s/it, lr: 1.0e-04 loss: 1.773e-01]hash_cache_v1:  65%|######4   | 1946/3000 [1:42:41<49:03,  2.79s/it, lr: 1.0e-04 loss: 5.178e-04]hash_cache_v1:  65%|######4   | 1946/3000 [1:42:41<49:03,  2.79s/it, lr: 1.0e-04 loss: 5.178e-04]hash_cache_v1:  65%|######4   | 1947/3000 [1:42:41<45:35,  2.60s/it, lr: 1.0e-04 loss: 5.178e-04]hash_cache_v1:  65%|######4   | 1947/3000 [1:42:41<45:35,  2.60s/it, lr: 1.0e-04 loss: 5.178e-04]hash_cache_v1:  65%|######4   | 1947/3000 [1:42:43<45:35,  2.60s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  65%|######4   | 1947/3000 [1:42:43<45:35,  2.60s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  65%|######4   | 1948/3000 [1:42:43<46:45,  2.67s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  65%|######4   | 1948/3000 [1:42:43<46:45,  2.67s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  65%|######4   | 1948/3000 [1:42:45<46:45,  2.67s/it, lr: 1.0e-04 loss: 6.610e-02]hash_cache_v1:  65%|######4   | 1948/3000 [1:42:45<46:45,  2.67s/it, lr: 1.0e-04 loss: 6.610e-02]hash_cache_v1:  65%|######4   | 1949/3000 [1:42:45<43:50,  2.50s/it, lr: 1.0e-04 loss: 6.610e-02]hash_cache_v1:  65%|######4   | 1949/3000 [1:42:45<43:50,  2.50s/it, lr: 1.0e-04 loss: 6.610e-02]hash_cache_v1:  65%|######4   | 1949/3000 [1:42:50<43:50,  2.50s/it, lr: 1.0e-04 loss: 9.892e-02]hash_cache_v1:  65%|######4   | 1949/3000 [1:42:50<43:50,  2.50s/it, lr: 1.0e-04 loss: 9.892e-02]hash_cache_v1:  65%|######5   | 1950/3000 [1:42:53<43:48,  2.50s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1950/3000 [1:42:53<43:48,  2.50s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1951/3000 [1:42:53<35:07,  2.01s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1951/3000 [1:42:53<35:07,  2.01s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1951/3000 [1:42:56<35:07,  2.01s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  65%|######5   | 1951/3000 [1:42:56<35:07,  2.01s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  65%|######5   | 1952/3000 [1:42:56<38:49,  2.22s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  65%|######5   | 1952/3000 [1:42:56<38:49,  2.22s/it, lr: 1.0e-04 loss: 1.215e-01]hash_cache_v1:  65%|######5   | 1952/3000 [1:43:00<38:49,  2.22s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  65%|######5   | 1952/3000 [1:43:00<38:49,  2.22s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  65%|######5   | 1953/3000 [1:43:00<48:14,  2.76s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  65%|######5   | 1953/3000 [1:43:00<48:14,  2.76s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  65%|######5   | 1953/3000 [1:43:05<48:14,  2.76s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  65%|######5   | 1953/3000 [1:43:05<48:14,  2.76s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  65%|######5   | 1954/3000 [1:43:05<56:38,  3.25s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  65%|######5   | 1954/3000 [1:43:05<56:38,  3.25s/it, lr: 1.0e-04 loss: 1.452e-01]hash_cache_v1:  65%|######5   | 1954/3000 [1:43:07<56:38,  3.25s/it, lr: 1.0e-04 loss: 5.661e-02]hash_cache_v1:  65%|######5   | 1954/3000 [1:43:07<56:38,  3.25s/it, lr: 1.0e-04 loss: 5.661e-02]hash_cache_v1:  65%|######5   | 1955/3000 [1:43:07<51:03,  2.93s/it, lr: 1.0e-04 loss: 5.661e-02]hash_cache_v1:  65%|######5   | 1955/3000 [1:43:07<51:03,  2.93s/it, lr: 1.0e-04 loss: 5.661e-02]hash_cache_v1:  65%|######5   | 1955/3000 [1:43:09<51:03,  2.93s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1955/3000 [1:43:09<51:03,  2.93s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1956/3000 [1:43:09<46:59,  2.70s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1956/3000 [1:43:09<46:59,  2.70s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  65%|######5   | 1956/3000 [1:43:12<46:59,  2.70s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  65%|######5   | 1956/3000 [1:43:12<46:59,  2.70s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  65%|######5   | 1957/3000 [1:43:12<48:52,  2.81s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  65%|######5   | 1957/3000 [1:43:12<48:52,  2.81s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  65%|######5   | 1957/3000 [1:43:15<48:52,  2.81s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  65%|######5   | 1957/3000 [1:43:15<48:52,  2.81s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  65%|######5   | 1958/3000 [1:43:15<48:33,  2.80s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  65%|######5   | 1958/3000 [1:43:15<48:33,  2.80s/it, lr: 1.0e-04 loss: 1.357e-01]hash_cache_v1:  65%|######5   | 1958/3000 [1:43:18<48:33,  2.80s/it, lr: 1.0e-04 loss: 3.452e-02]hash_cache_v1:  65%|######5   | 1958/3000 [1:43:18<48:33,  2.80s/it, lr: 1.0e-04 loss: 3.452e-02]hash_cache_v1:  65%|######5   | 1959/3000 [1:43:18<48:55,  2.82s/it, lr: 1.0e-04 loss: 3.452e-02]hash_cache_v1:  65%|######5   | 1959/3000 [1:43:18<48:55,  2.82s/it, lr: 1.0e-04 loss: 3.452e-02]hash_cache_v1:  65%|######5   | 1959/3000 [1:43:20<48:55,  2.82s/it, lr: 1.0e-04 loss: 5.589e-02]hash_cache_v1:  65%|######5   | 1959/3000 [1:43:20<48:55,  2.82s/it, lr: 1.0e-04 loss: 5.589e-02]hash_cache_v1:  65%|######5   | 1960/3000 [1:43:22<48:52,  2.82s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  65%|######5   | 1960/3000 [1:43:22<48:52,  2.82s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  65%|######5   | 1961/3000 [1:43:22<35:52,  2.07s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  65%|######5   | 1961/3000 [1:43:22<35:52,  2.07s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  65%|######5   | 1961/3000 [1:43:26<35:52,  2.07s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  65%|######5   | 1961/3000 [1:43:26<35:52,  2.07s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  65%|######5   | 1962/3000 [1:43:26<45:31,  2.63s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  65%|######5   | 1962/3000 [1:43:26<45:31,  2.63s/it, lr: 1.0e-04 loss: 1.520e-01]hash_cache_v1:  65%|######5   | 1962/3000 [1:43:29<45:31,  2.63s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  65%|######5   | 1962/3000 [1:43:29<45:31,  2.63s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  65%|######5   | 1963/3000 [1:43:29<46:34,  2.70s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  65%|######5   | 1963/3000 [1:43:29<46:34,  2.70s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  65%|######5   | 1963/3000 [1:43:34<46:34,  2.70s/it, lr: 1.0e-04 loss: 3.818e-02]hash_cache_v1:  65%|######5   | 1963/3000 [1:43:34<46:34,  2.70s/it, lr: 1.0e-04 loss: 3.818e-02]hash_cache_v1:  65%|######5   | 1964/3000 [1:43:34<54:14,  3.14s/it, lr: 1.0e-04 loss: 3.818e-02]hash_cache_v1:  65%|######5   | 1964/3000 [1:43:34<54:14,  3.14s/it, lr: 1.0e-04 loss: 3.818e-02]hash_cache_v1:  65%|######5   | 1964/3000 [1:43:37<54:14,  3.14s/it, lr: 1.0e-04 loss: 7.804e-02]hash_cache_v1:  65%|######5   | 1964/3000 [1:43:37<54:14,  3.14s/it, lr: 1.0e-04 loss: 7.804e-02]hash_cache_v1:  66%|######5   | 1965/3000 [1:43:37<54:12,  3.14s/it, lr: 1.0e-04 loss: 7.804e-02]hash_cache_v1:  66%|######5   | 1965/3000 [1:43:37<54:12,  3.14s/it, lr: 1.0e-04 loss: 7.804e-02]hash_cache_v1:  66%|######5   | 1965/3000 [1:43:40<54:12,  3.14s/it, lr: 1.0e-04 loss: 4.586e-02]hash_cache_v1:  66%|######5   | 1965/3000 [1:43:40<54:12,  3.14s/it, lr: 1.0e-04 loss: 4.586e-02]hash_cache_v1:  66%|######5   | 1966/3000 [1:43:40<52:36,  3.05s/it, lr: 1.0e-04 loss: 4.586e-02]hash_cache_v1:  66%|######5   | 1966/3000 [1:43:40<52:36,  3.05s/it, lr: 1.0e-04 loss: 4.586e-02]hash_cache_v1:  66%|######5   | 1966/3000 [1:43:42<52:36,  3.05s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  66%|######5   | 1966/3000 [1:43:42<52:36,  3.05s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  66%|######5   | 1967/3000 [1:43:42<47:45,  2.77s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  66%|######5   | 1967/3000 [1:43:42<47:45,  2.77s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  66%|######5   | 1967/3000 [1:43:45<47:45,  2.77s/it, lr: 1.0e-04 loss: 3.170e-02]hash_cache_v1:  66%|######5   | 1967/3000 [1:43:45<47:45,  2.77s/it, lr: 1.0e-04 loss: 3.170e-02]hash_cache_v1:  66%|######5   | 1968/3000 [1:43:45<49:20,  2.87s/it, lr: 1.0e-04 loss: 3.170e-02]hash_cache_v1:  66%|######5   | 1968/3000 [1:43:45<49:20,  2.87s/it, lr: 1.0e-04 loss: 3.170e-02]hash_cache_v1:  66%|######5   | 1968/3000 [1:43:49<49:20,  2.87s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  66%|######5   | 1968/3000 [1:43:49<49:20,  2.87s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  66%|######5   | 1969/3000 [1:43:49<56:24,  3.28s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  66%|######5   | 1969/3000 [1:43:49<56:24,  3.28s/it, lr: 1.0e-04 loss: 8.757e-02]hash_cache_v1:  66%|######5   | 1969/3000 [1:43:51<56:24,  3.28s/it, lr: 1.0e-04 loss: 2.089e-01]hash_cache_v1:  66%|######5   | 1969/3000 [1:43:51<56:24,  3.28s/it, lr: 1.0e-04 loss: 2.089e-01]hash_cache_v1:  66%|######5   | 1970/3000 [1:43:55<56:20,  3.28s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  66%|######5   | 1970/3000 [1:43:55<56:20,  3.28s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  66%|######5   | 1971/3000 [1:43:55<47:32,  2.77s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  66%|######5   | 1971/3000 [1:43:55<47:32,  2.77s/it, lr: 1.0e-04 loss: 1.587e-01]hash_cache_v1:  66%|######5   | 1971/3000 [1:43:58<47:32,  2.77s/it, lr: 1.0e-04 loss: 8.187e-02]hash_cache_v1:  66%|######5   | 1971/3000 [1:43:58<47:32,  2.77s/it, lr: 1.0e-04 loss: 8.187e-02]hash_cache_v1:  66%|######5   | 1972/3000 [1:43:58<45:44,  2.67s/it, lr: 1.0e-04 loss: 8.187e-02]hash_cache_v1:  66%|######5   | 1972/3000 [1:43:58<45:44,  2.67s/it, lr: 1.0e-04 loss: 8.187e-02]hash_cache_v1:  66%|######5   | 1972/3000 [1:44:00<45:44,  2.67s/it, lr: 1.0e-04 loss: 1.240e-01]hash_cache_v1:  66%|######5   | 1972/3000 [1:44:00<45:44,  2.67s/it, lr: 1.0e-04 loss: 1.240e-01]hash_cache_v1:  66%|######5   | 1973/3000 [1:44:00<43:13,  2.53s/it, lr: 1.0e-04 loss: 1.240e-01]hash_cache_v1:  66%|######5   | 1973/3000 [1:44:00<43:13,  2.53s/it, lr: 1.0e-04 loss: 1.240e-01]hash_cache_v1:  66%|######5   | 1973/3000 [1:44:03<43:13,  2.53s/it, lr: 1.0e-04 loss: 4.181e-02]hash_cache_v1:  66%|######5   | 1973/3000 [1:44:03<43:13,  2.53s/it, lr: 1.0e-04 loss: 4.181e-02]hash_cache_v1:  66%|######5   | 1974/3000 [1:44:03<44:45,  2.62s/it, lr: 1.0e-04 loss: 4.181e-02]hash_cache_v1:  66%|######5   | 1974/3000 [1:44:03<44:45,  2.62s/it, lr: 1.0e-04 loss: 4.181e-02]hash_cache_v1:  66%|######5   | 1974/3000 [1:44:05<44:45,  2.62s/it, lr: 1.0e-04 loss: 8.487e-02]hash_cache_v1:  66%|######5   | 1974/3000 [1:44:05<44:45,  2.62s/it, lr: 1.0e-04 loss: 8.487e-02]hash_cache_v1:  66%|######5   | 1975/3000 [1:44:05<43:35,  2.55s/it, lr: 1.0e-04 loss: 8.487e-02]hash_cache_v1:  66%|######5   | 1975/3000 [1:44:05<43:35,  2.55s/it, lr: 1.0e-04 loss: 8.487e-02]hash_cache_v1:  66%|######5   | 1975/3000 [1:44:08<43:35,  2.55s/it, lr: 1.0e-04 loss: 1.731e-01]hash_cache_v1:  66%|######5   | 1975/3000 [1:44:08<43:35,  2.55s/it, lr: 1.0e-04 loss: 1.731e-01]hash_cache_v1:  66%|######5   | 1976/3000 [1:44:08<45:08,  2.64s/it, lr: 1.0e-04 loss: 1.731e-01]hash_cache_v1:  66%|######5   | 1976/3000 [1:44:08<45:08,  2.64s/it, lr: 1.0e-04 loss: 1.731e-01]hash_cache_v1:  66%|######5   | 1976/3000 [1:44:10<45:08,  2.64s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  66%|######5   | 1976/3000 [1:44:10<45:08,  2.64s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  66%|######5   | 1977/3000 [1:44:10<42:22,  2.49s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  66%|######5   | 1977/3000 [1:44:10<42:22,  2.49s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  66%|######5   | 1977/3000 [1:44:12<42:22,  2.49s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  66%|######5   | 1977/3000 [1:44:12<42:22,  2.49s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  66%|######5   | 1978/3000 [1:44:12<40:24,  2.37s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  66%|######5   | 1978/3000 [1:44:12<40:24,  2.37s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  66%|######5   | 1978/3000 [1:44:15<40:24,  2.37s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  66%|######5   | 1978/3000 [1:44:15<40:24,  2.37s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  66%|######5   | 1979/3000 [1:44:15<40:25,  2.38s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  66%|######5   | 1979/3000 [1:44:15<40:25,  2.38s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  66%|######5   | 1979/3000 [1:44:18<40:25,  2.38s/it, lr: 1.0e-04 loss: 8.075e-02]hash_cache_v1:  66%|######5   | 1979/3000 [1:44:18<40:25,  2.38s/it, lr: 1.0e-04 loss: 8.075e-02]hash_cache_v1:  66%|######6   | 1980/3000 [1:44:22<40:22,  2.38s/it, lr: 1.0e-04 loss: 1.284e-02]hash_cache_v1:  66%|######6   | 1980/3000 [1:44:22<40:22,  2.38s/it, lr: 1.0e-04 loss: 1.284e-02]hash_cache_v1:  66%|######6   | 1981/3000 [1:44:22<38:27,  2.26s/it, lr: 1.0e-04 loss: 1.284e-02]hash_cache_v1:  66%|######6   | 1981/3000 [1:44:22<38:27,  2.26s/it, lr: 1.0e-04 loss: 1.284e-02]hash_cache_v1:  66%|######6   | 1981/3000 [1:44:25<38:27,  2.26s/it, lr: 1.0e-04 loss: 7.776e-02]hash_cache_v1:  66%|######6   | 1981/3000 [1:44:25<38:27,  2.26s/it, lr: 1.0e-04 loss: 7.776e-02]hash_cache_v1:  66%|######6   | 1982/3000 [1:44:25<42:16,  2.49s/it, lr: 1.0e-04 loss: 7.776e-02]hash_cache_v1:  66%|######6   | 1982/3000 [1:44:25<42:16,  2.49s/it, lr: 1.0e-04 loss: 7.776e-02]hash_cache_v1:  66%|######6   | 1982/3000 [1:44:29<42:16,  2.49s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  66%|######6   | 1982/3000 [1:44:29<42:16,  2.49s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  66%|######6   | 1983/3000 [1:44:29<50:13,  2.96s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  66%|######6   | 1983/3000 [1:44:29<50:13,  2.96s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  66%|######6   | 1983/3000 [1:44:32<50:13,  2.96s/it, lr: 1.0e-04 loss: 7.771e-02]hash_cache_v1:  66%|######6   | 1983/3000 [1:44:32<50:13,  2.96s/it, lr: 1.0e-04 loss: 7.771e-02]hash_cache_v1:  66%|######6   | 1984/3000 [1:44:32<46:09,  2.73s/it, lr: 1.0e-04 loss: 7.771e-02]hash_cache_v1:  66%|######6   | 1984/3000 [1:44:32<46:09,  2.73s/it, lr: 1.0e-04 loss: 7.771e-02]hash_cache_v1:  66%|######6   | 1984/3000 [1:44:36<46:09,  2.73s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  66%|######6   | 1984/3000 [1:44:36<46:09,  2.73s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  66%|######6   | 1985/3000 [1:44:36<53:22,  3.16s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  66%|######6   | 1985/3000 [1:44:36<53:22,  3.16s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  66%|######6   | 1985/3000 [1:44:39<53:22,  3.16s/it, lr: 1.0e-04 loss: 8.870e-02]hash_cache_v1:  66%|######6   | 1985/3000 [1:44:39<53:22,  3.16s/it, lr: 1.0e-04 loss: 8.870e-02]hash_cache_v1:  66%|######6   | 1986/3000 [1:44:39<53:00,  3.14s/it, lr: 1.0e-04 loss: 8.870e-02]hash_cache_v1:  66%|######6   | 1986/3000 [1:44:39<53:00,  3.14s/it, lr: 1.0e-04 loss: 8.870e-02]hash_cache_v1:  66%|######6   | 1986/3000 [1:44:43<53:00,  3.14s/it, lr: 1.0e-04 loss: 9.915e-02]hash_cache_v1:  66%|######6   | 1986/3000 [1:44:43<53:00,  3.14s/it, lr: 1.0e-04 loss: 9.915e-02]hash_cache_v1:  66%|######6   | 1987/3000 [1:44:43<58:38,  3.47s/it, lr: 1.0e-04 loss: 9.915e-02]hash_cache_v1:  66%|######6   | 1987/3000 [1:44:43<58:38,  3.47s/it, lr: 1.0e-04 loss: 9.915e-02]hash_cache_v1:  66%|######6   | 1987/3000 [1:44:46<58:38,  3.47s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  66%|######6   | 1987/3000 [1:44:46<58:38,  3.47s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  66%|######6   | 1988/3000 [1:44:46<55:25,  3.29s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  66%|######6   | 1988/3000 [1:44:46<55:25,  3.29s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  66%|######6   | 1988/3000 [1:44:48<55:25,  3.29s/it, lr: 1.0e-04 loss: 8.821e-02]hash_cache_v1:  66%|######6   | 1988/3000 [1:44:48<55:25,  3.29s/it, lr: 1.0e-04 loss: 8.821e-02]hash_cache_v1:  66%|######6   | 1989/3000 [1:44:48<49:24,  2.93s/it, lr: 1.0e-04 loss: 8.821e-02]hash_cache_v1:  66%|######6   | 1989/3000 [1:44:48<49:24,  2.93s/it, lr: 1.0e-04 loss: 8.821e-02]hash_cache_v1:  66%|######6   | 1989/3000 [1:44:51<49:24,  2.93s/it, lr: 1.0e-04 loss: 1.073e-01]hash_cache_v1:  66%|######6   | 1989/3000 [1:44:51<49:24,  2.93s/it, lr: 1.0e-04 loss: 1.073e-01]hash_cache_v1:  66%|######6   | 1990/3000 [1:44:55<49:21,  2.93s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  66%|######6   | 1990/3000 [1:44:55<49:21,  2.93s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  66%|######6   | 1991/3000 [1:44:55<43:21,  2.58s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  66%|######6   | 1991/3000 [1:44:55<43:21,  2.58s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  66%|######6   | 1991/3000 [1:44:58<43:21,  2.58s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  66%|######6   | 1991/3000 [1:44:58<43:21,  2.58s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  66%|######6   | 1992/3000 [1:44:58<41:15,  2.46s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  66%|######6   | 1992/3000 [1:44:58<41:15,  2.46s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  66%|######6   | 1992/3000 [1:45:02<41:15,  2.46s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  66%|######6   | 1992/3000 [1:45:02<41:15,  2.46s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  66%|######6   | 1993/3000 [1:45:02<50:07,  2.99s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  66%|######6   | 1993/3000 [1:45:02<50:07,  2.99s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  66%|######6   | 1993/3000 [1:45:06<50:07,  2.99s/it, lr: 1.0e-04 loss: 5.692e-02]hash_cache_v1:  66%|######6   | 1993/3000 [1:45:06<50:07,  2.99s/it, lr: 1.0e-04 loss: 5.692e-02]hash_cache_v1:  66%|######6   | 1994/3000 [1:45:06<55:59,  3.34s/it, lr: 1.0e-04 loss: 5.692e-02]hash_cache_v1:  66%|######6   | 1994/3000 [1:45:06<55:59,  3.34s/it, lr: 1.0e-04 loss: 5.692e-02]hash_cache_v1:  66%|######6   | 1994/3000 [1:45:08<55:59,  3.34s/it, lr: 1.0e-04 loss: 3.002e-02]hash_cache_v1:  66%|######6   | 1994/3000 [1:45:08<55:59,  3.34s/it, lr: 1.0e-04 loss: 3.002e-02]hash_cache_v1:  66%|######6   | 1995/3000 [1:45:08<50:04,  2.99s/it, lr: 1.0e-04 loss: 3.002e-02]hash_cache_v1:  66%|######6   | 1995/3000 [1:45:08<50:04,  2.99s/it, lr: 1.0e-04 loss: 3.002e-02]hash_cache_v1:  66%|######6   | 1995/3000 [1:45:11<50:04,  2.99s/it, lr: 1.0e-04 loss: 1.561e-02]hash_cache_v1:  66%|######6   | 1995/3000 [1:45:11<50:04,  2.99s/it, lr: 1.0e-04 loss: 1.561e-02]hash_cache_v1:  67%|######6   | 1996/3000 [1:45:11<49:19,  2.95s/it, lr: 1.0e-04 loss: 1.561e-02]hash_cache_v1:  67%|######6   | 1996/3000 [1:45:11<49:19,  2.95s/it, lr: 1.0e-04 loss: 1.561e-02]hash_cache_v1:  67%|######6   | 1996/3000 [1:45:14<49:19,  2.95s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  67%|######6   | 1996/3000 [1:45:14<49:19,  2.95s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  67%|######6   | 1997/3000 [1:45:14<49:43,  2.97s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  67%|######6   | 1997/3000 [1:45:14<49:43,  2.97s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  67%|######6   | 1997/3000 [1:45:19<49:43,  2.97s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  67%|######6   | 1997/3000 [1:45:19<49:43,  2.97s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  67%|######6   | 1998/3000 [1:45:19<56:12,  3.37s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  67%|######6   | 1998/3000 [1:45:19<56:12,  3.37s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  67%|######6   | 1998/3000 [1:45:22<56:12,  3.37s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  67%|######6   | 1998/3000 [1:45:22<56:12,  3.37s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  67%|######6   | 1999/3000 [1:45:22<53:44,  3.22s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  67%|######6   | 1999/3000 [1:45:22<53:44,  3.22s/it, lr: 1.0e-04 loss: 1.624e-01]hash_cache_v1:  67%|######6   | 1999/3000 [1:45:24<53:44,  3.22s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  67%|######6   | 1999/3000 [1:45:24<53:44,  3.22s/it, lr: 1.0e-04 loss: 1.421e-01]
+Saving at step 2000
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000002000.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001000.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.21s/it]Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.21s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.31s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.31s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.44s/it]Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.44s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.46s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.46s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  67%|######6   | 2000/3000 [1:45:27<53:41,  3.22s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  67%|######6   | 2000/3000 [1:45:27<53:41,  3.22s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  67%|######6   | 2001/3000 [1:45:27<38:05,  2.29s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  67%|######6   | 2001/3000 [1:45:27<38:05,  2.29s/it, lr: 1.0e-04 loss: 1.853e-01]hash_cache_v1:  67%|######6   | 2001/3000 [1:45:31<38:05,  2.29s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  67%|######6   | 2001/3000 [1:45:31<38:05,  2.29s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  67%|######6   | 2002/3000 [1:45:31<46:19,  2.79s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  67%|######6   | 2002/3000 [1:45:31<46:19,  2.79s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  67%|######6   | 2002/3000 [1:45:35<46:19,  2.79s/it, lr: 1.0e-04 loss: 2.187e-02]hash_cache_v1:  67%|######6   | 2002/3000 [1:45:35<46:19,  2.79s/it, lr: 1.0e-04 loss: 2.187e-02]hash_cache_v1:  67%|######6   | 2003/3000 [1:45:35<52:48,  3.18s/it, lr: 1.0e-04 loss: 2.187e-02]hash_cache_v1:  67%|######6   | 2003/3000 [1:45:35<52:48,  3.18s/it, lr: 1.0e-04 loss: 2.187e-02]hash_cache_v1:  67%|######6   | 2003/3000 [1:45:38<52:48,  3.18s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  67%|######6   | 2003/3000 [1:45:38<52:48,  3.18s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  67%|######6   | 2004/3000 [1:45:38<52:22,  3.16s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  67%|######6   | 2004/3000 [1:45:38<52:22,  3.16s/it, lr: 1.0e-04 loss: 1.429e-01]hash_cache_v1:  67%|######6   | 2004/3000 [1:45:41<52:22,  3.16s/it, lr: 1.0e-04 loss: 6.226e-02]hash_cache_v1:  67%|######6   | 2004/3000 [1:45:41<52:22,  3.16s/it, lr: 1.0e-04 loss: 6.226e-02]hash_cache_v1:  67%|######6   | 2005/3000 [1:45:41<51:03,  3.08s/it, lr: 1.0e-04 loss: 6.226e-02]hash_cache_v1:  67%|######6   | 2005/3000 [1:45:41<51:03,  3.08s/it, lr: 1.0e-04 loss: 6.226e-02]hash_cache_v1:  67%|######6   | 2005/3000 [1:45:46<51:03,  3.08s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  67%|######6   | 2005/3000 [1:45:46<51:03,  3.08s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  67%|######6   | 2006/3000 [1:45:46<56:48,  3.43s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  67%|######6   | 2006/3000 [1:45:46<56:48,  3.43s/it, lr: 1.0e-04 loss: 1.116e-01]hash_cache_v1:  67%|######6   | 2006/3000 [1:45:48<56:48,  3.43s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######6   | 2006/3000 [1:45:48<56:48,  3.43s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######6   | 2007/3000 [1:45:48<51:37,  3.12s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######6   | 2007/3000 [1:45:48<51:37,  3.12s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######6   | 2007/3000 [1:45:51<51:37,  3.12s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1:  67%|######6   | 2007/3000 [1:45:51<51:37,  3.12s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1:  67%|######6   | 2008/3000 [1:45:51<50:20,  3.04s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1:  67%|######6   | 2008/3000 [1:45:51<50:20,  3.04s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1:  67%|######6   | 2008/3000 [1:45:55<50:20,  3.04s/it, lr: 1.0e-04 loss: 1.555e-01]hash_cache_v1:  67%|######6   | 2008/3000 [1:45:55<50:20,  3.04s/it, lr: 1.0e-04 loss: 1.555e-01]hash_cache_v1:  67%|######6   | 2009/3000 [1:45:55<56:28,  3.42s/it, lr: 1.0e-04 loss: 1.555e-01]hash_cache_v1:  67%|######6   | 2009/3000 [1:45:55<56:28,  3.42s/it, lr: 1.0e-04 loss: 1.555e-01]hash_cache_v1:  67%|######6   | 2009/3000 [1:45:58<56:28,  3.42s/it, lr: 1.0e-04 loss: 1.302e-01]hash_cache_v1:  67%|######6   | 2009/3000 [1:45:58<56:28,  3.42s/it, lr: 1.0e-04 loss: 1.302e-01]hash_cache_v1:  67%|######7   | 2010/3000 [1:46:00<56:25,  3.42s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  67%|######7   | 2010/3000 [1:46:00<56:25,  3.42s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  67%|######7   | 2011/3000 [1:46:00<39:26,  2.39s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  67%|######7   | 2011/3000 [1:46:00<39:26,  2.39s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  67%|######7   | 2011/3000 [1:46:03<39:26,  2.39s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  67%|######7   | 2011/3000 [1:46:03<39:26,  2.39s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  67%|######7   | 2012/3000 [1:46:03<41:20,  2.51s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  67%|######7   | 2012/3000 [1:46:03<41:20,  2.51s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  67%|######7   | 2012/3000 [1:46:06<41:20,  2.51s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  67%|######7   | 2012/3000 [1:46:06<41:20,  2.51s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  67%|######7   | 2013/3000 [1:46:06<42:49,  2.60s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  67%|######7   | 2013/3000 [1:46:06<42:49,  2.60s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  67%|######7   | 2013/3000 [1:46:08<42:49,  2.60s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  67%|######7   | 2013/3000 [1:46:08<42:49,  2.60s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  67%|######7   | 2014/3000 [1:46:08<40:32,  2.47s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  67%|######7   | 2014/3000 [1:46:08<40:32,  2.47s/it, lr: 1.0e-04 loss: 1.644e-01]hash_cache_v1:  67%|######7   | 2014/3000 [1:46:11<40:32,  2.47s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######7   | 2014/3000 [1:46:11<40:32,  2.47s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######7   | 2015/3000 [1:46:11<43:21,  2.64s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######7   | 2015/3000 [1:46:11<43:21,  2.64s/it, lr: 1.0e-04 loss: 1.652e-01]hash_cache_v1:  67%|######7   | 2015/3000 [1:46:14<43:21,  2.64s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  67%|######7   | 2015/3000 [1:46:14<43:21,  2.64s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  67%|######7   | 2016/3000 [1:46:14<44:27,  2.71s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  67%|######7   | 2016/3000 [1:46:14<44:27,  2.71s/it, lr: 1.0e-04 loss: 1.241e-01]hash_cache_v1:  67%|######7   | 2016/3000 [1:46:17<44:27,  2.71s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:  67%|######7   | 2016/3000 [1:46:17<44:27,  2.71s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:  67%|######7   | 2017/3000 [1:46:17<45:11,  2.76s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:  67%|######7   | 2017/3000 [1:46:17<45:11,  2.76s/it, lr: 1.0e-04 loss: 1.766e-01]hash_cache_v1:  67%|######7   | 2017/3000 [1:46:19<45:11,  2.76s/it, lr: 1.0e-04 loss: 6.638e-02]hash_cache_v1:  67%|######7   | 2017/3000 [1:46:19<45:11,  2.76s/it, lr: 1.0e-04 loss: 6.638e-02]hash_cache_v1:  67%|######7   | 2018/3000 [1:46:19<43:13,  2.64s/it, lr: 1.0e-04 loss: 6.638e-02]hash_cache_v1:  67%|######7   | 2018/3000 [1:46:19<43:13,  2.64s/it, lr: 1.0e-04 loss: 6.638e-02]hash_cache_v1:  67%|######7   | 2018/3000 [1:46:22<43:13,  2.64s/it, lr: 1.0e-04 loss: 6.981e-02]hash_cache_v1:  67%|######7   | 2018/3000 [1:46:22<43:13,  2.64s/it, lr: 1.0e-04 loss: 6.981e-02]hash_cache_v1:  67%|######7   | 2019/3000 [1:46:22<44:21,  2.71s/it, lr: 1.0e-04 loss: 6.981e-02]hash_cache_v1:  67%|######7   | 2019/3000 [1:46:22<44:21,  2.71s/it, lr: 1.0e-04 loss: 6.981e-02]hash_cache_v1:  67%|######7   | 2019/3000 [1:46:25<44:21,  2.71s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  67%|######7   | 2019/3000 [1:46:25<44:21,  2.71s/it, lr: 1.0e-04 loss: 1.128e-01]hash_cache_v1:  67%|######7   | 2020/3000 [1:46:29<44:19,  2.71s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  67%|######7   | 2020/3000 [1:46:29<44:19,  2.71s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  67%|######7   | 2021/3000 [1:46:29<39:43,  2.43s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  67%|######7   | 2021/3000 [1:46:29<39:43,  2.43s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  67%|######7   | 2021/3000 [1:46:32<39:43,  2.43s/it, lr: 1.0e-04 loss: 4.724e-02]hash_cache_v1:  67%|######7   | 2021/3000 [1:46:32<39:43,  2.43s/it, lr: 1.0e-04 loss: 4.724e-02]hash_cache_v1:  67%|######7   | 2022/3000 [1:46:32<42:07,  2.58s/it, lr: 1.0e-04 loss: 4.724e-02]hash_cache_v1:  67%|######7   | 2022/3000 [1:46:32<42:07,  2.58s/it, lr: 1.0e-04 loss: 4.724e-02]hash_cache_v1:  67%|######7   | 2022/3000 [1:46:37<42:07,  2.58s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  67%|######7   | 2022/3000 [1:46:37<42:07,  2.58s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  67%|######7   | 2023/3000 [1:46:37<49:27,  3.04s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  67%|######7   | 2023/3000 [1:46:37<49:27,  3.04s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  67%|######7   | 2023/3000 [1:46:40<49:27,  3.04s/it, lr: 1.0e-04 loss: 1.625e-01]hash_cache_v1:  67%|######7   | 2023/3000 [1:46:40<49:27,  3.04s/it, lr: 1.0e-04 loss: 1.625e-01]hash_cache_v1:  67%|######7   | 2024/3000 [1:46:40<48:29,  2.98s/it, lr: 1.0e-04 loss: 1.625e-01]hash_cache_v1:  67%|######7   | 2024/3000 [1:46:40<48:29,  2.98s/it, lr: 1.0e-04 loss: 1.625e-01]hash_cache_v1:  67%|######7   | 2024/3000 [1:46:42<48:29,  2.98s/it, lr: 1.0e-04 loss: 1.466e-02]hash_cache_v1:  67%|######7   | 2024/3000 [1:46:42<48:29,  2.98s/it, lr: 1.0e-04 loss: 1.466e-02]hash_cache_v1:  68%|######7   | 2025/3000 [1:46:42<44:24,  2.73s/it, lr: 1.0e-04 loss: 1.466e-02]hash_cache_v1:  68%|######7   | 2025/3000 [1:46:42<44:24,  2.73s/it, lr: 1.0e-04 loss: 1.466e-02]hash_cache_v1:  68%|######7   | 2025/3000 [1:46:44<44:24,  2.73s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  68%|######7   | 2025/3000 [1:46:44<44:24,  2.73s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  68%|######7   | 2026/3000 [1:46:44<42:50,  2.64s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  68%|######7   | 2026/3000 [1:46:44<42:50,  2.64s/it, lr: 1.0e-04 loss: 1.796e-01]hash_cache_v1:  68%|######7   | 2026/3000 [1:46:47<42:50,  2.64s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  68%|######7   | 2026/3000 [1:46:47<42:50,  2.64s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  68%|######7   | 2027/3000 [1:46:47<43:56,  2.71s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  68%|######7   | 2027/3000 [1:46:47<43:56,  2.71s/it, lr: 1.0e-04 loss: 1.734e-01]hash_cache_v1:  68%|######7   | 2027/3000 [1:46:49<43:56,  2.71s/it, lr: 1.0e-04 loss: 9.580e-02]hash_cache_v1:  68%|######7   | 2027/3000 [1:46:49<43:56,  2.71s/it, lr: 1.0e-04 loss: 9.580e-02]hash_cache_v1:  68%|######7   | 2028/3000 [1:46:49<41:03,  2.53s/it, lr: 1.0e-04 loss: 9.580e-02]hash_cache_v1:  68%|######7   | 2028/3000 [1:46:49<41:03,  2.53s/it, lr: 1.0e-04 loss: 9.580e-02]hash_cache_v1:  68%|######7   | 2028/3000 [1:46:52<41:03,  2.53s/it, lr: 1.0e-04 loss: 1.882e-02]hash_cache_v1:  68%|######7   | 2028/3000 [1:46:52<41:03,  2.53s/it, lr: 1.0e-04 loss: 1.882e-02]hash_cache_v1:  68%|######7   | 2029/3000 [1:46:52<43:38,  2.70s/it, lr: 1.0e-04 loss: 1.882e-02]hash_cache_v1:  68%|######7   | 2029/3000 [1:46:52<43:38,  2.70s/it, lr: 1.0e-04 loss: 1.882e-02]hash_cache_v1:  68%|######7   | 2029/3000 [1:46:56<43:38,  2.70s/it, lr: 1.0e-04 loss: 1.181e-01]hash_cache_v1:  68%|######7   | 2029/3000 [1:46:56<43:38,  2.70s/it, lr: 1.0e-04 loss: 1.181e-01]hash_cache_v1:  68%|######7   | 2030/3000 [1:47:01<43:35,  2.70s/it, lr: 1.0e-04 loss: 2.650e-02]hash_cache_v1:  68%|######7   | 2030/3000 [1:47:01<43:35,  2.70s/it, lr: 1.0e-04 loss: 2.650e-02]hash_cache_v1:  68%|######7   | 2031/3000 [1:47:01<39:34,  2.45s/it, lr: 1.0e-04 loss: 2.650e-02]hash_cache_v1:  68%|######7   | 2031/3000 [1:47:01<39:34,  2.45s/it, lr: 1.0e-04 loss: 2.650e-02]hash_cache_v1:  68%|######7   | 2031/3000 [1:47:03<39:34,  2.45s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  68%|######7   | 2031/3000 [1:47:03<39:34,  2.45s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  68%|######7   | 2032/3000 [1:47:03<38:06,  2.36s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  68%|######7   | 2032/3000 [1:47:03<38:06,  2.36s/it, lr: 1.0e-04 loss: 1.417e-01]hash_cache_v1:  68%|######7   | 2032/3000 [1:47:05<38:06,  2.36s/it, lr: 1.0e-04 loss: 3.069e-02]hash_cache_v1:  68%|######7   | 2032/3000 [1:47:05<38:06,  2.36s/it, lr: 1.0e-04 loss: 3.069e-02]hash_cache_v1:  68%|######7   | 2033/3000 [1:47:05<38:08,  2.37s/it, lr: 1.0e-04 loss: 3.069e-02]hash_cache_v1:  68%|######7   | 2033/3000 [1:47:05<38:08,  2.37s/it, lr: 1.0e-04 loss: 3.069e-02]hash_cache_v1:  68%|######7   | 2033/3000 [1:47:07<38:08,  2.37s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  68%|######7   | 2033/3000 [1:47:07<38:08,  2.37s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  68%|######7   | 2034/3000 [1:47:07<36:53,  2.29s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  68%|######7   | 2034/3000 [1:47:07<36:53,  2.29s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  68%|######7   | 2034/3000 [1:47:12<36:53,  2.29s/it, lr: 1.0e-04 loss: 1.386e-01]hash_cache_v1:  68%|######7   | 2034/3000 [1:47:12<36:53,  2.29s/it, lr: 1.0e-04 loss: 1.386e-01]hash_cache_v1:  68%|######7   | 2035/3000 [1:47:12<45:24,  2.82s/it, lr: 1.0e-04 loss: 1.386e-01]hash_cache_v1:  68%|######7   | 2035/3000 [1:47:12<45:24,  2.82s/it, lr: 1.0e-04 loss: 1.386e-01]hash_cache_v1:  68%|######7   | 2035/3000 [1:47:14<45:24,  2.82s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  68%|######7   | 2035/3000 [1:47:14<45:24,  2.82s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  68%|######7   | 2036/3000 [1:47:14<41:53,  2.61s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  68%|######7   | 2036/3000 [1:47:14<41:53,  2.61s/it, lr: 1.0e-04 loss: 1.598e-01]hash_cache_v1:  68%|######7   | 2036/3000 [1:47:16<41:53,  2.61s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:  68%|######7   | 2036/3000 [1:47:16<41:53,  2.61s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:  68%|######7   | 2037/3000 [1:47:16<40:47,  2.54s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:  68%|######7   | 2037/3000 [1:47:16<40:47,  2.54s/it, lr: 1.0e-04 loss: 1.563e-01]hash_cache_v1:  68%|######7   | 2037/3000 [1:47:18<40:47,  2.54s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  68%|######7   | 2037/3000 [1:47:18<40:47,  2.54s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  68%|######7   | 2038/3000 [1:47:18<38:42,  2.41s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  68%|######7   | 2038/3000 [1:47:18<38:42,  2.41s/it, lr: 1.0e-04 loss: 1.626e-01]hash_cache_v1:  68%|######7   | 2038/3000 [1:47:22<38:42,  2.41s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  68%|######7   | 2038/3000 [1:47:22<38:42,  2.41s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  68%|######7   | 2039/3000 [1:47:22<47:23,  2.96s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  68%|######7   | 2039/3000 [1:47:22<47:23,  2.96s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  68%|######7   | 2039/3000 [1:47:25<47:23,  2.96s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  68%|######7   | 2039/3000 [1:47:25<47:23,  2.96s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  68%|######8   | 2040/3000 [1:47:29<47:20,  2.96s/it, lr: 1.0e-04 loss: 6.666e-02]hash_cache_v1:  68%|######8   | 2040/3000 [1:47:29<47:20,  2.96s/it, lr: 1.0e-04 loss: 6.666e-02]hash_cache_v1:  68%|######8   | 2041/3000 [1:47:29<41:13,  2.58s/it, lr: 1.0e-04 loss: 6.666e-02]hash_cache_v1:  68%|######8   | 2041/3000 [1:47:29<41:13,  2.58s/it, lr: 1.0e-04 loss: 6.666e-02]hash_cache_v1:  68%|######8   | 2041/3000 [1:47:31<41:13,  2.58s/it, lr: 1.0e-04 loss: 9.434e-02]hash_cache_v1:  68%|######8   | 2041/3000 [1:47:31<41:13,  2.58s/it, lr: 1.0e-04 loss: 9.434e-02]hash_cache_v1:  68%|######8   | 2042/3000 [1:47:31<39:22,  2.47s/it, lr: 1.0e-04 loss: 9.434e-02]hash_cache_v1:  68%|######8   | 2042/3000 [1:47:31<39:22,  2.47s/it, lr: 1.0e-04 loss: 9.434e-02]hash_cache_v1:  68%|######8   | 2042/3000 [1:47:33<39:22,  2.47s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  68%|######8   | 2042/3000 [1:47:33<39:22,  2.47s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  68%|######8   | 2043/3000 [1:47:33<37:45,  2.37s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  68%|######8   | 2043/3000 [1:47:33<37:45,  2.37s/it, lr: 1.0e-04 loss: 1.907e-01]hash_cache_v1:  68%|######8   | 2043/3000 [1:47:38<37:45,  2.37s/it, lr: 1.0e-04 loss: 9.973e-02]hash_cache_v1:  68%|######8   | 2043/3000 [1:47:38<37:45,  2.37s/it, lr: 1.0e-04 loss: 9.973e-02]hash_cache_v1:  68%|######8   | 2044/3000 [1:47:38<46:50,  2.94s/it, lr: 1.0e-04 loss: 9.973e-02]hash_cache_v1:  68%|######8   | 2044/3000 [1:47:38<46:50,  2.94s/it, lr: 1.0e-04 loss: 9.973e-02]hash_cache_v1:  68%|######8   | 2044/3000 [1:47:41<46:50,  2.94s/it, lr: 1.0e-04 loss: 4.360e-02]hash_cache_v1:  68%|######8   | 2044/3000 [1:47:41<46:50,  2.94s/it, lr: 1.0e-04 loss: 4.360e-02]hash_cache_v1:  68%|######8   | 2045/3000 [1:47:41<46:26,  2.92s/it, lr: 1.0e-04 loss: 4.360e-02]hash_cache_v1:  68%|######8   | 2045/3000 [1:47:41<46:26,  2.92s/it, lr: 1.0e-04 loss: 4.360e-02]hash_cache_v1:  68%|######8   | 2045/3000 [1:47:45<46:26,  2.92s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  68%|######8   | 2045/3000 [1:47:45<46:26,  2.92s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  68%|######8   | 2046/3000 [1:47:45<52:41,  3.31s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  68%|######8   | 2046/3000 [1:47:45<52:41,  3.31s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  68%|######8   | 2046/3000 [1:47:49<52:41,  3.31s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  68%|######8   | 2046/3000 [1:47:49<52:41,  3.31s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  68%|######8   | 2047/3000 [1:47:49<57:25,  3.62s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  68%|######8   | 2047/3000 [1:47:49<57:25,  3.62s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  68%|######8   | 2047/3000 [1:47:54<57:25,  3.62s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  68%|######8   | 2047/3000 [1:47:54<57:25,  3.62s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  68%|######8   | 2048/3000 [1:47:54<1:01:34,  3.88s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  68%|######8   | 2048/3000 [1:47:54<1:01:34,  3.88s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  68%|######8   | 2048/3000 [1:47:57<1:01:34,  3.88s/it, lr: 1.0e-04 loss: 1.712e-01]hash_cache_v1:  68%|######8   | 2048/3000 [1:47:57<1:01:34,  3.88s/it, lr: 1.0e-04 loss: 1.712e-01]hash_cache_v1:  68%|######8   | 2049/3000 [1:47:57<56:39,  3.57s/it, lr: 1.0e-04 loss: 1.712e-01]  hash_cache_v1:  68%|######8   | 2049/3000 [1:47:57<56:39,  3.57s/it, lr: 1.0e-04 loss: 1.712e-01]  hash_cache_v1:  68%|######8   | 2049/3000 [1:47:59<56:39,  3.57s/it, lr: 1.0e-04 loss: 1.971e-01]hash_cache_v1:  68%|######8   | 2049/3000 [1:47:59<56:39,  3.57s/it, lr: 1.0e-04 loss: 1.971e-01]hash_cache_v1:  68%|######8   | 2050/3000 [1:48:02<56:35,  3.57s/it, lr: 1.0e-04 loss: 9.822e-02]hash_cache_v1:  68%|######8   | 2050/3000 [1:48:02<56:35,  3.57s/it, lr: 1.0e-04 loss: 9.822e-02]hash_cache_v1:  68%|######8   | 2051/3000 [1:48:02<41:56,  2.65s/it, lr: 1.0e-04 loss: 9.822e-02]hash_cache_v1:  68%|######8   | 2051/3000 [1:48:02<41:56,  2.65s/it, lr: 1.0e-04 loss: 9.822e-02]hash_cache_v1:  68%|######8   | 2051/3000 [1:48:04<41:56,  2.65s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  68%|######8   | 2051/3000 [1:48:04<41:56,  2.65s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  68%|######8   | 2052/3000 [1:48:04<39:45,  2.52s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  68%|######8   | 2052/3000 [1:48:04<39:45,  2.52s/it, lr: 1.0e-04 loss: 1.822e-01]hash_cache_v1:  68%|######8   | 2052/3000 [1:48:07<39:45,  2.52s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  68%|######8   | 2052/3000 [1:48:07<39:45,  2.52s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  68%|######8   | 2053/3000 [1:48:07<41:02,  2.60s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  68%|######8   | 2053/3000 [1:48:07<41:02,  2.60s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  68%|######8   | 2053/3000 [1:48:10<41:02,  2.60s/it, lr: 1.0e-04 loss: 1.451e-01]hash_cache_v1:  68%|######8   | 2053/3000 [1:48:10<41:02,  2.60s/it, lr: 1.0e-04 loss: 1.451e-01]hash_cache_v1:  68%|######8   | 2054/3000 [1:48:10<42:01,  2.67s/it, lr: 1.0e-04 loss: 1.451e-01]hash_cache_v1:  68%|######8   | 2054/3000 [1:48:10<42:01,  2.67s/it, lr: 1.0e-04 loss: 1.451e-01]hash_cache_v1:  68%|######8   | 2054/3000 [1:48:12<42:01,  2.67s/it, lr: 1.0e-04 loss: 1.585e-01]hash_cache_v1:  68%|######8   | 2054/3000 [1:48:12<42:01,  2.67s/it, lr: 1.0e-04 loss: 1.585e-01]hash_cache_v1:  68%|######8   | 2055/3000 [1:48:12<40:46,  2.59s/it, lr: 1.0e-04 loss: 1.585e-01]hash_cache_v1:  68%|######8   | 2055/3000 [1:48:12<40:46,  2.59s/it, lr: 1.0e-04 loss: 1.585e-01]hash_cache_v1:  68%|######8   | 2055/3000 [1:48:16<40:46,  2.59s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  68%|######8   | 2055/3000 [1:48:16<40:46,  2.59s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  69%|######8   | 2056/3000 [1:48:16<48:28,  3.08s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  69%|######8   | 2056/3000 [1:48:16<48:28,  3.08s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  69%|######8   | 2056/3000 [1:48:18<48:28,  3.08s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######8   | 2056/3000 [1:48:18<48:28,  3.08s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######8   | 2057/3000 [1:48:18<44:02,  2.80s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######8   | 2057/3000 [1:48:18<44:02,  2.80s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######8   | 2057/3000 [1:48:20<44:02,  2.80s/it, lr: 1.0e-04 loss: 2.261e-01]hash_cache_v1:  69%|######8   | 2057/3000 [1:48:20<44:02,  2.80s/it, lr: 1.0e-04 loss: 2.261e-01]hash_cache_v1:  69%|######8   | 2058/3000 [1:48:20<40:49,  2.60s/it, lr: 1.0e-04 loss: 2.261e-01]hash_cache_v1:  69%|######8   | 2058/3000 [1:48:20<40:49,  2.60s/it, lr: 1.0e-04 loss: 2.261e-01]hash_cache_v1:  69%|######8   | 2058/3000 [1:48:24<40:49,  2.60s/it, lr: 1.0e-04 loss: 3.946e-02]hash_cache_v1:  69%|######8   | 2058/3000 [1:48:24<40:49,  2.60s/it, lr: 1.0e-04 loss: 3.946e-02]hash_cache_v1:  69%|######8   | 2059/3000 [1:48:24<43:10,  2.75s/it, lr: 1.0e-04 loss: 3.946e-02]hash_cache_v1:  69%|######8   | 2059/3000 [1:48:24<43:10,  2.75s/it, lr: 1.0e-04 loss: 3.946e-02]hash_cache_v1:  69%|######8   | 2059/3000 [1:48:28<43:10,  2.75s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  69%|######8   | 2059/3000 [1:48:28<43:10,  2.75s/it, lr: 1.0e-04 loss: 1.476e-01]hash_cache_v1:  69%|######8   | 2060/3000 [1:48:32<43:07,  2.75s/it, lr: 1.0e-04 loss: 8.966e-02]hash_cache_v1:  69%|######8   | 2060/3000 [1:48:32<43:07,  2.75s/it, lr: 1.0e-04 loss: 8.966e-02]hash_cache_v1:  69%|######8   | 2061/3000 [1:48:32<38:49,  2.48s/it, lr: 1.0e-04 loss: 8.966e-02]hash_cache_v1:  69%|######8   | 2061/3000 [1:48:32<38:49,  2.48s/it, lr: 1.0e-04 loss: 8.966e-02]hash_cache_v1:  69%|######8   | 2061/3000 [1:48:37<38:49,  2.48s/it, lr: 1.0e-04 loss: 9.752e-02]hash_cache_v1:  69%|######8   | 2061/3000 [1:48:37<38:49,  2.48s/it, lr: 1.0e-04 loss: 9.752e-02]hash_cache_v1:  69%|######8   | 2062/3000 [1:48:37<46:27,  2.97s/it, lr: 1.0e-04 loss: 9.752e-02]hash_cache_v1:  69%|######8   | 2062/3000 [1:48:37<46:27,  2.97s/it, lr: 1.0e-04 loss: 9.752e-02]hash_cache_v1:  69%|######8   | 2062/3000 [1:48:41<46:27,  2.97s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  69%|######8   | 2062/3000 [1:48:41<46:27,  2.97s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  69%|######8   | 2063/3000 [1:48:41<51:49,  3.32s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  69%|######8   | 2063/3000 [1:48:41<51:49,  3.32s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  69%|######8   | 2063/3000 [1:48:43<51:49,  3.32s/it, lr: 1.0e-04 loss: 6.476e-02]hash_cache_v1:  69%|######8   | 2063/3000 [1:48:43<51:49,  3.32s/it, lr: 1.0e-04 loss: 6.476e-02]hash_cache_v1:  69%|######8   | 2064/3000 [1:48:43<46:37,  2.99s/it, lr: 1.0e-04 loss: 6.476e-02]hash_cache_v1:  69%|######8   | 2064/3000 [1:48:43<46:37,  2.99s/it, lr: 1.0e-04 loss: 6.476e-02]hash_cache_v1:  69%|######8   | 2064/3000 [1:48:45<46:37,  2.99s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  69%|######8   | 2064/3000 [1:48:45<46:37,  2.99s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  69%|######8   | 2065/3000 [1:48:45<42:42,  2.74s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  69%|######8   | 2065/3000 [1:48:45<42:42,  2.74s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  69%|######8   | 2065/3000 [1:48:50<42:42,  2.74s/it, lr: 1.0e-04 loss: 3.961e-02]hash_cache_v1:  69%|######8   | 2065/3000 [1:48:50<42:42,  2.74s/it, lr: 1.0e-04 loss: 3.961e-02]hash_cache_v1:  69%|######8   | 2066/3000 [1:48:50<50:34,  3.25s/it, lr: 1.0e-04 loss: 3.961e-02]hash_cache_v1:  69%|######8   | 2066/3000 [1:48:50<50:34,  3.25s/it, lr: 1.0e-04 loss: 3.961e-02]hash_cache_v1:  69%|######8   | 2066/3000 [1:48:54<50:34,  3.25s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  69%|######8   | 2066/3000 [1:48:54<50:34,  3.25s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  69%|######8   | 2067/3000 [1:48:54<55:12,  3.55s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  69%|######8   | 2067/3000 [1:48:54<55:12,  3.55s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  69%|######8   | 2067/3000 [1:48:56<55:12,  3.55s/it, lr: 1.0e-04 loss: 1.122e-02]hash_cache_v1:  69%|######8   | 2067/3000 [1:48:56<55:12,  3.55s/it, lr: 1.0e-04 loss: 1.122e-02]hash_cache_v1:  69%|######8   | 2068/3000 [1:48:56<48:38,  3.13s/it, lr: 1.0e-04 loss: 1.122e-02]hash_cache_v1:  69%|######8   | 2068/3000 [1:48:56<48:38,  3.13s/it, lr: 1.0e-04 loss: 1.122e-02]hash_cache_v1:  69%|######8   | 2068/3000 [1:48:59<48:38,  3.13s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  69%|######8   | 2068/3000 [1:48:59<48:38,  3.13s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  69%|######8   | 2069/3000 [1:48:59<45:20,  2.92s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  69%|######8   | 2069/3000 [1:48:59<45:20,  2.92s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  69%|######8   | 2069/3000 [1:49:02<45:20,  2.92s/it, lr: 1.0e-04 loss: 6.756e-02]hash_cache_v1:  69%|######8   | 2069/3000 [1:49:02<45:20,  2.92s/it, lr: 1.0e-04 loss: 6.756e-02]hash_cache_v1:  69%|######9   | 2070/3000 [1:49:06<45:17,  2.92s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  69%|######9   | 2070/3000 [1:49:06<45:17,  2.92s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  69%|######9   | 2071/3000 [1:49:06<39:38,  2.56s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  69%|######9   | 2071/3000 [1:49:06<39:38,  2.56s/it, lr: 1.0e-04 loss: 1.370e-01]hash_cache_v1:  69%|######9   | 2071/3000 [1:49:10<39:38,  2.56s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  69%|######9   | 2071/3000 [1:49:10<39:38,  2.56s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  69%|######9   | 2072/3000 [1:49:10<46:12,  2.99s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  69%|######9   | 2072/3000 [1:49:10<46:12,  2.99s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  69%|######9   | 2072/3000 [1:49:13<46:12,  2.99s/it, lr: 1.0e-04 loss: 9.537e-02]hash_cache_v1:  69%|######9   | 2072/3000 [1:49:13<46:12,  2.99s/it, lr: 1.0e-04 loss: 9.537e-02]hash_cache_v1:  69%|######9   | 2073/3000 [1:49:13<46:58,  3.04s/it, lr: 1.0e-04 loss: 9.537e-02]hash_cache_v1:  69%|######9   | 2073/3000 [1:49:13<46:58,  3.04s/it, lr: 1.0e-04 loss: 9.537e-02]hash_cache_v1:  69%|######9   | 2073/3000 [1:49:18<46:58,  3.04s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  69%|######9   | 2073/3000 [1:49:18<46:58,  3.04s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  69%|######9   | 2074/3000 [1:49:18<52:21,  3.39s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  69%|######9   | 2074/3000 [1:49:18<52:21,  3.39s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  69%|######9   | 2074/3000 [1:49:22<52:21,  3.39s/it, lr: 1.0e-04 loss: 8.544e-02]hash_cache_v1:  69%|######9   | 2074/3000 [1:49:22<52:21,  3.39s/it, lr: 1.0e-04 loss: 8.544e-02]hash_cache_v1:  69%|######9   | 2075/3000 [1:49:22<56:15,  3.65s/it, lr: 1.0e-04 loss: 8.544e-02]hash_cache_v1:  69%|######9   | 2075/3000 [1:49:22<56:15,  3.65s/it, lr: 1.0e-04 loss: 8.544e-02]hash_cache_v1:  69%|######9   | 2075/3000 [1:49:25<56:15,  3.65s/it, lr: 1.0e-04 loss: 2.916e-02]hash_cache_v1:  69%|######9   | 2075/3000 [1:49:25<56:15,  3.65s/it, lr: 1.0e-04 loss: 2.916e-02]hash_cache_v1:  69%|######9   | 2076/3000 [1:49:25<52:46,  3.43s/it, lr: 1.0e-04 loss: 2.916e-02]hash_cache_v1:  69%|######9   | 2076/3000 [1:49:25<52:46,  3.43s/it, lr: 1.0e-04 loss: 2.916e-02]hash_cache_v1:  69%|######9   | 2076/3000 [1:49:29<52:46,  3.43s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  69%|######9   | 2076/3000 [1:49:29<52:46,  3.43s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  69%|######9   | 2077/3000 [1:49:29<57:04,  3.71s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  69%|######9   | 2077/3000 [1:49:29<57:04,  3.71s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  69%|######9   | 2077/3000 [1:49:32<57:04,  3.71s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  69%|######9   | 2077/3000 [1:49:32<57:04,  3.71s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  69%|######9   | 2078/3000 [1:49:32<49:50,  3.24s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  69%|######9   | 2078/3000 [1:49:32<49:50,  3.24s/it, lr: 1.0e-04 loss: 1.470e-01]hash_cache_v1:  69%|######9   | 2078/3000 [1:49:34<49:50,  3.24s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######9   | 2078/3000 [1:49:34<49:50,  3.24s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######9   | 2079/3000 [1:49:34<48:05,  3.13s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######9   | 2079/3000 [1:49:34<48:05,  3.13s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  69%|######9   | 2079/3000 [1:49:37<48:05,  3.13s/it, lr: 1.0e-04 loss: 8.359e-02]hash_cache_v1:  69%|######9   | 2079/3000 [1:49:37<48:05,  3.13s/it, lr: 1.0e-04 loss: 8.359e-02]hash_cache_v1:  69%|######9   | 2080/3000 [1:49:40<48:02,  3.13s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  69%|######9   | 2080/3000 [1:49:40<48:02,  3.13s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  69%|######9   | 2081/3000 [1:49:40<35:59,  2.35s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  69%|######9   | 2081/3000 [1:49:40<35:59,  2.35s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  69%|######9   | 2081/3000 [1:49:42<35:59,  2.35s/it, lr: 1.0e-04 loss: 8.865e-02]hash_cache_v1:  69%|######9   | 2081/3000 [1:49:42<35:59,  2.35s/it, lr: 1.0e-04 loss: 8.865e-02]hash_cache_v1:  69%|######9   | 2082/3000 [1:49:42<35:01,  2.29s/it, lr: 1.0e-04 loss: 8.865e-02]hash_cache_v1:  69%|######9   | 2082/3000 [1:49:42<35:01,  2.29s/it, lr: 1.0e-04 loss: 8.865e-02]hash_cache_v1:  69%|######9   | 2082/3000 [1:49:45<35:01,  2.29s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  69%|######9   | 2082/3000 [1:49:45<35:01,  2.29s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  69%|######9   | 2083/3000 [1:49:45<37:16,  2.44s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  69%|######9   | 2083/3000 [1:49:45<37:16,  2.44s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  69%|######9   | 2083/3000 [1:49:50<37:16,  2.44s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  69%|######9   | 2083/3000 [1:49:50<37:16,  2.44s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  69%|######9   | 2084/3000 [1:49:50<45:52,  3.00s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  69%|######9   | 2084/3000 [1:49:50<45:52,  3.00s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  69%|######9   | 2084/3000 [1:49:53<45:52,  3.00s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  69%|######9   | 2084/3000 [1:49:53<45:52,  3.00s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  70%|######9   | 2085/3000 [1:49:53<45:13,  2.97s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  70%|######9   | 2085/3000 [1:49:53<45:13,  2.97s/it, lr: 1.0e-04 loss: 1.483e-01]hash_cache_v1:  70%|######9   | 2085/3000 [1:49:56<45:13,  2.97s/it, lr: 1.0e-04 loss: 8.192e-02]hash_cache_v1:  70%|######9   | 2085/3000 [1:49:56<45:13,  2.97s/it, lr: 1.0e-04 loss: 8.192e-02]hash_cache_v1:  70%|######9   | 2086/3000 [1:49:56<44:39,  2.93s/it, lr: 1.0e-04 loss: 8.192e-02]hash_cache_v1:  70%|######9   | 2086/3000 [1:49:56<44:39,  2.93s/it, lr: 1.0e-04 loss: 8.192e-02]hash_cache_v1:  70%|######9   | 2086/3000 [1:49:58<44:39,  2.93s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  70%|######9   | 2086/3000 [1:49:58<44:39,  2.93s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  70%|######9   | 2087/3000 [1:49:58<44:21,  2.92s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  70%|######9   | 2087/3000 [1:49:58<44:21,  2.92s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  70%|######9   | 2087/3000 [1:50:01<44:21,  2.92s/it, lr: 1.0e-04 loss: 1.963e-02]hash_cache_v1:  70%|######9   | 2087/3000 [1:50:01<44:21,  2.92s/it, lr: 1.0e-04 loss: 1.963e-02]hash_cache_v1:  70%|######9   | 2088/3000 [1:50:01<42:00,  2.76s/it, lr: 1.0e-04 loss: 1.963e-02]hash_cache_v1:  70%|######9   | 2088/3000 [1:50:01<42:00,  2.76s/it, lr: 1.0e-04 loss: 1.963e-02]hash_cache_v1:  70%|######9   | 2088/3000 [1:50:04<42:00,  2.76s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  70%|######9   | 2088/3000 [1:50:04<42:00,  2.76s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  70%|######9   | 2089/3000 [1:50:04<42:17,  2.79s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  70%|######9   | 2089/3000 [1:50:04<42:17,  2.79s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  70%|######9   | 2089/3000 [1:50:06<42:17,  2.79s/it, lr: 1.0e-04 loss: 4.291e-02]hash_cache_v1:  70%|######9   | 2089/3000 [1:50:06<42:17,  2.79s/it, lr: 1.0e-04 loss: 4.291e-02]hash_cache_v1:  70%|######9   | 2090/3000 [1:50:10<42:15,  2.79s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  70%|######9   | 2090/3000 [1:50:10<42:15,  2.79s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  70%|######9   | 2091/3000 [1:50:10<33:34,  2.22s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  70%|######9   | 2091/3000 [1:50:10<33:34,  2.22s/it, lr: 1.0e-04 loss: 1.909e-01]hash_cache_v1:  70%|######9   | 2091/3000 [1:50:12<33:34,  2.22s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  70%|######9   | 2091/3000 [1:50:12<33:34,  2.22s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  70%|######9   | 2092/3000 [1:50:12<33:13,  2.20s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  70%|######9   | 2092/3000 [1:50:12<33:13,  2.20s/it, lr: 1.0e-04 loss: 7.469e-02]hash_cache_v1:  70%|######9   | 2092/3000 [1:50:14<33:13,  2.20s/it, lr: 1.0e-04 loss: 9.912e-02]hash_cache_v1:  70%|######9   | 2092/3000 [1:50:14<33:13,  2.20s/it, lr: 1.0e-04 loss: 9.912e-02]hash_cache_v1:  70%|######9   | 2093/3000 [1:50:14<32:48,  2.17s/it, lr: 1.0e-04 loss: 9.912e-02]hash_cache_v1:  70%|######9   | 2093/3000 [1:50:14<32:48,  2.17s/it, lr: 1.0e-04 loss: 9.912e-02]hash_cache_v1:  70%|######9   | 2093/3000 [1:50:18<32:48,  2.17s/it, lr: 1.0e-04 loss: 1.012e-01]hash_cache_v1:  70%|######9   | 2093/3000 [1:50:18<32:48,  2.17s/it, lr: 1.0e-04 loss: 1.012e-01]hash_cache_v1:  70%|######9   | 2094/3000 [1:50:18<41:20,  2.74s/it, lr: 1.0e-04 loss: 1.012e-01]hash_cache_v1:  70%|######9   | 2094/3000 [1:50:18<41:20,  2.74s/it, lr: 1.0e-04 loss: 1.012e-01]hash_cache_v1:  70%|######9   | 2094/3000 [1:50:21<41:20,  2.74s/it, lr: 1.0e-04 loss: 3.933e-02]hash_cache_v1:  70%|######9   | 2094/3000 [1:50:21<41:20,  2.74s/it, lr: 1.0e-04 loss: 3.933e-02]hash_cache_v1:  70%|######9   | 2095/3000 [1:50:21<42:50,  2.84s/it, lr: 1.0e-04 loss: 3.933e-02]hash_cache_v1:  70%|######9   | 2095/3000 [1:50:21<42:50,  2.84s/it, lr: 1.0e-04 loss: 3.933e-02]hash_cache_v1:  70%|######9   | 2095/3000 [1:50:25<42:50,  2.84s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:  70%|######9   | 2095/3000 [1:50:25<42:50,  2.84s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:  70%|######9   | 2096/3000 [1:50:25<49:05,  3.26s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:  70%|######9   | 2096/3000 [1:50:25<49:05,  3.26s/it, lr: 1.0e-04 loss: 1.312e-01]hash_cache_v1:  70%|######9   | 2096/3000 [1:50:28<49:05,  3.26s/it, lr: 1.0e-04 loss: 5.775e-02]hash_cache_v1:  70%|######9   | 2096/3000 [1:50:28<49:05,  3.26s/it, lr: 1.0e-04 loss: 5.775e-02]hash_cache_v1:  70%|######9   | 2097/3000 [1:50:28<47:18,  3.14s/it, lr: 1.0e-04 loss: 5.775e-02]hash_cache_v1:  70%|######9   | 2097/3000 [1:50:28<47:18,  3.14s/it, lr: 1.0e-04 loss: 5.775e-02]hash_cache_v1:  70%|######9   | 2097/3000 [1:50:31<47:18,  3.14s/it, lr: 1.0e-04 loss: 7.031e-02]hash_cache_v1:  70%|######9   | 2097/3000 [1:50:31<47:18,  3.14s/it, lr: 1.0e-04 loss: 7.031e-02]hash_cache_v1:  70%|######9   | 2098/3000 [1:50:31<43:59,  2.93s/it, lr: 1.0e-04 loss: 7.031e-02]hash_cache_v1:  70%|######9   | 2098/3000 [1:50:31<43:59,  2.93s/it, lr: 1.0e-04 loss: 7.031e-02]hash_cache_v1:  70%|######9   | 2098/3000 [1:50:33<43:59,  2.93s/it, lr: 1.0e-04 loss: 1.489e-01]hash_cache_v1:  70%|######9   | 2098/3000 [1:50:33<43:59,  2.93s/it, lr: 1.0e-04 loss: 1.489e-01]hash_cache_v1:  70%|######9   | 2099/3000 [1:50:33<40:20,  2.69s/it, lr: 1.0e-04 loss: 1.489e-01]hash_cache_v1:  70%|######9   | 2099/3000 [1:50:33<40:20,  2.69s/it, lr: 1.0e-04 loss: 1.489e-01]hash_cache_v1:  70%|######9   | 2099/3000 [1:50:36<40:20,  2.69s/it, lr: 1.0e-04 loss: 1.545e-01]hash_cache_v1:  70%|######9   | 2099/3000 [1:50:36<40:20,  2.69s/it, lr: 1.0e-04 loss: 1.545e-01]hash_cache_v1:  70%|#######   | 2100/3000 [1:50:40<40:17,  2.69s/it, lr: 1.0e-04 loss: 1.164e-02]hash_cache_v1:  70%|#######   | 2100/3000 [1:50:40<40:17,  2.69s/it, lr: 1.0e-04 loss: 1.164e-02]hash_cache_v1:  70%|#######   | 2101/3000 [1:50:40<36:13,  2.42s/it, lr: 1.0e-04 loss: 1.164e-02]hash_cache_v1:  70%|#######   | 2101/3000 [1:50:40<36:13,  2.42s/it, lr: 1.0e-04 loss: 1.164e-02]hash_cache_v1:  70%|#######   | 2101/3000 [1:50:44<36:13,  2.42s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:  70%|#######   | 2101/3000 [1:50:44<36:13,  2.42s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:  70%|#######   | 2102/3000 [1:50:44<43:59,  2.94s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:  70%|#######   | 2102/3000 [1:50:44<43:59,  2.94s/it, lr: 1.0e-04 loss: 1.874e-01]hash_cache_v1:  70%|#######   | 2102/3000 [1:50:47<43:59,  2.94s/it, lr: 1.0e-04 loss: 9.369e-02]hash_cache_v1:  70%|#######   | 2102/3000 [1:50:47<43:59,  2.94s/it, lr: 1.0e-04 loss: 9.369e-02]hash_cache_v1:  70%|#######   | 2103/3000 [1:50:47<43:37,  2.92s/it, lr: 1.0e-04 loss: 9.369e-02]hash_cache_v1:  70%|#######   | 2103/3000 [1:50:47<43:37,  2.92s/it, lr: 1.0e-04 loss: 9.369e-02]hash_cache_v1:  70%|#######   | 2103/3000 [1:50:52<43:37,  2.92s/it, lr: 1.0e-04 loss: 9.357e-02]hash_cache_v1:  70%|#######   | 2103/3000 [1:50:52<43:37,  2.92s/it, lr: 1.0e-04 loss: 9.357e-02]hash_cache_v1:  70%|#######   | 2104/3000 [1:50:52<49:11,  3.29s/it, lr: 1.0e-04 loss: 9.357e-02]hash_cache_v1:  70%|#######   | 2104/3000 [1:50:52<49:11,  3.29s/it, lr: 1.0e-04 loss: 9.357e-02]hash_cache_v1:  70%|#######   | 2104/3000 [1:50:56<49:11,  3.29s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  70%|#######   | 2104/3000 [1:50:56<49:11,  3.29s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  70%|#######   | 2105/3000 [1:50:56<54:13,  3.63s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  70%|#######   | 2105/3000 [1:50:56<54:13,  3.63s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  70%|#######   | 2105/3000 [1:50:59<54:13,  3.63s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  70%|#######   | 2105/3000 [1:50:59<54:13,  3.63s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  70%|#######   | 2106/3000 [1:50:59<51:01,  3.42s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  70%|#######   | 2106/3000 [1:50:59<51:01,  3.42s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  70%|#######   | 2106/3000 [1:51:01<51:01,  3.42s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  70%|#######   | 2106/3000 [1:51:01<51:01,  3.42s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  70%|#######   | 2107/3000 [1:51:01<45:15,  3.04s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  70%|#######   | 2107/3000 [1:51:01<45:15,  3.04s/it, lr: 1.0e-04 loss: 0.000e+00]hash_cache_v1:  70%|#######   | 2107/3000 [1:51:03<45:15,  3.04s/it, lr: 1.0e-04 loss: 1.450e-01]hash_cache_v1:  70%|#######   | 2107/3000 [1:51:03<45:15,  3.04s/it, lr: 1.0e-04 loss: 1.450e-01]hash_cache_v1:  70%|#######   | 2108/3000 [1:51:03<41:08,  2.77s/it, lr: 1.0e-04 loss: 1.450e-01]hash_cache_v1:  70%|#######   | 2108/3000 [1:51:03<41:08,  2.77s/it, lr: 1.0e-04 loss: 1.450e-01]hash_cache_v1:  70%|#######   | 2108/3000 [1:51:08<41:08,  2.77s/it, lr: 1.0e-04 loss: 4.931e-02]hash_cache_v1:  70%|#######   | 2108/3000 [1:51:08<41:08,  2.77s/it, lr: 1.0e-04 loss: 4.931e-02]hash_cache_v1:  70%|#######   | 2109/3000 [1:51:08<48:45,  3.28s/it, lr: 1.0e-04 loss: 4.931e-02]hash_cache_v1:  70%|#######   | 2109/3000 [1:51:08<48:45,  3.28s/it, lr: 1.0e-04 loss: 4.931e-02]hash_cache_v1:  70%|#######   | 2109/3000 [1:51:12<48:45,  3.28s/it, lr: 1.0e-04 loss: 4.936e-02]hash_cache_v1:  70%|#######   | 2109/3000 [1:51:12<48:45,  3.28s/it, lr: 1.0e-04 loss: 4.936e-02]hash_cache_v1:  70%|#######   | 2110/3000 [1:51:16<48:42,  3.28s/it, lr: 1.0e-04 loss: 1.250e-01]hash_cache_v1:  70%|#######   | 2110/3000 [1:51:16<48:42,  3.28s/it, lr: 1.0e-04 loss: 1.250e-01]hash_cache_v1:  70%|#######   | 2111/3000 [1:51:16<40:58,  2.77s/it, lr: 1.0e-04 loss: 1.250e-01]hash_cache_v1:  70%|#######   | 2111/3000 [1:51:16<40:58,  2.77s/it, lr: 1.0e-04 loss: 1.250e-01]hash_cache_v1:  70%|#######   | 2111/3000 [1:51:21<40:58,  2.77s/it, lr: 1.0e-04 loss: 7.850e-02]hash_cache_v1:  70%|#######   | 2111/3000 [1:51:21<40:58,  2.77s/it, lr: 1.0e-04 loss: 7.850e-02]hash_cache_v1:  70%|#######   | 2112/3000 [1:51:21<46:17,  3.13s/it, lr: 1.0e-04 loss: 7.850e-02]hash_cache_v1:  70%|#######   | 2112/3000 [1:51:21<46:17,  3.13s/it, lr: 1.0e-04 loss: 7.850e-02]hash_cache_v1:  70%|#######   | 2112/3000 [1:51:24<46:17,  3.13s/it, lr: 1.0e-04 loss: 8.657e-02]hash_cache_v1:  70%|#######   | 2112/3000 [1:51:24<46:17,  3.13s/it, lr: 1.0e-04 loss: 8.657e-02]hash_cache_v1:  70%|#######   | 2113/3000 [1:51:24<46:09,  3.12s/it, lr: 1.0e-04 loss: 8.657e-02]hash_cache_v1:  70%|#######   | 2113/3000 [1:51:24<46:09,  3.12s/it, lr: 1.0e-04 loss: 8.657e-02]hash_cache_v1:  70%|#######   | 2113/3000 [1:51:27<46:09,  3.12s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  70%|#######   | 2113/3000 [1:51:27<46:09,  3.12s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  70%|#######   | 2114/3000 [1:51:27<45:09,  3.06s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  70%|#######   | 2114/3000 [1:51:27<45:09,  3.06s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  70%|#######   | 2114/3000 [1:51:29<45:09,  3.06s/it, lr: 1.0e-04 loss: 1.117e-01]hash_cache_v1:  70%|#######   | 2114/3000 [1:51:29<45:09,  3.06s/it, lr: 1.0e-04 loss: 1.117e-01]hash_cache_v1:  70%|#######   | 2115/3000 [1:51:29<44:10,  3.00s/it, lr: 1.0e-04 loss: 1.117e-01]hash_cache_v1:  70%|#######   | 2115/3000 [1:51:29<44:10,  3.00s/it, lr: 1.0e-04 loss: 1.117e-01]hash_cache_v1:  70%|#######   | 2115/3000 [1:51:32<44:10,  3.00s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  70%|#######   | 2115/3000 [1:51:32<44:10,  3.00s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  71%|#######   | 2116/3000 [1:51:32<41:33,  2.82s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  71%|#######   | 2116/3000 [1:51:32<41:33,  2.82s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  71%|#######   | 2116/3000 [1:51:34<41:33,  2.82s/it, lr: 1.0e-04 loss: 1.398e-01]hash_cache_v1:  71%|#######   | 2116/3000 [1:51:34<41:33,  2.82s/it, lr: 1.0e-04 loss: 1.398e-01]hash_cache_v1:  71%|#######   | 2117/3000 [1:51:34<38:26,  2.61s/it, lr: 1.0e-04 loss: 1.398e-01]hash_cache_v1:  71%|#######   | 2117/3000 [1:51:34<38:26,  2.61s/it, lr: 1.0e-04 loss: 1.398e-01]hash_cache_v1:  71%|#######   | 2117/3000 [1:51:37<38:26,  2.61s/it, lr: 1.0e-04 loss: 3.143e-02]hash_cache_v1:  71%|#######   | 2117/3000 [1:51:37<38:26,  2.61s/it, lr: 1.0e-04 loss: 3.143e-02]hash_cache_v1:  71%|#######   | 2118/3000 [1:51:37<39:33,  2.69s/it, lr: 1.0e-04 loss: 3.143e-02]hash_cache_v1:  71%|#######   | 2118/3000 [1:51:37<39:33,  2.69s/it, lr: 1.0e-04 loss: 3.143e-02]hash_cache_v1:  71%|#######   | 2118/3000 [1:51:39<39:33,  2.69s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  71%|#######   | 2118/3000 [1:51:39<39:33,  2.69s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  71%|#######   | 2119/3000 [1:51:39<36:54,  2.51s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  71%|#######   | 2119/3000 [1:51:39<36:54,  2.51s/it, lr: 1.0e-04 loss: 1.456e-01]hash_cache_v1:  71%|#######   | 2119/3000 [1:51:42<36:54,  2.51s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  71%|#######   | 2119/3000 [1:51:42<36:54,  2.51s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  71%|#######   | 2120/3000 [1:51:45<36:51,  2.51s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  71%|#######   | 2120/3000 [1:51:45<36:51,  2.51s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  71%|#######   | 2121/3000 [1:51:45<29:33,  2.02s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  71%|#######   | 2121/3000 [1:51:45<29:33,  2.02s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  71%|#######   | 2121/3000 [1:51:47<29:33,  2.02s/it, lr: 1.0e-04 loss: 7.678e-02]hash_cache_v1:  71%|#######   | 2121/3000 [1:51:47<29:33,  2.02s/it, lr: 1.0e-04 loss: 7.678e-02]hash_cache_v1:  71%|#######   | 2122/3000 [1:51:47<29:46,  2.03s/it, lr: 1.0e-04 loss: 7.678e-02]hash_cache_v1:  71%|#######   | 2122/3000 [1:51:47<29:46,  2.03s/it, lr: 1.0e-04 loss: 7.678e-02]hash_cache_v1:  71%|#######   | 2122/3000 [1:51:49<29:46,  2.03s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  71%|#######   | 2122/3000 [1:51:49<29:46,  2.03s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  71%|#######   | 2123/3000 [1:51:49<30:00,  2.05s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  71%|#######   | 2123/3000 [1:51:49<30:00,  2.05s/it, lr: 1.0e-04 loss: 1.373e-01]hash_cache_v1:  71%|#######   | 2123/3000 [1:51:53<30:00,  2.05s/it, lr: 1.0e-04 loss: 1.615e-02]hash_cache_v1:  71%|#######   | 2123/3000 [1:51:53<30:00,  2.05s/it, lr: 1.0e-04 loss: 1.615e-02]hash_cache_v1:  71%|#######   | 2124/3000 [1:51:53<39:34,  2.71s/it, lr: 1.0e-04 loss: 1.615e-02]hash_cache_v1:  71%|#######   | 2124/3000 [1:51:53<39:34,  2.71s/it, lr: 1.0e-04 loss: 1.615e-02]hash_cache_v1:  71%|#######   | 2124/3000 [1:51:58<39:34,  2.71s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  71%|#######   | 2124/3000 [1:51:58<39:34,  2.71s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  71%|#######   | 2125/3000 [1:51:58<45:51,  3.14s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  71%|#######   | 2125/3000 [1:51:58<45:51,  3.14s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  71%|#######   | 2125/3000 [1:52:02<45:51,  3.14s/it, lr: 1.0e-04 loss: 7.355e-02]hash_cache_v1:  71%|#######   | 2125/3000 [1:52:02<45:51,  3.14s/it, lr: 1.0e-04 loss: 7.355e-02]hash_cache_v1:  71%|#######   | 2126/3000 [1:52:02<50:44,  3.48s/it, lr: 1.0e-04 loss: 7.355e-02]hash_cache_v1:  71%|#######   | 2126/3000 [1:52:02<50:44,  3.48s/it, lr: 1.0e-04 loss: 7.355e-02]hash_cache_v1:  71%|#######   | 2126/3000 [1:52:05<50:44,  3.48s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  71%|#######   | 2126/3000 [1:52:05<50:44,  3.48s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  71%|#######   | 2127/3000 [1:52:05<49:00,  3.37s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  71%|#######   | 2127/3000 [1:52:05<49:00,  3.37s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  71%|#######   | 2127/3000 [1:52:07<49:00,  3.37s/it, lr: 1.0e-04 loss: 3.981e-02]hash_cache_v1:  71%|#######   | 2127/3000 [1:52:07<49:00,  3.37s/it, lr: 1.0e-04 loss: 3.981e-02]hash_cache_v1:  71%|#######   | 2128/3000 [1:52:07<43:34,  3.00s/it, lr: 1.0e-04 loss: 3.981e-02]hash_cache_v1:  71%|#######   | 2128/3000 [1:52:07<43:34,  3.00s/it, lr: 1.0e-04 loss: 3.981e-02]hash_cache_v1:  71%|#######   | 2128/3000 [1:52:12<43:34,  3.00s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  71%|#######   | 2128/3000 [1:52:12<43:34,  3.00s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  71%|#######   | 2129/3000 [1:52:12<49:11,  3.39s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  71%|#######   | 2129/3000 [1:52:12<49:11,  3.39s/it, lr: 1.0e-04 loss: 1.036e-01]hash_cache_v1:  71%|#######   | 2129/3000 [1:52:16<49:11,  3.39s/it, lr: 1.0e-04 loss: 7.889e-02]hash_cache_v1:  71%|#######   | 2129/3000 [1:52:16<49:11,  3.39s/it, lr: 1.0e-04 loss: 7.889e-02]hash_cache_v1:  71%|#######1  | 2130/3000 [1:52:19<49:08,  3.39s/it, lr: 1.0e-04 loss: 4.657e-02]hash_cache_v1:  71%|#######1  | 2130/3000 [1:52:19<49:08,  3.39s/it, lr: 1.0e-04 loss: 4.657e-02]hash_cache_v1:  71%|#######1  | 2131/3000 [1:52:19<36:53,  2.55s/it, lr: 1.0e-04 loss: 4.657e-02]hash_cache_v1:  71%|#######1  | 2131/3000 [1:52:19<36:53,  2.55s/it, lr: 1.0e-04 loss: 4.657e-02]hash_cache_v1:  71%|#######1  | 2131/3000 [1:52:22<36:53,  2.55s/it, lr: 1.0e-04 loss: 3.450e-02]hash_cache_v1:  71%|#######1  | 2131/3000 [1:52:22<36:53,  2.55s/it, lr: 1.0e-04 loss: 3.450e-02]hash_cache_v1:  71%|#######1  | 2132/3000 [1:52:22<37:54,  2.62s/it, lr: 1.0e-04 loss: 3.450e-02]hash_cache_v1:  71%|#######1  | 2132/3000 [1:52:22<37:54,  2.62s/it, lr: 1.0e-04 loss: 3.450e-02]hash_cache_v1:  71%|#######1  | 2132/3000 [1:52:24<37:54,  2.62s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  71%|#######1  | 2132/3000 [1:52:24<37:54,  2.62s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  71%|#######1  | 2133/3000 [1:52:24<35:58,  2.49s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  71%|#######1  | 2133/3000 [1:52:24<35:58,  2.49s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  71%|#######1  | 2133/3000 [1:52:26<35:58,  2.49s/it, lr: 1.0e-04 loss: 1.760e-01]hash_cache_v1:  71%|#######1  | 2133/3000 [1:52:26<35:58,  2.49s/it, lr: 1.0e-04 loss: 1.760e-01]hash_cache_v1:  71%|#######1  | 2134/3000 [1:52:26<34:24,  2.38s/it, lr: 1.0e-04 loss: 1.760e-01]hash_cache_v1:  71%|#######1  | 2134/3000 [1:52:26<34:24,  2.38s/it, lr: 1.0e-04 loss: 1.760e-01]hash_cache_v1:  71%|#######1  | 2134/3000 [1:52:31<34:24,  2.38s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  71%|#######1  | 2134/3000 [1:52:31<34:24,  2.38s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  71%|#######1  | 2135/3000 [1:52:31<43:11,  3.00s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  71%|#######1  | 2135/3000 [1:52:31<43:11,  3.00s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  71%|#######1  | 2135/3000 [1:52:33<43:11,  3.00s/it, lr: 1.0e-04 loss: 5.300e-02]hash_cache_v1:  71%|#######1  | 2135/3000 [1:52:33<43:11,  3.00s/it, lr: 1.0e-04 loss: 5.300e-02]hash_cache_v1:  71%|#######1  | 2136/3000 [1:52:33<42:32,  2.95s/it, lr: 1.0e-04 loss: 5.300e-02]hash_cache_v1:  71%|#######1  | 2136/3000 [1:52:33<42:32,  2.95s/it, lr: 1.0e-04 loss: 5.300e-02]hash_cache_v1:  71%|#######1  | 2136/3000 [1:52:38<42:32,  2.95s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  71%|#######1  | 2136/3000 [1:52:38<42:32,  2.95s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  71%|#######1  | 2137/3000 [1:52:38<48:13,  3.35s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  71%|#######1  | 2137/3000 [1:52:38<48:13,  3.35s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  71%|#######1  | 2137/3000 [1:52:42<48:13,  3.35s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  71%|#######1  | 2137/3000 [1:52:42<48:13,  3.35s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  71%|#######1  | 2138/3000 [1:52:42<52:59,  3.69s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  71%|#######1  | 2138/3000 [1:52:42<52:59,  3.69s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  71%|#######1  | 2138/3000 [1:52:47<52:59,  3.69s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  71%|#######1  | 2138/3000 [1:52:47<52:59,  3.69s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  71%|#######1  | 2139/3000 [1:52:47<55:36,  3.87s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  71%|#######1  | 2139/3000 [1:52:47<55:36,  3.87s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  71%|#######1  | 2139/3000 [1:52:49<55:36,  3.87s/it, lr: 1.0e-04 loss: 1.641e-01]hash_cache_v1:  71%|#######1  | 2139/3000 [1:52:49<55:36,  3.87s/it, lr: 1.0e-04 loss: 1.641e-01]hash_cache_v1:  71%|#######1  | 2140/3000 [1:52:51<55:32,  3.87s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  71%|#######1  | 2140/3000 [1:52:51<55:32,  3.87s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  71%|#######1  | 2141/3000 [1:52:51<39:08,  2.73s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  71%|#######1  | 2141/3000 [1:52:51<39:08,  2.73s/it, lr: 1.0e-04 loss: 1.762e-01]hash_cache_v1:  71%|#######1  | 2141/3000 [1:52:54<39:08,  2.73s/it, lr: 1.0e-04 loss: 9.228e-02]hash_cache_v1:  71%|#######1  | 2141/3000 [1:52:54<39:08,  2.73s/it, lr: 1.0e-04 loss: 9.228e-02]hash_cache_v1:  71%|#######1  | 2142/3000 [1:52:54<37:50,  2.65s/it, lr: 1.0e-04 loss: 9.228e-02]hash_cache_v1:  71%|#######1  | 2142/3000 [1:52:54<37:50,  2.65s/it, lr: 1.0e-04 loss: 9.228e-02]hash_cache_v1:  71%|#######1  | 2142/3000 [1:52:56<37:50,  2.65s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  71%|#######1  | 2142/3000 [1:52:56<37:50,  2.65s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  71%|#######1  | 2143/3000 [1:52:56<35:44,  2.50s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  71%|#######1  | 2143/3000 [1:52:56<35:44,  2.50s/it, lr: 1.0e-04 loss: 1.986e-01]hash_cache_v1:  71%|#######1  | 2143/3000 [1:53:00<35:44,  2.50s/it, lr: 1.0e-04 loss: 2.459e-02]hash_cache_v1:  71%|#######1  | 2143/3000 [1:53:00<35:44,  2.50s/it, lr: 1.0e-04 loss: 2.459e-02]hash_cache_v1:  71%|#######1  | 2144/3000 [1:53:00<42:40,  2.99s/it, lr: 1.0e-04 loss: 2.459e-02]hash_cache_v1:  71%|#######1  | 2144/3000 [1:53:00<42:40,  2.99s/it, lr: 1.0e-04 loss: 2.459e-02]hash_cache_v1:  71%|#######1  | 2144/3000 [1:53:02<42:40,  2.99s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  71%|#######1  | 2144/3000 [1:53:02<42:40,  2.99s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  72%|#######1  | 2145/3000 [1:53:02<39:04,  2.74s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  72%|#######1  | 2145/3000 [1:53:02<39:04,  2.74s/it, lr: 1.0e-04 loss: 1.053e-01]hash_cache_v1:  72%|#######1  | 2145/3000 [1:53:05<39:04,  2.74s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  72%|#######1  | 2145/3000 [1:53:05<39:04,  2.74s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  72%|#######1  | 2146/3000 [1:53:05<37:27,  2.63s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  72%|#######1  | 2146/3000 [1:53:05<37:27,  2.63s/it, lr: 1.0e-04 loss: 1.665e-01]hash_cache_v1:  72%|#######1  | 2146/3000 [1:53:09<37:27,  2.63s/it, lr: 1.0e-04 loss: 5.731e-02]hash_cache_v1:  72%|#######1  | 2146/3000 [1:53:09<37:27,  2.63s/it, lr: 1.0e-04 loss: 5.731e-02]hash_cache_v1:  72%|#######1  | 2147/3000 [1:53:09<44:21,  3.12s/it, lr: 1.0e-04 loss: 5.731e-02]hash_cache_v1:  72%|#######1  | 2147/3000 [1:53:09<44:21,  3.12s/it, lr: 1.0e-04 loss: 5.731e-02]hash_cache_v1:  72%|#######1  | 2147/3000 [1:53:11<44:21,  3.12s/it, lr: 1.0e-04 loss: 8.320e-02]hash_cache_v1:  72%|#######1  | 2147/3000 [1:53:11<44:21,  3.12s/it, lr: 1.0e-04 loss: 8.320e-02]hash_cache_v1:  72%|#######1  | 2148/3000 [1:53:11<40:04,  2.82s/it, lr: 1.0e-04 loss: 8.320e-02]hash_cache_v1:  72%|#######1  | 2148/3000 [1:53:11<40:04,  2.82s/it, lr: 1.0e-04 loss: 8.320e-02]hash_cache_v1:  72%|#######1  | 2148/3000 [1:53:14<40:04,  2.82s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  72%|#######1  | 2148/3000 [1:53:14<40:04,  2.82s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  72%|#######1  | 2149/3000 [1:53:14<41:16,  2.91s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  72%|#######1  | 2149/3000 [1:53:14<41:16,  2.91s/it, lr: 1.0e-04 loss: 1.275e-01]hash_cache_v1:  72%|#######1  | 2149/3000 [1:53:19<41:16,  2.91s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:  72%|#######1  | 2149/3000 [1:53:19<41:16,  2.91s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:  72%|#######1  | 2150/3000 [1:53:21<41:13,  2.91s/it, lr: 1.0e-04 loss: 1.842e-03]hash_cache_v1:  72%|#######1  | 2150/3000 [1:53:21<41:13,  2.91s/it, lr: 1.0e-04 loss: 1.842e-03]hash_cache_v1:  72%|#######1  | 2151/3000 [1:53:21<29:10,  2.06s/it, lr: 1.0e-04 loss: 1.842e-03]hash_cache_v1:  72%|#######1  | 2151/3000 [1:53:21<29:10,  2.06s/it, lr: 1.0e-04 loss: 1.842e-03]hash_cache_v1:  72%|#######1  | 2151/3000 [1:53:23<29:10,  2.06s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  72%|#######1  | 2151/3000 [1:53:23<29:10,  2.06s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  72%|#######1  | 2152/3000 [1:53:23<29:13,  2.07s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  72%|#######1  | 2152/3000 [1:53:23<29:13,  2.07s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  72%|#######1  | 2152/3000 [1:53:27<29:13,  2.07s/it, lr: 1.0e-04 loss: 9.892e-02]hash_cache_v1:  72%|#######1  | 2152/3000 [1:53:27<29:13,  2.07s/it, lr: 1.0e-04 loss: 9.892e-02]hash_cache_v1:  72%|#######1  | 2153/3000 [1:53:27<38:11,  2.71s/it, lr: 1.0e-04 loss: 9.892e-02]hash_cache_v1:  72%|#######1  | 2153/3000 [1:53:27<38:11,  2.71s/it, lr: 1.0e-04 loss: 9.892e-02]hash_cache_v1:  72%|#######1  | 2153/3000 [1:53:29<38:11,  2.71s/it, lr: 1.0e-04 loss: 1.326e-01]hash_cache_v1:  72%|#######1  | 2153/3000 [1:53:29<38:11,  2.71s/it, lr: 1.0e-04 loss: 1.326e-01]hash_cache_v1:  72%|#######1  | 2154/3000 [1:53:29<35:53,  2.55s/it, lr: 1.0e-04 loss: 1.326e-01]hash_cache_v1:  72%|#######1  | 2154/3000 [1:53:29<35:53,  2.55s/it, lr: 1.0e-04 loss: 1.326e-01]hash_cache_v1:  72%|#######1  | 2154/3000 [1:53:31<35:53,  2.55s/it, lr: 1.0e-04 loss: 9.268e-02]hash_cache_v1:  72%|#######1  | 2154/3000 [1:53:31<35:53,  2.55s/it, lr: 1.0e-04 loss: 9.268e-02]hash_cache_v1:  72%|#######1  | 2155/3000 [1:53:31<34:05,  2.42s/it, lr: 1.0e-04 loss: 9.268e-02]hash_cache_v1:  72%|#######1  | 2155/3000 [1:53:31<34:05,  2.42s/it, lr: 1.0e-04 loss: 9.268e-02]hash_cache_v1:  72%|#######1  | 2155/3000 [1:53:34<34:05,  2.42s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  72%|#######1  | 2155/3000 [1:53:34<34:05,  2.42s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  72%|#######1  | 2156/3000 [1:53:34<33:58,  2.42s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  72%|#######1  | 2156/3000 [1:53:34<33:58,  2.42s/it, lr: 1.0e-04 loss: 1.460e-01]hash_cache_v1:  72%|#######1  | 2156/3000 [1:53:36<33:58,  2.42s/it, lr: 1.0e-04 loss: 2.331e-01]hash_cache_v1:  72%|#######1  | 2156/3000 [1:53:36<33:58,  2.42s/it, lr: 1.0e-04 loss: 2.331e-01]hash_cache_v1:  72%|#######1  | 2157/3000 [1:53:36<32:39,  2.32s/it, lr: 1.0e-04 loss: 2.331e-01]hash_cache_v1:  72%|#######1  | 2157/3000 [1:53:36<32:39,  2.32s/it, lr: 1.0e-04 loss: 2.331e-01]hash_cache_v1:  72%|#######1  | 2157/3000 [1:53:38<32:39,  2.32s/it, lr: 1.0e-04 loss: 3.782e-02]hash_cache_v1:  72%|#######1  | 2157/3000 [1:53:38<32:39,  2.32s/it, lr: 1.0e-04 loss: 3.782e-02]hash_cache_v1:  72%|#######1  | 2158/3000 [1:53:38<31:41,  2.26s/it, lr: 1.0e-04 loss: 3.782e-02]hash_cache_v1:  72%|#######1  | 2158/3000 [1:53:38<31:41,  2.26s/it, lr: 1.0e-04 loss: 3.782e-02]hash_cache_v1:  72%|#######1  | 2158/3000 [1:53:42<31:41,  2.26s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  72%|#######1  | 2158/3000 [1:53:42<31:41,  2.26s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  72%|#######1  | 2159/3000 [1:53:42<40:14,  2.87s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  72%|#######1  | 2159/3000 [1:53:42<40:14,  2.87s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  72%|#######1  | 2159/3000 [1:53:46<40:14,  2.87s/it, lr: 1.0e-04 loss: 1.018e-01]hash_cache_v1:  72%|#######1  | 2159/3000 [1:53:46<40:14,  2.87s/it, lr: 1.0e-04 loss: 1.018e-01]hash_cache_v1:  72%|#######2  | 2160/3000 [1:53:48<40:11,  2.87s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  72%|#######2  | 2160/3000 [1:53:48<40:11,  2.87s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  72%|#######2  | 2161/3000 [1:53:48<28:31,  2.04s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  72%|#######2  | 2161/3000 [1:53:48<28:31,  2.04s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  72%|#######2  | 2161/3000 [1:53:51<28:31,  2.04s/it, lr: 1.0e-04 loss: 9.907e-02]hash_cache_v1:  72%|#######2  | 2161/3000 [1:53:51<28:31,  2.04s/it, lr: 1.0e-04 loss: 9.907e-02]hash_cache_v1:  72%|#######2  | 2162/3000 [1:53:51<31:20,  2.24s/it, lr: 1.0e-04 loss: 9.907e-02]hash_cache_v1:  72%|#######2  | 2162/3000 [1:53:51<31:20,  2.24s/it, lr: 1.0e-04 loss: 9.907e-02]hash_cache_v1:  72%|#######2  | 2162/3000 [1:53:53<31:20,  2.24s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  72%|#######2  | 2162/3000 [1:53:53<31:20,  2.24s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  72%|#######2  | 2163/3000 [1:53:53<31:50,  2.28s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  72%|#######2  | 2163/3000 [1:53:53<31:50,  2.28s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  72%|#######2  | 2163/3000 [1:53:58<31:50,  2.28s/it, lr: 1.0e-04 loss: 9.389e-02]hash_cache_v1:  72%|#######2  | 2163/3000 [1:53:58<31:50,  2.28s/it, lr: 1.0e-04 loss: 9.389e-02]hash_cache_v1:  72%|#######2  | 2164/3000 [1:53:58<39:25,  2.83s/it, lr: 1.0e-04 loss: 9.389e-02]hash_cache_v1:  72%|#######2  | 2164/3000 [1:53:58<39:25,  2.83s/it, lr: 1.0e-04 loss: 9.389e-02]hash_cache_v1:  72%|#######2  | 2164/3000 [1:54:00<39:25,  2.83s/it, lr: 1.0e-04 loss: 1.222e-01]hash_cache_v1:  72%|#######2  | 2164/3000 [1:54:00<39:25,  2.83s/it, lr: 1.0e-04 loss: 1.222e-01]hash_cache_v1:  72%|#######2  | 2165/3000 [1:54:00<39:25,  2.83s/it, lr: 1.0e-04 loss: 1.222e-01]hash_cache_v1:  72%|#######2  | 2165/3000 [1:54:00<39:25,  2.83s/it, lr: 1.0e-04 loss: 1.222e-01]hash_cache_v1:  72%|#######2  | 2165/3000 [1:54:03<39:25,  2.83s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  72%|#######2  | 2165/3000 [1:54:03<39:25,  2.83s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  72%|#######2  | 2166/3000 [1:54:03<39:29,  2.84s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  72%|#######2  | 2166/3000 [1:54:03<39:29,  2.84s/it, lr: 1.0e-04 loss: 1.035e-01]hash_cache_v1:  72%|#######2  | 2166/3000 [1:54:06<39:29,  2.84s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  72%|#######2  | 2166/3000 [1:54:06<39:29,  2.84s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  72%|#######2  | 2167/3000 [1:54:06<40:23,  2.91s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  72%|#######2  | 2167/3000 [1:54:06<40:23,  2.91s/it, lr: 1.0e-04 loss: 1.331e-01]hash_cache_v1:  72%|#######2  | 2167/3000 [1:54:08<40:23,  2.91s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  72%|#######2  | 2167/3000 [1:54:08<40:23,  2.91s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  72%|#######2  | 2168/3000 [1:54:08<37:06,  2.68s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  72%|#######2  | 2168/3000 [1:54:08<37:06,  2.68s/it, lr: 1.0e-04 loss: 1.310e-01]hash_cache_v1:  72%|#######2  | 2168/3000 [1:54:11<37:06,  2.68s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  72%|#######2  | 2168/3000 [1:54:11<37:06,  2.68s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  72%|#######2  | 2169/3000 [1:54:11<34:45,  2.51s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  72%|#######2  | 2169/3000 [1:54:11<34:45,  2.51s/it, lr: 1.0e-04 loss: 1.490e-01]hash_cache_v1:  72%|#######2  | 2169/3000 [1:54:15<34:45,  2.51s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  72%|#######2  | 2169/3000 [1:54:15<34:45,  2.51s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  72%|#######2  | 2170/3000 [1:54:17<34:42,  2.51s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  72%|#######2  | 2170/3000 [1:54:17<34:42,  2.51s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  72%|#######2  | 2171/3000 [1:54:17<26:19,  1.91s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  72%|#######2  | 2171/3000 [1:54:17<26:19,  1.91s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  72%|#######2  | 2171/3000 [1:54:22<26:19,  1.91s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  72%|#######2  | 2171/3000 [1:54:22<26:19,  1.91s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  72%|#######2  | 2172/3000 [1:54:22<34:26,  2.50s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  72%|#######2  | 2172/3000 [1:54:22<34:26,  2.50s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  72%|#######2  | 2172/3000 [1:54:26<34:26,  2.50s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  72%|#######2  | 2172/3000 [1:54:26<34:26,  2.50s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  72%|#######2  | 2173/3000 [1:54:26<40:46,  2.96s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  72%|#######2  | 2173/3000 [1:54:26<40:46,  2.96s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  72%|#######2  | 2173/3000 [1:54:30<40:46,  2.96s/it, lr: 1.0e-04 loss: 6.761e-02]hash_cache_v1:  72%|#######2  | 2173/3000 [1:54:30<40:46,  2.96s/it, lr: 1.0e-04 loss: 6.761e-02]hash_cache_v1:  72%|#######2  | 2174/3000 [1:54:30<45:37,  3.31s/it, lr: 1.0e-04 loss: 6.761e-02]hash_cache_v1:  72%|#######2  | 2174/3000 [1:54:30<45:37,  3.31s/it, lr: 1.0e-04 loss: 6.761e-02]hash_cache_v1:  72%|#######2  | 2174/3000 [1:54:35<45:37,  3.31s/it, lr: 1.0e-04 loss: 8.742e-02]hash_cache_v1:  72%|#######2  | 2174/3000 [1:54:35<45:37,  3.31s/it, lr: 1.0e-04 loss: 8.742e-02]hash_cache_v1:  72%|#######2  | 2175/3000 [1:54:35<50:08,  3.65s/it, lr: 1.0e-04 loss: 8.742e-02]hash_cache_v1:  72%|#######2  | 2175/3000 [1:54:35<50:08,  3.65s/it, lr: 1.0e-04 loss: 8.742e-02]hash_cache_v1:  72%|#######2  | 2175/3000 [1:54:37<50:08,  3.65s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  72%|#######2  | 2175/3000 [1:54:37<50:08,  3.65s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  73%|#######2  | 2176/3000 [1:54:37<43:57,  3.20s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  73%|#######2  | 2176/3000 [1:54:37<43:57,  3.20s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  73%|#######2  | 2176/3000 [1:54:41<43:57,  3.20s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  73%|#######2  | 2176/3000 [1:54:41<43:57,  3.20s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  73%|#######2  | 2177/3000 [1:54:41<48:13,  3.52s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  73%|#######2  | 2177/3000 [1:54:41<48:13,  3.52s/it, lr: 1.0e-04 loss: 6.950e-02]hash_cache_v1:  73%|#######2  | 2177/3000 [1:54:43<48:13,  3.52s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  73%|#######2  | 2177/3000 [1:54:43<48:13,  3.52s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  73%|#######2  | 2178/3000 [1:54:43<43:36,  3.18s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  73%|#######2  | 2178/3000 [1:54:43<43:36,  3.18s/it, lr: 1.0e-04 loss: 1.620e-01]hash_cache_v1:  73%|#######2  | 2178/3000 [1:54:46<43:36,  3.18s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  73%|#######2  | 2178/3000 [1:54:46<43:36,  3.18s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  73%|#######2  | 2179/3000 [1:54:46<42:07,  3.08s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  73%|#######2  | 2179/3000 [1:54:46<42:07,  3.08s/it, lr: 1.0e-04 loss: 1.643e-01]hash_cache_v1:  73%|#######2  | 2179/3000 [1:54:48<42:07,  3.08s/it, lr: 1.0e-04 loss: 1.101e-01]hash_cache_v1:  73%|#######2  | 2179/3000 [1:54:48<42:07,  3.08s/it, lr: 1.0e-04 loss: 1.101e-01]hash_cache_v1:  73%|#######2  | 2180/3000 [1:54:53<42:04,  3.08s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  73%|#######2  | 2180/3000 [1:54:53<42:04,  3.08s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  73%|#######2  | 2181/3000 [1:54:53<36:13,  2.65s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  73%|#######2  | 2181/3000 [1:54:53<36:13,  2.65s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  73%|#######2  | 2181/3000 [1:54:55<36:13,  2.65s/it, lr: 1.0e-04 loss: 1.776e-02]hash_cache_v1:  73%|#######2  | 2181/3000 [1:54:55<36:13,  2.65s/it, lr: 1.0e-04 loss: 1.776e-02]hash_cache_v1:  73%|#######2  | 2182/3000 [1:54:55<35:13,  2.58s/it, lr: 1.0e-04 loss: 1.776e-02]hash_cache_v1:  73%|#######2  | 2182/3000 [1:54:55<35:13,  2.58s/it, lr: 1.0e-04 loss: 1.776e-02]hash_cache_v1:  73%|#######2  | 2182/3000 [1:54:59<35:13,  2.58s/it, lr: 1.0e-04 loss: 4.332e-02]hash_cache_v1:  73%|#######2  | 2182/3000 [1:54:59<35:13,  2.58s/it, lr: 1.0e-04 loss: 4.332e-02]hash_cache_v1:  73%|#######2  | 2183/3000 [1:54:59<41:18,  3.03s/it, lr: 1.0e-04 loss: 4.332e-02]hash_cache_v1:  73%|#######2  | 2183/3000 [1:54:59<41:18,  3.03s/it, lr: 1.0e-04 loss: 4.332e-02]hash_cache_v1:  73%|#######2  | 2183/3000 [1:55:01<41:18,  3.03s/it, lr: 1.0e-04 loss: 2.512e-01]hash_cache_v1:  73%|#######2  | 2183/3000 [1:55:01<41:18,  3.03s/it, lr: 1.0e-04 loss: 2.512e-01]hash_cache_v1:  73%|#######2  | 2184/3000 [1:55:01<37:50,  2.78s/it, lr: 1.0e-04 loss: 2.512e-01]hash_cache_v1:  73%|#######2  | 2184/3000 [1:55:01<37:50,  2.78s/it, lr: 1.0e-04 loss: 2.512e-01]hash_cache_v1:  73%|#######2  | 2184/3000 [1:55:04<37:50,  2.78s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  73%|#######2  | 2184/3000 [1:55:04<37:50,  2.78s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  73%|#######2  | 2185/3000 [1:55:04<38:07,  2.81s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  73%|#######2  | 2185/3000 [1:55:04<38:07,  2.81s/it, lr: 1.0e-04 loss: 1.494e-01]hash_cache_v1:  73%|#######2  | 2185/3000 [1:55:07<38:07,  2.81s/it, lr: 1.0e-04 loss: 3.625e-02]hash_cache_v1:  73%|#######2  | 2185/3000 [1:55:07<38:07,  2.81s/it, lr: 1.0e-04 loss: 3.625e-02]hash_cache_v1:  73%|#######2  | 2186/3000 [1:55:07<39:05,  2.88s/it, lr: 1.0e-04 loss: 3.625e-02]hash_cache_v1:  73%|#######2  | 2186/3000 [1:55:07<39:05,  2.88s/it, lr: 1.0e-04 loss: 3.625e-02]hash_cache_v1:  73%|#######2  | 2186/3000 [1:55:09<39:05,  2.88s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  73%|#######2  | 2186/3000 [1:55:09<39:05,  2.88s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  73%|#######2  | 2187/3000 [1:55:09<35:56,  2.65s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  73%|#######2  | 2187/3000 [1:55:09<35:56,  2.65s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  73%|#######2  | 2187/3000 [1:55:12<35:56,  2.65s/it, lr: 1.0e-04 loss: 8.855e-02]hash_cache_v1:  73%|#######2  | 2187/3000 [1:55:12<35:56,  2.65s/it, lr: 1.0e-04 loss: 8.855e-02]hash_cache_v1:  73%|#######2  | 2188/3000 [1:55:12<33:43,  2.49s/it, lr: 1.0e-04 loss: 8.855e-02]hash_cache_v1:  73%|#######2  | 2188/3000 [1:55:12<33:43,  2.49s/it, lr: 1.0e-04 loss: 8.855e-02]hash_cache_v1:  73%|#######2  | 2188/3000 [1:55:15<33:43,  2.49s/it, lr: 1.0e-04 loss: 7.726e-02]hash_cache_v1:  73%|#######2  | 2188/3000 [1:55:15<33:43,  2.49s/it, lr: 1.0e-04 loss: 7.726e-02]hash_cache_v1:  73%|#######2  | 2189/3000 [1:55:15<36:07,  2.67s/it, lr: 1.0e-04 loss: 7.726e-02]hash_cache_v1:  73%|#######2  | 2189/3000 [1:55:15<36:07,  2.67s/it, lr: 1.0e-04 loss: 7.726e-02]hash_cache_v1:  73%|#######2  | 2189/3000 [1:55:17<36:07,  2.67s/it, lr: 1.0e-04 loss: 7.387e-02]hash_cache_v1:  73%|#######2  | 2189/3000 [1:55:17<36:07,  2.67s/it, lr: 1.0e-04 loss: 7.387e-02]hash_cache_v1:  73%|#######3  | 2190/3000 [1:55:21<36:04,  2.67s/it, lr: 1.0e-04 loss: 7.190e-02]hash_cache_v1:  73%|#######3  | 2190/3000 [1:55:21<36:04,  2.67s/it, lr: 1.0e-04 loss: 7.190e-02]hash_cache_v1:  73%|#######3  | 2191/3000 [1:55:21<32:48,  2.43s/it, lr: 1.0e-04 loss: 7.190e-02]hash_cache_v1:  73%|#######3  | 2191/3000 [1:55:21<32:48,  2.43s/it, lr: 1.0e-04 loss: 7.190e-02]hash_cache_v1:  73%|#######3  | 2191/3000 [1:55:25<32:48,  2.43s/it, lr: 1.0e-04 loss: 9.520e-02]hash_cache_v1:  73%|#######3  | 2191/3000 [1:55:25<32:48,  2.43s/it, lr: 1.0e-04 loss: 9.520e-02]hash_cache_v1:  73%|#######3  | 2192/3000 [1:55:25<38:52,  2.89s/it, lr: 1.0e-04 loss: 9.520e-02]hash_cache_v1:  73%|#######3  | 2192/3000 [1:55:25<38:52,  2.89s/it, lr: 1.0e-04 loss: 9.520e-02]hash_cache_v1:  73%|#######3  | 2192/3000 [1:55:28<38:52,  2.89s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  73%|#######3  | 2192/3000 [1:55:28<38:52,  2.89s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  73%|#######3  | 2193/3000 [1:55:28<39:25,  2.93s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  73%|#######3  | 2193/3000 [1:55:28<39:25,  2.93s/it, lr: 1.0e-04 loss: 1.071e-01]hash_cache_v1:  73%|#######3  | 2193/3000 [1:55:33<39:25,  2.93s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  73%|#######3  | 2193/3000 [1:55:33<39:25,  2.93s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  73%|#######3  | 2194/3000 [1:55:33<44:27,  3.31s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  73%|#######3  | 2194/3000 [1:55:33<44:27,  3.31s/it, lr: 1.0e-04 loss: 1.255e-01]hash_cache_v1:  73%|#######3  | 2194/3000 [1:55:35<44:27,  3.31s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  73%|#######3  | 2194/3000 [1:55:35<44:27,  3.31s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  73%|#######3  | 2195/3000 [1:55:35<39:54,  2.97s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  73%|#######3  | 2195/3000 [1:55:35<39:54,  2.97s/it, lr: 1.0e-04 loss: 1.698e-01]hash_cache_v1:  73%|#######3  | 2195/3000 [1:55:39<39:54,  2.97s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  73%|#######3  | 2195/3000 [1:55:39<39:54,  2.97s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  73%|#######3  | 2196/3000 [1:55:39<44:54,  3.35s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  73%|#######3  | 2196/3000 [1:55:39<44:54,  3.35s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  73%|#######3  | 2196/3000 [1:55:44<44:54,  3.35s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  73%|#######3  | 2196/3000 [1:55:44<44:54,  3.35s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  73%|#######3  | 2197/3000 [1:55:44<49:07,  3.67s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  73%|#######3  | 2197/3000 [1:55:44<49:07,  3.67s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  73%|#######3  | 2197/3000 [1:55:48<49:07,  3.67s/it, lr: 1.0e-04 loss: 5.452e-02]hash_cache_v1:  73%|#######3  | 2197/3000 [1:55:48<49:07,  3.67s/it, lr: 1.0e-04 loss: 5.452e-02]hash_cache_v1:  73%|#######3  | 2198/3000 [1:55:48<51:46,  3.87s/it, lr: 1.0e-04 loss: 5.452e-02]hash_cache_v1:  73%|#######3  | 2198/3000 [1:55:48<51:46,  3.87s/it, lr: 1.0e-04 loss: 5.452e-02]hash_cache_v1:  73%|#######3  | 2198/3000 [1:55:52<51:46,  3.87s/it, lr: 1.0e-04 loss: 7.499e-02]hash_cache_v1:  73%|#######3  | 2198/3000 [1:55:52<51:46,  3.87s/it, lr: 1.0e-04 loss: 7.499e-02]hash_cache_v1:  73%|#######3  | 2199/3000 [1:55:52<53:35,  4.01s/it, lr: 1.0e-04 loss: 7.499e-02]hash_cache_v1:  73%|#######3  | 2199/3000 [1:55:52<53:35,  4.01s/it, lr: 1.0e-04 loss: 7.499e-02]hash_cache_v1:  73%|#######3  | 2199/3000 [1:55:55<53:35,  4.01s/it, lr: 1.0e-04 loss: 3.664e-03]hash_cache_v1:  73%|#######3  | 2199/3000 [1:55:55<53:35,  4.01s/it, lr: 1.0e-04 loss: 3.664e-03]hash_cache_v1:  73%|#######3  | 2200/3000 [1:55:57<53:31,  4.01s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  73%|#######3  | 2200/3000 [1:55:57<53:31,  4.01s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  73%|#######3  | 2201/3000 [1:55:57<35:24,  2.66s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  73%|#######3  | 2201/3000 [1:55:57<35:24,  2.66s/it, lr: 1.0e-04 loss: 1.132e-01]hash_cache_v1:  73%|#######3  | 2201/3000 [1:56:00<35:24,  2.66s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  73%|#######3  | 2201/3000 [1:56:00<35:24,  2.66s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  73%|#######3  | 2202/3000 [1:56:00<36:01,  2.71s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  73%|#######3  | 2202/3000 [1:56:00<36:01,  2.71s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  73%|#######3  | 2202/3000 [1:56:02<36:01,  2.71s/it, lr: 1.0e-04 loss: 6.046e-02]hash_cache_v1:  73%|#######3  | 2202/3000 [1:56:02<36:01,  2.71s/it, lr: 1.0e-04 loss: 6.046e-02]hash_cache_v1:  73%|#######3  | 2203/3000 [1:56:02<33:55,  2.55s/it, lr: 1.0e-04 loss: 6.046e-02]hash_cache_v1:  73%|#######3  | 2203/3000 [1:56:02<33:55,  2.55s/it, lr: 1.0e-04 loss: 6.046e-02]hash_cache_v1:  73%|#######3  | 2203/3000 [1:56:04<33:55,  2.55s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  73%|#######3  | 2203/3000 [1:56:04<33:55,  2.55s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  73%|#######3  | 2204/3000 [1:56:04<33:19,  2.51s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  73%|#######3  | 2204/3000 [1:56:04<33:19,  2.51s/it, lr: 1.0e-04 loss: 1.759e-01]hash_cache_v1:  73%|#######3  | 2204/3000 [1:56:06<33:19,  2.51s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  73%|#######3  | 2204/3000 [1:56:06<33:19,  2.51s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  74%|#######3  | 2205/3000 [1:56:06<31:49,  2.40s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  74%|#######3  | 2205/3000 [1:56:06<31:49,  2.40s/it, lr: 1.0e-04 loss: 1.134e-01]hash_cache_v1:  74%|#######3  | 2205/3000 [1:56:08<31:49,  2.40s/it, lr: 1.0e-04 loss: 4.075e-02]hash_cache_v1:  74%|#######3  | 2205/3000 [1:56:08<31:49,  2.40s/it, lr: 1.0e-04 loss: 4.075e-02]hash_cache_v1:  74%|#######3  | 2206/3000 [1:56:08<30:40,  2.32s/it, lr: 1.0e-04 loss: 4.075e-02]hash_cache_v1:  74%|#######3  | 2206/3000 [1:56:08<30:40,  2.32s/it, lr: 1.0e-04 loss: 4.075e-02]hash_cache_v1:  74%|#######3  | 2206/3000 [1:56:11<30:40,  2.32s/it, lr: 1.0e-04 loss: 4.314e-02]hash_cache_v1:  74%|#######3  | 2206/3000 [1:56:11<30:40,  2.32s/it, lr: 1.0e-04 loss: 4.314e-02]hash_cache_v1:  74%|#######3  | 2207/3000 [1:56:11<32:41,  2.47s/it, lr: 1.0e-04 loss: 4.314e-02]hash_cache_v1:  74%|#######3  | 2207/3000 [1:56:11<32:41,  2.47s/it, lr: 1.0e-04 loss: 4.314e-02]hash_cache_v1:  74%|#######3  | 2207/3000 [1:56:14<32:41,  2.47s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  74%|#######3  | 2207/3000 [1:56:14<32:41,  2.47s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  74%|#######3  | 2208/3000 [1:56:14<35:03,  2.66s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  74%|#######3  | 2208/3000 [1:56:14<35:03,  2.66s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  74%|#######3  | 2208/3000 [1:56:19<35:03,  2.66s/it, lr: 1.0e-04 loss: 7.281e-02]hash_cache_v1:  74%|#######3  | 2208/3000 [1:56:19<35:03,  2.66s/it, lr: 1.0e-04 loss: 7.281e-02]hash_cache_v1:  74%|#######3  | 2209/3000 [1:56:19<41:24,  3.14s/it, lr: 1.0e-04 loss: 7.281e-02]hash_cache_v1:  74%|#######3  | 2209/3000 [1:56:19<41:24,  3.14s/it, lr: 1.0e-04 loss: 7.281e-02]hash_cache_v1:  74%|#######3  | 2209/3000 [1:56:22<41:24,  3.14s/it, lr: 1.0e-04 loss: 2.959e-02]hash_cache_v1:  74%|#######3  | 2209/3000 [1:56:22<41:24,  3.14s/it, lr: 1.0e-04 loss: 2.959e-02]hash_cache_v1:  74%|#######3  | 2210/3000 [1:56:26<41:21,  3.14s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  74%|#######3  | 2210/3000 [1:56:26<41:21,  3.14s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  74%|#######3  | 2211/3000 [1:56:26<35:58,  2.74s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  74%|#######3  | 2211/3000 [1:56:26<35:58,  2.74s/it, lr: 1.0e-04 loss: 1.223e-01]hash_cache_v1:  74%|#######3  | 2211/3000 [1:56:30<35:58,  2.74s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  74%|#######3  | 2211/3000 [1:56:30<35:58,  2.74s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  74%|#######3  | 2212/3000 [1:56:30<41:03,  3.13s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  74%|#######3  | 2212/3000 [1:56:30<41:03,  3.13s/it, lr: 1.0e-04 loss: 1.269e-01]hash_cache_v1:  74%|#######3  | 2212/3000 [1:56:35<41:03,  3.13s/it, lr: 1.0e-04 loss: 2.735e-02]hash_cache_v1:  74%|#######3  | 2212/3000 [1:56:35<41:03,  3.13s/it, lr: 1.0e-04 loss: 2.735e-02]hash_cache_v1:  74%|#######3  | 2213/3000 [1:56:35<45:06,  3.44s/it, lr: 1.0e-04 loss: 2.735e-02]hash_cache_v1:  74%|#######3  | 2213/3000 [1:56:35<45:06,  3.44s/it, lr: 1.0e-04 loss: 2.735e-02]hash_cache_v1:  74%|#######3  | 2213/3000 [1:56:39<45:06,  3.44s/it, lr: 1.0e-04 loss: 6.132e-02]hash_cache_v1:  74%|#######3  | 2213/3000 [1:56:39<45:06,  3.44s/it, lr: 1.0e-04 loss: 6.132e-02]hash_cache_v1:  74%|#######3  | 2214/3000 [1:56:39<48:02,  3.67s/it, lr: 1.0e-04 loss: 6.132e-02]hash_cache_v1:  74%|#######3  | 2214/3000 [1:56:39<48:02,  3.67s/it, lr: 1.0e-04 loss: 6.132e-02]hash_cache_v1:  74%|#######3  | 2214/3000 [1:56:42<48:02,  3.67s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  74%|#######3  | 2214/3000 [1:56:42<48:02,  3.67s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  74%|#######3  | 2215/3000 [1:56:42<45:52,  3.51s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  74%|#######3  | 2215/3000 [1:56:42<45:52,  3.51s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  74%|#######3  | 2215/3000 [1:56:45<45:52,  3.51s/it, lr: 1.0e-04 loss: 4.393e-02]hash_cache_v1:  74%|#######3  | 2215/3000 [1:56:45<45:52,  3.51s/it, lr: 1.0e-04 loss: 4.393e-02]hash_cache_v1:  74%|#######3  | 2216/3000 [1:56:45<43:27,  3.33s/it, lr: 1.0e-04 loss: 4.393e-02]hash_cache_v1:  74%|#######3  | 2216/3000 [1:56:45<43:27,  3.33s/it, lr: 1.0e-04 loss: 4.393e-02]hash_cache_v1:  74%|#######3  | 2216/3000 [1:56:48<43:27,  3.33s/it, lr: 1.0e-04 loss: 4.082e-02]hash_cache_v1:  74%|#######3  | 2216/3000 [1:56:48<43:27,  3.33s/it, lr: 1.0e-04 loss: 4.082e-02]hash_cache_v1:  74%|#######3  | 2217/3000 [1:56:48<41:45,  3.20s/it, lr: 1.0e-04 loss: 4.082e-02]hash_cache_v1:  74%|#######3  | 2217/3000 [1:56:48<41:45,  3.20s/it, lr: 1.0e-04 loss: 4.082e-02]hash_cache_v1:  74%|#######3  | 2217/3000 [1:56:50<41:45,  3.20s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######3  | 2217/3000 [1:56:50<41:45,  3.20s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######3  | 2218/3000 [1:56:50<37:32,  2.88s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######3  | 2218/3000 [1:56:50<37:32,  2.88s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######3  | 2218/3000 [1:56:53<37:32,  2.88s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  74%|#######3  | 2218/3000 [1:56:53<37:32,  2.88s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  74%|#######3  | 2219/3000 [1:56:53<38:22,  2.95s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  74%|#######3  | 2219/3000 [1:56:53<38:22,  2.95s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  74%|#######3  | 2219/3000 [1:56:56<38:22,  2.95s/it, lr: 1.0e-04 loss: 2.022e-02]hash_cache_v1:  74%|#######3  | 2219/3000 [1:56:56<38:22,  2.95s/it, lr: 1.0e-04 loss: 2.022e-02]hash_cache_v1:  74%|#######4  | 2220/3000 [1:56:58<38:19,  2.95s/it, lr: 1.0e-04 loss: 5.881e-02]hash_cache_v1:  74%|#######4  | 2220/3000 [1:56:58<38:19,  2.95s/it, lr: 1.0e-04 loss: 5.881e-02]hash_cache_v1:  74%|#######4  | 2221/3000 [1:56:58<27:06,  2.09s/it, lr: 1.0e-04 loss: 5.881e-02]hash_cache_v1:  74%|#######4  | 2221/3000 [1:56:58<27:06,  2.09s/it, lr: 1.0e-04 loss: 5.881e-02]hash_cache_v1:  74%|#######4  | 2221/3000 [1:57:00<27:06,  2.09s/it, lr: 1.0e-04 loss: 8.015e-02]hash_cache_v1:  74%|#######4  | 2221/3000 [1:57:00<27:06,  2.09s/it, lr: 1.0e-04 loss: 8.015e-02]hash_cache_v1:  74%|#######4  | 2222/3000 [1:57:00<28:03,  2.16s/it, lr: 1.0e-04 loss: 8.015e-02]hash_cache_v1:  74%|#######4  | 2222/3000 [1:57:00<28:03,  2.16s/it, lr: 1.0e-04 loss: 8.015e-02]hash_cache_v1:  74%|#######4  | 2222/3000 [1:57:03<28:03,  2.16s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  74%|#######4  | 2222/3000 [1:57:03<28:03,  2.16s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  74%|#######4  | 2223/3000 [1:57:03<30:26,  2.35s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  74%|#######4  | 2223/3000 [1:57:03<30:26,  2.35s/it, lr: 1.0e-04 loss: 1.788e-01]hash_cache_v1:  74%|#######4  | 2223/3000 [1:57:08<30:26,  2.35s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  74%|#######4  | 2223/3000 [1:57:08<30:26,  2.35s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  74%|#######4  | 2224/3000 [1:57:08<37:08,  2.87s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  74%|#######4  | 2224/3000 [1:57:08<37:08,  2.87s/it, lr: 1.0e-04 loss: 1.305e-01]hash_cache_v1:  74%|#######4  | 2224/3000 [1:57:10<37:08,  2.87s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######4  | 2224/3000 [1:57:10<37:08,  2.87s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######4  | 2225/3000 [1:57:10<37:05,  2.87s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######4  | 2225/3000 [1:57:10<37:05,  2.87s/it, lr: 1.0e-04 loss: 1.502e-01]hash_cache_v1:  74%|#######4  | 2225/3000 [1:57:14<37:05,  2.87s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  74%|#######4  | 2225/3000 [1:57:14<37:05,  2.87s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  74%|#######4  | 2226/3000 [1:57:14<37:52,  2.94s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  74%|#######4  | 2226/3000 [1:57:14<37:52,  2.94s/it, lr: 1.0e-04 loss: 1.547e-01]hash_cache_v1:  74%|#######4  | 2226/3000 [1:57:18<37:52,  2.94s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  74%|#######4  | 2226/3000 [1:57:18<37:52,  2.94s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  74%|#######4  | 2227/3000 [1:57:18<42:57,  3.33s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  74%|#######4  | 2227/3000 [1:57:18<42:57,  3.33s/it, lr: 1.0e-04 loss: 1.421e-01]hash_cache_v1:  74%|#######4  | 2227/3000 [1:57:20<42:57,  3.33s/it, lr: 1.0e-04 loss: 2.943e-03]hash_cache_v1:  74%|#######4  | 2227/3000 [1:57:20<42:57,  3.33s/it, lr: 1.0e-04 loss: 2.943e-03]hash_cache_v1:  74%|#######4  | 2228/3000 [1:57:20<38:17,  2.98s/it, lr: 1.0e-04 loss: 2.943e-03]hash_cache_v1:  74%|#######4  | 2228/3000 [1:57:20<38:17,  2.98s/it, lr: 1.0e-04 loss: 2.943e-03]hash_cache_v1:  74%|#######4  | 2228/3000 [1:57:23<38:17,  2.98s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  74%|#######4  | 2228/3000 [1:57:23<38:17,  2.98s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  74%|#######4  | 2229/3000 [1:57:23<37:43,  2.94s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  74%|#######4  | 2229/3000 [1:57:23<37:43,  2.94s/it, lr: 1.0e-04 loss: 1.037e-01]hash_cache_v1:  74%|#######4  | 2229/3000 [1:57:27<37:43,  2.94s/it, lr: 1.0e-04 loss: 6.051e-02]hash_cache_v1:  74%|#######4  | 2229/3000 [1:57:27<37:43,  2.94s/it, lr: 1.0e-04 loss: 6.051e-02]hash_cache_v1:  74%|#######4  | 2230/3000 [1:57:30<37:40,  2.94s/it, lr: 1.0e-04 loss: 6.232e-02]hash_cache_v1:  74%|#######4  | 2230/3000 [1:57:30<37:40,  2.94s/it, lr: 1.0e-04 loss: 6.232e-02]hash_cache_v1:  74%|#######4  | 2231/3000 [1:57:30<28:49,  2.25s/it, lr: 1.0e-04 loss: 6.232e-02]hash_cache_v1:  74%|#######4  | 2231/3000 [1:57:30<28:49,  2.25s/it, lr: 1.0e-04 loss: 6.232e-02]hash_cache_v1:  74%|#######4  | 2231/3000 [1:57:33<28:49,  2.25s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  74%|#######4  | 2231/3000 [1:57:33<28:49,  2.25s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  74%|#######4  | 2232/3000 [1:57:33<30:44,  2.40s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  74%|#######4  | 2232/3000 [1:57:33<30:44,  2.40s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  74%|#######4  | 2232/3000 [1:57:38<30:44,  2.40s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  74%|#######4  | 2232/3000 [1:57:38<30:44,  2.40s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  74%|#######4  | 2233/3000 [1:57:38<37:46,  2.95s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  74%|#######4  | 2233/3000 [1:57:38<37:46,  2.95s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  74%|#######4  | 2233/3000 [1:57:40<37:46,  2.95s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  74%|#######4  | 2233/3000 [1:57:40<37:46,  2.95s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  74%|#######4  | 2234/3000 [1:57:40<37:20,  2.92s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  74%|#######4  | 2234/3000 [1:57:40<37:20,  2.92s/it, lr: 1.0e-04 loss: 1.469e-01]hash_cache_v1:  74%|#######4  | 2234/3000 [1:57:43<37:20,  2.92s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  74%|#######4  | 2234/3000 [1:57:43<37:20,  2.92s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  74%|#######4  | 2235/3000 [1:57:43<34:25,  2.70s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  74%|#######4  | 2235/3000 [1:57:43<34:25,  2.70s/it, lr: 1.0e-04 loss: 1.165e-01]hash_cache_v1:  74%|#######4  | 2235/3000 [1:57:45<34:25,  2.70s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  74%|#######4  | 2235/3000 [1:57:45<34:25,  2.70s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  75%|#######4  | 2236/3000 [1:57:45<32:11,  2.53s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  75%|#######4  | 2236/3000 [1:57:45<32:11,  2.53s/it, lr: 1.0e-04 loss: 1.365e-01]hash_cache_v1:  75%|#######4  | 2236/3000 [1:57:49<32:11,  2.53s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  75%|#######4  | 2236/3000 [1:57:49<32:11,  2.53s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  75%|#######4  | 2237/3000 [1:57:49<39:26,  3.10s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  75%|#######4  | 2237/3000 [1:57:49<39:26,  3.10s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  75%|#######4  | 2237/3000 [1:57:52<39:26,  3.10s/it, lr: 1.0e-04 loss: 7.229e-03]hash_cache_v1:  75%|#######4  | 2237/3000 [1:57:52<39:26,  3.10s/it, lr: 1.0e-04 loss: 7.229e-03]hash_cache_v1:  75%|#######4  | 2238/3000 [1:57:52<38:27,  3.03s/it, lr: 1.0e-04 loss: 7.229e-03]hash_cache_v1:  75%|#######4  | 2238/3000 [1:57:52<38:27,  3.03s/it, lr: 1.0e-04 loss: 7.229e-03]hash_cache_v1:  75%|#######4  | 2238/3000 [1:57:55<38:27,  3.03s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  75%|#######4  | 2238/3000 [1:57:55<38:27,  3.03s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  75%|#######4  | 2239/3000 [1:57:55<37:51,  2.99s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  75%|#######4  | 2239/3000 [1:57:55<37:51,  2.99s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  75%|#######4  | 2239/3000 [1:57:59<37:51,  2.99s/it, lr: 1.0e-04 loss: 1.261e-01]hash_cache_v1:  75%|#######4  | 2239/3000 [1:57:59<37:51,  2.99s/it, lr: 1.0e-04 loss: 1.261e-01]hash_cache_v1:  75%|#######4  | 2240/3000 [1:58:02<37:48,  2.99s/it, lr: 1.0e-04 loss: 1.316e-01]hash_cache_v1:  75%|#######4  | 2240/3000 [1:58:02<37:48,  2.99s/it, lr: 1.0e-04 loss: 1.316e-01]hash_cache_v1:  75%|#######4  | 2241/3000 [1:58:02<27:24,  2.17s/it, lr: 1.0e-04 loss: 1.316e-01]hash_cache_v1:  75%|#######4  | 2241/3000 [1:58:02<27:24,  2.17s/it, lr: 1.0e-04 loss: 1.316e-01]hash_cache_v1:  75%|#######4  | 2241/3000 [1:58:06<27:24,  2.17s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  75%|#######4  | 2241/3000 [1:58:06<27:24,  2.17s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  75%|#######4  | 2242/3000 [1:58:06<34:05,  2.70s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  75%|#######4  | 2242/3000 [1:58:06<34:05,  2.70s/it, lr: 1.0e-04 loss: 1.300e-01]hash_cache_v1:  75%|#######4  | 2242/3000 [1:58:08<34:05,  2.70s/it, lr: 1.0e-04 loss: 5.170e-02]hash_cache_v1:  75%|#######4  | 2242/3000 [1:58:08<34:05,  2.70s/it, lr: 1.0e-04 loss: 5.170e-02]hash_cache_v1:  75%|#######4  | 2243/3000 [1:58:08<32:06,  2.55s/it, lr: 1.0e-04 loss: 5.170e-02]hash_cache_v1:  75%|#######4  | 2243/3000 [1:58:08<32:06,  2.55s/it, lr: 1.0e-04 loss: 5.170e-02]hash_cache_v1:  75%|#######4  | 2243/3000 [1:58:13<32:06,  2.55s/it, lr: 1.0e-04 loss: 1.818e-01]hash_cache_v1:  75%|#######4  | 2243/3000 [1:58:13<32:06,  2.55s/it, lr: 1.0e-04 loss: 1.818e-01]hash_cache_v1:  75%|#######4  | 2244/3000 [1:58:13<38:49,  3.08s/it, lr: 1.0e-04 loss: 1.818e-01]hash_cache_v1:  75%|#######4  | 2244/3000 [1:58:13<38:49,  3.08s/it, lr: 1.0e-04 loss: 1.818e-01]hash_cache_v1:  75%|#######4  | 2244/3000 [1:58:15<38:49,  3.08s/it, lr: 1.0e-04 loss: 9.787e-02]hash_cache_v1:  75%|#######4  | 2244/3000 [1:58:15<38:49,  3.08s/it, lr: 1.0e-04 loss: 9.787e-02]hash_cache_v1:  75%|#######4  | 2245/3000 [1:58:15<37:55,  3.01s/it, lr: 1.0e-04 loss: 9.787e-02]hash_cache_v1:  75%|#######4  | 2245/3000 [1:58:15<37:55,  3.01s/it, lr: 1.0e-04 loss: 9.787e-02]hash_cache_v1:  75%|#######4  | 2245/3000 [1:58:17<37:55,  3.01s/it, lr: 1.0e-04 loss: 1.748e-02]hash_cache_v1:  75%|#######4  | 2245/3000 [1:58:17<37:55,  3.01s/it, lr: 1.0e-04 loss: 1.748e-02]hash_cache_v1:  75%|#######4  | 2246/3000 [1:58:17<34:35,  2.75s/it, lr: 1.0e-04 loss: 1.748e-02]hash_cache_v1:  75%|#######4  | 2246/3000 [1:58:17<34:35,  2.75s/it, lr: 1.0e-04 loss: 1.748e-02]hash_cache_v1:  75%|#######4  | 2246/3000 [1:58:20<34:35,  2.75s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  75%|#######4  | 2246/3000 [1:58:20<34:35,  2.75s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  75%|#######4  | 2247/3000 [1:58:20<32:11,  2.56s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  75%|#######4  | 2247/3000 [1:58:20<32:11,  2.56s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  75%|#######4  | 2247/3000 [1:58:24<32:11,  2.56s/it, lr: 1.0e-04 loss: 1.729e-01]hash_cache_v1:  75%|#######4  | 2247/3000 [1:58:24<32:11,  2.56s/it, lr: 1.0e-04 loss: 1.729e-01]hash_cache_v1:  75%|#######4  | 2248/3000 [1:58:24<39:15,  3.13s/it, lr: 1.0e-04 loss: 1.729e-01]hash_cache_v1:  75%|#######4  | 2248/3000 [1:58:24<39:15,  3.13s/it, lr: 1.0e-04 loss: 1.729e-01]hash_cache_v1:  75%|#######4  | 2248/3000 [1:58:27<39:15,  3.13s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  75%|#######4  | 2248/3000 [1:58:27<39:15,  3.13s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  75%|#######4  | 2249/3000 [1:58:27<38:05,  3.04s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  75%|#######4  | 2249/3000 [1:58:27<38:05,  3.04s/it, lr: 1.0e-04 loss: 1.464e-01]hash_cache_v1:  75%|#######4  | 2249/3000 [1:58:30<38:05,  3.04s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  75%|#######4  | 2249/3000 [1:58:30<38:05,  3.04s/it, lr: 1.0e-04 loss: 1.363e-01]
+Saving at step 2250
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000002250.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001250.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.02s/it]Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.02s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.30s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.30s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.42s/it]Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.42s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.44s/it]Generating Images: 100%|##########| 4/4 [04:49<00:00, 72.44s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  75%|#######5  | 2250/3000 [1:58:32<38:02,  3.04s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  75%|#######5  | 2250/3000 [1:58:32<38:02,  3.04s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  75%|#######5  | 2251/3000 [1:58:32<27:19,  2.19s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  75%|#######5  | 2251/3000 [1:58:32<27:19,  2.19s/it, lr: 1.0e-04 loss: 1.463e-01]hash_cache_v1:  75%|#######5  | 2251/3000 [1:58:37<27:19,  2.19s/it, lr: 1.0e-04 loss: 4.007e-02]hash_cache_v1:  75%|#######5  | 2251/3000 [1:58:37<27:19,  2.19s/it, lr: 1.0e-04 loss: 4.007e-02]hash_cache_v1:  75%|#######5  | 2252/3000 [1:58:37<33:45,  2.71s/it, lr: 1.0e-04 loss: 4.007e-02]hash_cache_v1:  75%|#######5  | 2252/3000 [1:58:37<33:45,  2.71s/it, lr: 1.0e-04 loss: 4.007e-02]hash_cache_v1:  75%|#######5  | 2252/3000 [1:58:40<33:45,  2.71s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  75%|#######5  | 2252/3000 [1:58:40<33:45,  2.71s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  75%|#######5  | 2253/3000 [1:58:40<34:17,  2.75s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  75%|#######5  | 2253/3000 [1:58:40<34:17,  2.75s/it, lr: 1.0e-04 loss: 1.523e-01]hash_cache_v1:  75%|#######5  | 2253/3000 [1:58:43<34:17,  2.75s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  75%|#######5  | 2253/3000 [1:58:43<34:17,  2.75s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  75%|#######5  | 2254/3000 [1:58:43<35:19,  2.84s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  75%|#######5  | 2254/3000 [1:58:43<35:19,  2.84s/it, lr: 1.0e-04 loss: 2.115e-01]hash_cache_v1:  75%|#######5  | 2254/3000 [1:58:45<35:19,  2.84s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  75%|#######5  | 2254/3000 [1:58:45<35:19,  2.84s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  75%|#######5  | 2255/3000 [1:58:45<32:44,  2.64s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  75%|#######5  | 2255/3000 [1:58:45<32:44,  2.64s/it, lr: 1.0e-04 loss: 1.736e-01]hash_cache_v1:  75%|#######5  | 2255/3000 [1:58:47<32:44,  2.64s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  75%|#######5  | 2255/3000 [1:58:47<32:44,  2.64s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  75%|#######5  | 2256/3000 [1:58:47<30:48,  2.49s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  75%|#######5  | 2256/3000 [1:58:47<30:48,  2.49s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  75%|#######5  | 2256/3000 [1:58:51<30:48,  2.49s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  75%|#######5  | 2256/3000 [1:58:51<30:48,  2.49s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  75%|#######5  | 2257/3000 [1:58:51<37:53,  3.06s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  75%|#######5  | 2257/3000 [1:58:51<37:53,  3.06s/it, lr: 1.0e-04 loss: 1.129e-01]hash_cache_v1:  75%|#######5  | 2257/3000 [1:58:53<37:53,  3.06s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  75%|#######5  | 2257/3000 [1:58:53<37:53,  3.06s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  75%|#######5  | 2258/3000 [1:58:53<34:23,  2.78s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  75%|#######5  | 2258/3000 [1:58:53<34:23,  2.78s/it, lr: 1.0e-04 loss: 1.189e-01]hash_cache_v1:  75%|#######5  | 2258/3000 [1:58:56<34:23,  2.78s/it, lr: 1.0e-04 loss: 1.124e-01]hash_cache_v1:  75%|#######5  | 2258/3000 [1:58:56<34:23,  2.78s/it, lr: 1.0e-04 loss: 1.124e-01]hash_cache_v1:  75%|#######5  | 2259/3000 [1:58:56<31:54,  2.58s/it, lr: 1.0e-04 loss: 1.124e-01]hash_cache_v1:  75%|#######5  | 2259/3000 [1:58:56<31:54,  2.58s/it, lr: 1.0e-04 loss: 1.124e-01]hash_cache_v1:  75%|#######5  | 2259/3000 [1:58:58<31:54,  2.58s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  75%|#######5  | 2259/3000 [1:58:58<31:54,  2.58s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1:  75%|#######5  | 2260/3000 [1:59:00<31:52,  2.58s/it, lr: 1.0e-04 loss: 9.397e-02]hash_cache_v1:  75%|#######5  | 2260/3000 [1:59:00<31:52,  2.58s/it, lr: 1.0e-04 loss: 9.397e-02]hash_cache_v1:  75%|#######5  | 2261/3000 [1:59:00<24:02,  1.95s/it, lr: 1.0e-04 loss: 9.397e-02]hash_cache_v1:  75%|#######5  | 2261/3000 [1:59:00<24:02,  1.95s/it, lr: 1.0e-04 loss: 9.397e-02]hash_cache_v1:  75%|#######5  | 2261/3000 [1:59:02<24:02,  1.95s/it, lr: 1.0e-04 loss: 1.754e-01]hash_cache_v1:  75%|#######5  | 2261/3000 [1:59:02<24:02,  1.95s/it, lr: 1.0e-04 loss: 1.754e-01]hash_cache_v1:  75%|#######5  | 2262/3000 [1:59:02<24:29,  1.99s/it, lr: 1.0e-04 loss: 1.754e-01]hash_cache_v1:  75%|#######5  | 2262/3000 [1:59:02<24:29,  1.99s/it, lr: 1.0e-04 loss: 1.754e-01]hash_cache_v1:  75%|#######5  | 2262/3000 [1:59:04<24:29,  1.99s/it, lr: 1.0e-04 loss: 9.750e-02]hash_cache_v1:  75%|#######5  | 2262/3000 [1:59:04<24:29,  1.99s/it, lr: 1.0e-04 loss: 9.750e-02]hash_cache_v1:  75%|#######5  | 2263/3000 [1:59:04<24:47,  2.02s/it, lr: 1.0e-04 loss: 9.750e-02]hash_cache_v1:  75%|#######5  | 2263/3000 [1:59:04<24:47,  2.02s/it, lr: 1.0e-04 loss: 9.750e-02]hash_cache_v1:  75%|#######5  | 2263/3000 [1:59:06<24:47,  2.02s/it, lr: 1.0e-04 loss: 8.014e-02]hash_cache_v1:  75%|#######5  | 2263/3000 [1:59:06<24:47,  2.02s/it, lr: 1.0e-04 loss: 8.014e-02]hash_cache_v1:  75%|#######5  | 2264/3000 [1:59:06<25:04,  2.04s/it, lr: 1.0e-04 loss: 8.014e-02]hash_cache_v1:  75%|#######5  | 2264/3000 [1:59:06<25:04,  2.04s/it, lr: 1.0e-04 loss: 8.014e-02]hash_cache_v1:  75%|#######5  | 2264/3000 [1:59:09<25:04,  2.04s/it, lr: 1.0e-04 loss: 1.721e-02]hash_cache_v1:  75%|#######5  | 2264/3000 [1:59:09<25:04,  2.04s/it, lr: 1.0e-04 loss: 1.721e-02]hash_cache_v1:  76%|#######5  | 2265/3000 [1:59:09<26:14,  2.14s/it, lr: 1.0e-04 loss: 1.721e-02]hash_cache_v1:  76%|#######5  | 2265/3000 [1:59:09<26:14,  2.14s/it, lr: 1.0e-04 loss: 1.721e-02]hash_cache_v1:  76%|#######5  | 2265/3000 [1:59:12<26:14,  2.14s/it, lr: 1.0e-04 loss: 6.177e-02]hash_cache_v1:  76%|#######5  | 2265/3000 [1:59:12<26:14,  2.14s/it, lr: 1.0e-04 loss: 6.177e-02]hash_cache_v1:  76%|#######5  | 2266/3000 [1:59:12<28:47,  2.35s/it, lr: 1.0e-04 loss: 6.177e-02]hash_cache_v1:  76%|#######5  | 2266/3000 [1:59:12<28:47,  2.35s/it, lr: 1.0e-04 loss: 6.177e-02]hash_cache_v1:  76%|#######5  | 2266/3000 [1:59:16<28:47,  2.35s/it, lr: 1.0e-04 loss: 5.587e-02]hash_cache_v1:  76%|#######5  | 2266/3000 [1:59:16<28:47,  2.35s/it, lr: 1.0e-04 loss: 5.587e-02]hash_cache_v1:  76%|#######5  | 2267/3000 [1:59:16<35:41,  2.92s/it, lr: 1.0e-04 loss: 5.587e-02]hash_cache_v1:  76%|#######5  | 2267/3000 [1:59:16<35:41,  2.92s/it, lr: 1.0e-04 loss: 5.587e-02]hash_cache_v1:  76%|#######5  | 2267/3000 [1:59:19<35:41,  2.92s/it, lr: 1.0e-04 loss: 4.471e-02]hash_cache_v1:  76%|#######5  | 2267/3000 [1:59:19<35:41,  2.92s/it, lr: 1.0e-04 loss: 4.471e-02]hash_cache_v1:  76%|#######5  | 2268/3000 [1:59:19<36:08,  2.96s/it, lr: 1.0e-04 loss: 4.471e-02]hash_cache_v1:  76%|#######5  | 2268/3000 [1:59:19<36:08,  2.96s/it, lr: 1.0e-04 loss: 4.471e-02]hash_cache_v1:  76%|#######5  | 2268/3000 [1:59:22<36:08,  2.96s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  76%|#######5  | 2268/3000 [1:59:22<36:08,  2.96s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  76%|#######5  | 2269/3000 [1:59:22<35:46,  2.94s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  76%|#######5  | 2269/3000 [1:59:22<35:46,  2.94s/it, lr: 1.0e-04 loss: 1.671e-01]hash_cache_v1:  76%|#######5  | 2269/3000 [1:59:24<35:46,  2.94s/it, lr: 1.0e-04 loss: 1.761e-01]hash_cache_v1:  76%|#######5  | 2269/3000 [1:59:24<35:46,  2.94s/it, lr: 1.0e-04 loss: 1.761e-01]hash_cache_v1:  76%|#######5  | 2270/3000 [1:59:26<35:43,  2.94s/it, lr: 1.0e-04 loss: 9.419e-02]hash_cache_v1:  76%|#######5  | 2270/3000 [1:59:26<35:43,  2.94s/it, lr: 1.0e-04 loss: 9.419e-02]hash_cache_v1:  76%|#######5  | 2271/3000 [1:59:26<25:14,  2.08s/it, lr: 1.0e-04 loss: 9.419e-02]hash_cache_v1:  76%|#######5  | 2271/3000 [1:59:26<25:14,  2.08s/it, lr: 1.0e-04 loss: 9.419e-02]hash_cache_v1:  76%|#######5  | 2271/3000 [1:59:29<25:14,  2.08s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  76%|#######5  | 2271/3000 [1:59:29<25:14,  2.08s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  76%|#######5  | 2272/3000 [1:59:29<26:11,  2.16s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  76%|#######5  | 2272/3000 [1:59:29<26:11,  2.16s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  76%|#######5  | 2272/3000 [1:59:31<26:11,  2.16s/it, lr: 1.0e-04 loss: 3.810e-02]hash_cache_v1:  76%|#######5  | 2272/3000 [1:59:31<26:11,  2.16s/it, lr: 1.0e-04 loss: 3.810e-02]hash_cache_v1:  76%|#######5  | 2273/3000 [1:59:31<28:18,  2.34s/it, lr: 1.0e-04 loss: 3.810e-02]hash_cache_v1:  76%|#######5  | 2273/3000 [1:59:31<28:18,  2.34s/it, lr: 1.0e-04 loss: 3.810e-02]hash_cache_v1:  76%|#######5  | 2273/3000 [1:59:36<28:18,  2.34s/it, lr: 1.0e-04 loss: 4.639e-02]hash_cache_v1:  76%|#######5  | 2273/3000 [1:59:36<28:18,  2.34s/it, lr: 1.0e-04 loss: 4.639e-02]hash_cache_v1:  76%|#######5  | 2274/3000 [1:59:36<34:51,  2.88s/it, lr: 1.0e-04 loss: 4.639e-02]hash_cache_v1:  76%|#######5  | 2274/3000 [1:59:36<34:51,  2.88s/it, lr: 1.0e-04 loss: 4.639e-02]hash_cache_v1:  76%|#######5  | 2274/3000 [1:59:40<34:51,  2.88s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  76%|#######5  | 2274/3000 [1:59:40<34:51,  2.88s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  76%|#######5  | 2275/3000 [1:59:40<39:37,  3.28s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  76%|#######5  | 2275/3000 [1:59:40<39:37,  3.28s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  76%|#######5  | 2275/3000 [1:59:45<39:37,  3.28s/it, lr: 1.0e-04 loss: 3.283e-03]hash_cache_v1:  76%|#######5  | 2275/3000 [1:59:45<39:37,  3.28s/it, lr: 1.0e-04 loss: 3.283e-03]hash_cache_v1:  76%|#######5  | 2276/3000 [1:59:45<43:48,  3.63s/it, lr: 1.0e-04 loss: 3.283e-03]hash_cache_v1:  76%|#######5  | 2276/3000 [1:59:45<43:48,  3.63s/it, lr: 1.0e-04 loss: 3.283e-03]hash_cache_v1:  76%|#######5  | 2276/3000 [1:59:47<43:48,  3.63s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  76%|#######5  | 2276/3000 [1:59:47<43:48,  3.63s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  76%|#######5  | 2277/3000 [1:59:47<41:06,  3.41s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  76%|#######5  | 2277/3000 [1:59:47<41:06,  3.41s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  76%|#######5  | 2277/3000 [1:59:50<41:06,  3.41s/it, lr: 1.0e-04 loss: 1.259e-01]hash_cache_v1:  76%|#######5  | 2277/3000 [1:59:50<41:06,  3.41s/it, lr: 1.0e-04 loss: 1.259e-01]hash_cache_v1:  76%|#######5  | 2278/3000 [1:59:50<36:27,  3.03s/it, lr: 1.0e-04 loss: 1.259e-01]hash_cache_v1:  76%|#######5  | 2278/3000 [1:59:50<36:27,  3.03s/it, lr: 1.0e-04 loss: 1.259e-01]hash_cache_v1:  76%|#######5  | 2278/3000 [1:59:52<36:27,  3.03s/it, lr: 1.0e-04 loss: 9.994e-02]hash_cache_v1:  76%|#######5  | 2278/3000 [1:59:52<36:27,  3.03s/it, lr: 1.0e-04 loss: 9.994e-02]hash_cache_v1:  76%|#######5  | 2279/3000 [1:59:52<34:12,  2.85s/it, lr: 1.0e-04 loss: 9.994e-02]hash_cache_v1:  76%|#######5  | 2279/3000 [1:59:52<34:12,  2.85s/it, lr: 1.0e-04 loss: 9.994e-02]hash_cache_v1:  76%|#######5  | 2279/3000 [1:59:54<34:12,  2.85s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  76%|#######5  | 2279/3000 [1:59:54<34:12,  2.85s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  76%|#######6  | 2280/3000 [1:59:58<34:09,  2.85s/it, lr: 1.0e-04 loss: 4.637e-02]hash_cache_v1:  76%|#######6  | 2280/3000 [1:59:58<34:09,  2.85s/it, lr: 1.0e-04 loss: 4.637e-02]hash_cache_v1:  76%|#######6  | 2281/3000 [1:59:58<30:18,  2.53s/it, lr: 1.0e-04 loss: 4.637e-02]hash_cache_v1:  76%|#######6  | 2281/3000 [1:59:58<30:18,  2.53s/it, lr: 1.0e-04 loss: 4.637e-02]hash_cache_v1:  76%|#######6  | 2281/3000 [2:00:01<30:18,  2.53s/it, lr: 1.0e-04 loss: 5.471e-02]hash_cache_v1:  76%|#######6  | 2281/3000 [2:00:01<30:18,  2.53s/it, lr: 1.0e-04 loss: 5.471e-02]hash_cache_v1:  76%|#######6  | 2282/3000 [2:00:01<31:19,  2.62s/it, lr: 1.0e-04 loss: 5.471e-02]hash_cache_v1:  76%|#######6  | 2282/3000 [2:00:01<31:19,  2.62s/it, lr: 1.0e-04 loss: 5.471e-02]hash_cache_v1:  76%|#######6  | 2282/3000 [2:00:06<31:19,  2.62s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  76%|#######6  | 2282/3000 [2:00:06<31:19,  2.62s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  76%|#######6  | 2283/3000 [2:00:06<37:02,  3.10s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  76%|#######6  | 2283/3000 [2:00:06<37:02,  3.10s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1:  76%|#######6  | 2283/3000 [2:00:09<37:02,  3.10s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  76%|#######6  | 2283/3000 [2:00:09<37:02,  3.10s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  76%|#######6  | 2284/3000 [2:00:09<36:17,  3.04s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  76%|#######6  | 2284/3000 [2:00:09<36:17,  3.04s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  76%|#######6  | 2284/3000 [2:00:13<36:17,  3.04s/it, lr: 1.0e-04 loss: 6.051e-02]hash_cache_v1:  76%|#######6  | 2284/3000 [2:00:13<36:17,  3.04s/it, lr: 1.0e-04 loss: 6.051e-02]hash_cache_v1:  76%|#######6  | 2285/3000 [2:00:13<40:28,  3.40s/it, lr: 1.0e-04 loss: 6.051e-02]hash_cache_v1:  76%|#######6  | 2285/3000 [2:00:13<40:28,  3.40s/it, lr: 1.0e-04 loss: 6.051e-02]hash_cache_v1:  76%|#######6  | 2285/3000 [2:00:17<40:28,  3.40s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  76%|#######6  | 2285/3000 [2:00:17<40:28,  3.40s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  76%|#######6  | 2286/3000 [2:00:17<43:30,  3.66s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  76%|#######6  | 2286/3000 [2:00:17<43:30,  3.66s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  76%|#######6  | 2286/3000 [2:00:22<43:30,  3.66s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  76%|#######6  | 2286/3000 [2:00:22<43:30,  3.66s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  76%|#######6  | 2287/3000 [2:00:22<46:18,  3.90s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  76%|#######6  | 2287/3000 [2:00:22<46:18,  3.90s/it, lr: 1.0e-04 loss: 1.211e-01]hash_cache_v1:  76%|#######6  | 2287/3000 [2:00:25<46:18,  3.90s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  76%|#######6  | 2287/3000 [2:00:25<46:18,  3.90s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  76%|#######6  | 2288/3000 [2:00:25<42:41,  3.60s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  76%|#######6  | 2288/3000 [2:00:25<42:41,  3.60s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  76%|#######6  | 2288/3000 [2:00:29<42:41,  3.60s/it, lr: 1.0e-04 loss: 1.031e-01]hash_cache_v1:  76%|#######6  | 2288/3000 [2:00:29<42:41,  3.60s/it, lr: 1.0e-04 loss: 1.031e-01]hash_cache_v1:  76%|#######6  | 2289/3000 [2:00:29<45:10,  3.81s/it, lr: 1.0e-04 loss: 1.031e-01]hash_cache_v1:  76%|#######6  | 2289/3000 [2:00:29<45:10,  3.81s/it, lr: 1.0e-04 loss: 1.031e-01]hash_cache_v1:  76%|#######6  | 2289/3000 [2:00:32<45:10,  3.81s/it, lr: 1.0e-04 loss: 2.529e-02]hash_cache_v1:  76%|#######6  | 2289/3000 [2:00:32<45:10,  3.81s/it, lr: 1.0e-04 loss: 2.529e-02]hash_cache_v1:  76%|#######6  | 2290/3000 [2:00:35<45:06,  3.81s/it, lr: 1.0e-04 loss: 7.205e-03]hash_cache_v1:  76%|#######6  | 2290/3000 [2:00:35<45:06,  3.81s/it, lr: 1.0e-04 loss: 7.205e-03]hash_cache_v1:  76%|#######6  | 2291/3000 [2:00:35<32:16,  2.73s/it, lr: 1.0e-04 loss: 7.205e-03]hash_cache_v1:  76%|#######6  | 2291/3000 [2:00:35<32:16,  2.73s/it, lr: 1.0e-04 loss: 7.205e-03]hash_cache_v1:  76%|#######6  | 2291/3000 [2:00:39<32:16,  2.73s/it, lr: 1.0e-04 loss: 6.166e-02]hash_cache_v1:  76%|#######6  | 2291/3000 [2:00:39<32:16,  2.73s/it, lr: 1.0e-04 loss: 6.166e-02]hash_cache_v1:  76%|#######6  | 2292/3000 [2:00:39<36:54,  3.13s/it, lr: 1.0e-04 loss: 6.166e-02]hash_cache_v1:  76%|#######6  | 2292/3000 [2:00:39<36:54,  3.13s/it, lr: 1.0e-04 loss: 6.166e-02]hash_cache_v1:  76%|#######6  | 2292/3000 [2:00:42<36:54,  3.13s/it, lr: 1.0e-04 loss: 2.122e-01]hash_cache_v1:  76%|#######6  | 2292/3000 [2:00:42<36:54,  3.13s/it, lr: 1.0e-04 loss: 2.122e-01]hash_cache_v1:  76%|#######6  | 2293/3000 [2:00:42<36:07,  3.07s/it, lr: 1.0e-04 loss: 2.122e-01]hash_cache_v1:  76%|#######6  | 2293/3000 [2:00:42<36:07,  3.07s/it, lr: 1.0e-04 loss: 2.122e-01]hash_cache_v1:  76%|#######6  | 2293/3000 [2:00:47<36:07,  3.07s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  76%|#######6  | 2293/3000 [2:00:47<36:07,  3.07s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  76%|#######6  | 2294/3000 [2:00:47<40:43,  3.46s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  76%|#######6  | 2294/3000 [2:00:47<40:43,  3.46s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  76%|#######6  | 2294/3000 [2:00:51<40:43,  3.46s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  76%|#######6  | 2294/3000 [2:00:51<40:43,  3.46s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  76%|#######6  | 2295/3000 [2:00:51<43:31,  3.70s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  76%|#######6  | 2295/3000 [2:00:51<43:31,  3.70s/it, lr: 1.0e-04 loss: 1.276e-01]hash_cache_v1:  76%|#######6  | 2295/3000 [2:00:54<43:31,  3.70s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:  76%|#######6  | 2295/3000 [2:00:54<43:31,  3.70s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:  77%|#######6  | 2296/3000 [2:00:54<40:34,  3.46s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:  77%|#######6  | 2296/3000 [2:00:54<40:34,  3.46s/it, lr: 1.0e-04 loss: 1.183e-01]hash_cache_v1:  77%|#######6  | 2296/3000 [2:00:56<40:34,  3.46s/it, lr: 1.0e-04 loss: 1.870e-01]hash_cache_v1:  77%|#######6  | 2296/3000 [2:00:56<40:34,  3.46s/it, lr: 1.0e-04 loss: 1.870e-01]hash_cache_v1:  77%|#######6  | 2297/3000 [2:00:56<35:53,  3.06s/it, lr: 1.0e-04 loss: 1.870e-01]hash_cache_v1:  77%|#######6  | 2297/3000 [2:00:56<35:53,  3.06s/it, lr: 1.0e-04 loss: 1.870e-01]hash_cache_v1:  77%|#######6  | 2297/3000 [2:01:00<35:53,  3.06s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  77%|#######6  | 2297/3000 [2:01:00<35:53,  3.06s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  77%|#######6  | 2298/3000 [2:01:00<40:49,  3.49s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  77%|#######6  | 2298/3000 [2:01:00<40:49,  3.49s/it, lr: 1.0e-04 loss: 1.332e-01]hash_cache_v1:  77%|#######6  | 2298/3000 [2:01:03<40:49,  3.49s/it, lr: 1.0e-04 loss: 5.595e-02]hash_cache_v1:  77%|#######6  | 2298/3000 [2:01:03<40:49,  3.49s/it, lr: 1.0e-04 loss: 5.595e-02]hash_cache_v1:  77%|#######6  | 2299/3000 [2:01:03<38:48,  3.32s/it, lr: 1.0e-04 loss: 5.595e-02]hash_cache_v1:  77%|#######6  | 2299/3000 [2:01:03<38:48,  3.32s/it, lr: 1.0e-04 loss: 5.595e-02]hash_cache_v1:  77%|#######6  | 2299/3000 [2:01:05<38:48,  3.32s/it, lr: 1.0e-04 loss: 1.864e-01]hash_cache_v1:  77%|#######6  | 2299/3000 [2:01:05<38:48,  3.32s/it, lr: 1.0e-04 loss: 1.864e-01]hash_cache_v1:  77%|#######6  | 2300/3000 [2:01:08<38:45,  3.32s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  77%|#######6  | 2300/3000 [2:01:08<38:45,  3.32s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  77%|#######6  | 2301/3000 [2:01:08<29:08,  2.50s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  77%|#######6  | 2301/3000 [2:01:08<29:08,  2.50s/it, lr: 1.0e-04 loss: 1.336e-01]hash_cache_v1:  77%|#######6  | 2301/3000 [2:01:13<29:08,  2.50s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  77%|#######6  | 2301/3000 [2:01:13<29:08,  2.50s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  77%|#######6  | 2302/3000 [2:01:13<34:15,  2.95s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  77%|#######6  | 2302/3000 [2:01:13<34:15,  2.95s/it, lr: 1.0e-04 loss: 1.194e-01]hash_cache_v1:  77%|#######6  | 2302/3000 [2:01:17<34:15,  2.95s/it, lr: 1.0e-04 loss: 1.270e-01]hash_cache_v1:  77%|#######6  | 2302/3000 [2:01:17<34:15,  2.95s/it, lr: 1.0e-04 loss: 1.270e-01]hash_cache_v1:  77%|#######6  | 2303/3000 [2:01:17<38:27,  3.31s/it, lr: 1.0e-04 loss: 1.270e-01]hash_cache_v1:  77%|#######6  | 2303/3000 [2:01:17<38:27,  3.31s/it, lr: 1.0e-04 loss: 1.270e-01]hash_cache_v1:  77%|#######6  | 2303/3000 [2:01:20<38:27,  3.31s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  77%|#######6  | 2303/3000 [2:01:20<38:27,  3.31s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  77%|#######6  | 2304/3000 [2:01:20<36:58,  3.19s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  77%|#######6  | 2304/3000 [2:01:20<36:58,  3.19s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  77%|#######6  | 2304/3000 [2:01:23<36:58,  3.19s/it, lr: 1.0e-04 loss: 3.154e-02]hash_cache_v1:  77%|#######6  | 2304/3000 [2:01:23<36:58,  3.19s/it, lr: 1.0e-04 loss: 3.154e-02]hash_cache_v1:  77%|#######6  | 2305/3000 [2:01:23<36:35,  3.16s/it, lr: 1.0e-04 loss: 3.154e-02]hash_cache_v1:  77%|#######6  | 2305/3000 [2:01:23<36:35,  3.16s/it, lr: 1.0e-04 loss: 3.154e-02]hash_cache_v1:  77%|#######6  | 2305/3000 [2:01:26<36:35,  3.16s/it, lr: 1.0e-04 loss: 4.472e-02]hash_cache_v1:  77%|#######6  | 2305/3000 [2:01:26<36:35,  3.16s/it, lr: 1.0e-04 loss: 4.472e-02]hash_cache_v1:  77%|#######6  | 2306/3000 [2:01:26<35:38,  3.08s/it, lr: 1.0e-04 loss: 4.472e-02]hash_cache_v1:  77%|#######6  | 2306/3000 [2:01:26<35:38,  3.08s/it, lr: 1.0e-04 loss: 4.472e-02]hash_cache_v1:  77%|#######6  | 2306/3000 [2:01:30<35:38,  3.08s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  77%|#######6  | 2306/3000 [2:01:30<35:38,  3.08s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  77%|#######6  | 2307/3000 [2:01:30<39:44,  3.44s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  77%|#######6  | 2307/3000 [2:01:30<39:44,  3.44s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  77%|#######6  | 2307/3000 [2:01:35<39:44,  3.44s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  77%|#######6  | 2307/3000 [2:01:35<39:44,  3.44s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  77%|#######6  | 2308/3000 [2:01:35<42:38,  3.70s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  77%|#######6  | 2308/3000 [2:01:35<42:38,  3.70s/it, lr: 1.0e-04 loss: 1.394e-01]hash_cache_v1:  77%|#######6  | 2308/3000 [2:01:37<42:38,  3.70s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  77%|#######6  | 2308/3000 [2:01:37<42:38,  3.70s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  77%|#######6  | 2309/3000 [2:01:37<38:09,  3.31s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  77%|#######6  | 2309/3000 [2:01:37<38:09,  3.31s/it, lr: 1.0e-04 loss: 1.457e-01]hash_cache_v1:  77%|#######6  | 2309/3000 [2:01:39<38:09,  3.31s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  77%|#######6  | 2309/3000 [2:01:39<38:09,  3.31s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  77%|#######7  | 2310/3000 [2:01:42<38:06,  3.31s/it, lr: 1.0e-04 loss: 9.711e-02]hash_cache_v1:  77%|#######7  | 2310/3000 [2:01:42<38:06,  3.31s/it, lr: 1.0e-04 loss: 9.711e-02]hash_cache_v1:  77%|#######7  | 2311/3000 [2:01:42<28:16,  2.46s/it, lr: 1.0e-04 loss: 9.711e-02]hash_cache_v1:  77%|#######7  | 2311/3000 [2:01:42<28:16,  2.46s/it, lr: 1.0e-04 loss: 9.711e-02]hash_cache_v1:  77%|#######7  | 2311/3000 [2:01:45<28:16,  2.46s/it, lr: 1.0e-04 loss: 9.958e-02]hash_cache_v1:  77%|#######7  | 2311/3000 [2:01:45<28:16,  2.46s/it, lr: 1.0e-04 loss: 9.958e-02]hash_cache_v1:  77%|#######7  | 2312/3000 [2:01:45<29:54,  2.61s/it, lr: 1.0e-04 loss: 9.958e-02]hash_cache_v1:  77%|#######7  | 2312/3000 [2:01:45<29:54,  2.61s/it, lr: 1.0e-04 loss: 9.958e-02]hash_cache_v1:  77%|#######7  | 2312/3000 [2:01:49<29:54,  2.61s/it, lr: 1.0e-04 loss: 8.667e-02]hash_cache_v1:  77%|#######7  | 2312/3000 [2:01:49<29:54,  2.61s/it, lr: 1.0e-04 loss: 8.667e-02]hash_cache_v1:  77%|#######7  | 2313/3000 [2:01:49<34:40,  3.03s/it, lr: 1.0e-04 loss: 8.667e-02]hash_cache_v1:  77%|#######7  | 2313/3000 [2:01:49<34:40,  3.03s/it, lr: 1.0e-04 loss: 8.667e-02]hash_cache_v1:  77%|#######7  | 2313/3000 [2:01:54<34:40,  3.03s/it, lr: 1.0e-04 loss: 9.776e-02]hash_cache_v1:  77%|#######7  | 2313/3000 [2:01:54<34:40,  3.03s/it, lr: 1.0e-04 loss: 9.776e-02]hash_cache_v1:  77%|#######7  | 2314/3000 [2:01:54<38:39,  3.38s/it, lr: 1.0e-04 loss: 9.776e-02]hash_cache_v1:  77%|#######7  | 2314/3000 [2:01:54<38:39,  3.38s/it, lr: 1.0e-04 loss: 9.776e-02]hash_cache_v1:  77%|#######7  | 2314/3000 [2:01:58<38:39,  3.38s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  77%|#######7  | 2314/3000 [2:01:58<38:39,  3.38s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  77%|#######7  | 2315/3000 [2:01:58<41:29,  3.63s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  77%|#######7  | 2315/3000 [2:01:58<41:29,  3.63s/it, lr: 1.0e-04 loss: 9.578e-02]hash_cache_v1:  77%|#######7  | 2315/3000 [2:02:00<41:29,  3.63s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  77%|#######7  | 2315/3000 [2:02:00<41:29,  3.63s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  77%|#######7  | 2316/3000 [2:02:00<37:26,  3.28s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  77%|#######7  | 2316/3000 [2:02:00<37:26,  3.28s/it, lr: 1.0e-04 loss: 1.690e-01]hash_cache_v1:  77%|#######7  | 2316/3000 [2:02:03<37:26,  3.28s/it, lr: 1.0e-04 loss: 7.739e-02]hash_cache_v1:  77%|#######7  | 2316/3000 [2:02:03<37:26,  3.28s/it, lr: 1.0e-04 loss: 7.739e-02]hash_cache_v1:  77%|#######7  | 2317/3000 [2:02:03<35:56,  3.16s/it, lr: 1.0e-04 loss: 7.739e-02]hash_cache_v1:  77%|#######7  | 2317/3000 [2:02:03<35:56,  3.16s/it, lr: 1.0e-04 loss: 7.739e-02]hash_cache_v1:  77%|#######7  | 2317/3000 [2:02:05<35:56,  3.16s/it, lr: 1.0e-04 loss: 1.947e-02]hash_cache_v1:  77%|#######7  | 2317/3000 [2:02:05<35:56,  3.16s/it, lr: 1.0e-04 loss: 1.947e-02]hash_cache_v1:  77%|#######7  | 2318/3000 [2:02:05<32:25,  2.85s/it, lr: 1.0e-04 loss: 1.947e-02]hash_cache_v1:  77%|#######7  | 2318/3000 [2:02:05<32:25,  2.85s/it, lr: 1.0e-04 loss: 1.947e-02]hash_cache_v1:  77%|#######7  | 2318/3000 [2:02:10<32:25,  2.85s/it, lr: 1.0e-04 loss: 1.396e-01]hash_cache_v1:  77%|#######7  | 2318/3000 [2:02:10<32:25,  2.85s/it, lr: 1.0e-04 loss: 1.396e-01]hash_cache_v1:  77%|#######7  | 2319/3000 [2:02:10<37:46,  3.33s/it, lr: 1.0e-04 loss: 1.396e-01]hash_cache_v1:  77%|#######7  | 2319/3000 [2:02:10<37:46,  3.33s/it, lr: 1.0e-04 loss: 1.396e-01]hash_cache_v1:  77%|#######7  | 2319/3000 [2:02:12<37:46,  3.33s/it, lr: 1.0e-04 loss: 1.222e-01]hash_cache_v1:  77%|#######7  | 2319/3000 [2:02:12<37:46,  3.33s/it, lr: 1.0e-04 loss: 1.222e-01]hash_cache_v1:  77%|#######7  | 2320/3000 [2:02:15<37:43,  3.33s/it, lr: 1.0e-04 loss: 4.751e-02]hash_cache_v1:  77%|#######7  | 2320/3000 [2:02:15<37:43,  3.33s/it, lr: 1.0e-04 loss: 4.751e-02]hash_cache_v1:  77%|#######7  | 2321/3000 [2:02:15<27:52,  2.46s/it, lr: 1.0e-04 loss: 4.751e-02]hash_cache_v1:  77%|#######7  | 2321/3000 [2:02:15<27:52,  2.46s/it, lr: 1.0e-04 loss: 4.751e-02]hash_cache_v1:  77%|#######7  | 2321/3000 [2:02:17<27:52,  2.46s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  77%|#######7  | 2321/3000 [2:02:17<27:52,  2.46s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  77%|#######7  | 2322/3000 [2:02:17<26:51,  2.38s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  77%|#######7  | 2322/3000 [2:02:17<26:51,  2.38s/it, lr: 1.0e-04 loss: 1.067e-01]hash_cache_v1:  77%|#######7  | 2322/3000 [2:02:20<26:51,  2.38s/it, lr: 1.0e-04 loss: 3.060e-02]hash_cache_v1:  77%|#######7  | 2322/3000 [2:02:20<26:51,  2.38s/it, lr: 1.0e-04 loss: 3.060e-02]hash_cache_v1:  77%|#######7  | 2323/3000 [2:02:20<28:50,  2.56s/it, lr: 1.0e-04 loss: 3.060e-02]hash_cache_v1:  77%|#######7  | 2323/3000 [2:02:20<28:50,  2.56s/it, lr: 1.0e-04 loss: 3.060e-02]hash_cache_v1:  77%|#######7  | 2323/3000 [2:02:24<28:50,  2.56s/it, lr: 1.0e-04 loss: 2.600e-02]hash_cache_v1:  77%|#######7  | 2323/3000 [2:02:24<28:50,  2.56s/it, lr: 1.0e-04 loss: 2.600e-02]hash_cache_v1:  77%|#######7  | 2324/3000 [2:02:24<34:03,  3.02s/it, lr: 1.0e-04 loss: 2.600e-02]hash_cache_v1:  77%|#######7  | 2324/3000 [2:02:24<34:03,  3.02s/it, lr: 1.0e-04 loss: 2.600e-02]hash_cache_v1:  77%|#######7  | 2324/3000 [2:02:26<34:03,  3.02s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  77%|#######7  | 2324/3000 [2:02:26<34:03,  3.02s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  78%|#######7  | 2325/3000 [2:02:26<31:04,  2.76s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  78%|#######7  | 2325/3000 [2:02:26<31:04,  2.76s/it, lr: 1.0e-04 loss: 1.385e-01]hash_cache_v1:  78%|#######7  | 2325/3000 [2:02:28<31:04,  2.76s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  78%|#######7  | 2325/3000 [2:02:28<31:04,  2.76s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  78%|#######7  | 2326/3000 [2:02:28<28:55,  2.57s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  78%|#######7  | 2326/3000 [2:02:28<28:55,  2.57s/it, lr: 1.0e-04 loss: 1.286e-01]hash_cache_v1:  78%|#######7  | 2326/3000 [2:02:31<28:55,  2.57s/it, lr: 1.0e-04 loss: 1.207e-01]hash_cache_v1:  78%|#######7  | 2326/3000 [2:02:31<28:55,  2.57s/it, lr: 1.0e-04 loss: 1.207e-01]hash_cache_v1:  78%|#######7  | 2327/3000 [2:02:31<30:27,  2.72s/it, lr: 1.0e-04 loss: 1.207e-01]hash_cache_v1:  78%|#######7  | 2327/3000 [2:02:31<30:27,  2.72s/it, lr: 1.0e-04 loss: 1.207e-01]hash_cache_v1:  78%|#######7  | 2327/3000 [2:02:34<30:27,  2.72s/it, lr: 1.0e-04 loss: 1.660e-01]hash_cache_v1:  78%|#######7  | 2327/3000 [2:02:34<30:27,  2.72s/it, lr: 1.0e-04 loss: 1.660e-01]hash_cache_v1:  78%|#######7  | 2328/3000 [2:02:34<28:29,  2.54s/it, lr: 1.0e-04 loss: 1.660e-01]hash_cache_v1:  78%|#######7  | 2328/3000 [2:02:34<28:29,  2.54s/it, lr: 1.0e-04 loss: 1.660e-01]hash_cache_v1:  78%|#######7  | 2328/3000 [2:02:36<28:29,  2.54s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  78%|#######7  | 2328/3000 [2:02:36<28:29,  2.54s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  78%|#######7  | 2329/3000 [2:02:36<29:29,  2.64s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  78%|#######7  | 2329/3000 [2:02:36<29:29,  2.64s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  78%|#######7  | 2329/3000 [2:02:41<29:29,  2.64s/it, lr: 1.0e-04 loss: 1.205e-01]hash_cache_v1:  78%|#######7  | 2329/3000 [2:02:41<29:29,  2.64s/it, lr: 1.0e-04 loss: 1.205e-01]hash_cache_v1:  78%|#######7  | 2330/3000 [2:02:44<29:27,  2.64s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  78%|#######7  | 2330/3000 [2:02:44<29:27,  2.64s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  78%|#######7  | 2331/3000 [2:02:44<23:11,  2.08s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  78%|#######7  | 2331/3000 [2:02:44<23:11,  2.08s/it, lr: 1.0e-04 loss: 1.474e-01]hash_cache_v1:  78%|#######7  | 2331/3000 [2:02:48<23:11,  2.08s/it, lr: 1.0e-04 loss: 5.703e-03]hash_cache_v1:  78%|#######7  | 2331/3000 [2:02:48<23:11,  2.08s/it, lr: 1.0e-04 loss: 5.703e-03]hash_cache_v1:  78%|#######7  | 2332/3000 [2:02:48<28:58,  2.60s/it, lr: 1.0e-04 loss: 5.703e-03]hash_cache_v1:  78%|#######7  | 2332/3000 [2:02:48<28:58,  2.60s/it, lr: 1.0e-04 loss: 5.703e-03]hash_cache_v1:  78%|#######7  | 2332/3000 [2:02:50<28:58,  2.60s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  78%|#######7  | 2332/3000 [2:02:50<28:58,  2.60s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  78%|#######7  | 2333/3000 [2:02:50<27:30,  2.47s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  78%|#######7  | 2333/3000 [2:02:50<27:30,  2.47s/it, lr: 1.0e-04 loss: 2.004e-01]hash_cache_v1:  78%|#######7  | 2333/3000 [2:02:52<27:30,  2.47s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  78%|#######7  | 2333/3000 [2:02:52<27:30,  2.47s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  78%|#######7  | 2334/3000 [2:02:52<27:12,  2.45s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  78%|#######7  | 2334/3000 [2:02:52<27:12,  2.45s/it, lr: 1.0e-04 loss: 1.633e-01]hash_cache_v1:  78%|#######7  | 2334/3000 [2:02:57<27:12,  2.45s/it, lr: 1.0e-04 loss: 3.083e-02]hash_cache_v1:  78%|#######7  | 2334/3000 [2:02:57<27:12,  2.45s/it, lr: 1.0e-04 loss: 3.083e-02]hash_cache_v1:  78%|#######7  | 2335/3000 [2:02:57<32:54,  2.97s/it, lr: 1.0e-04 loss: 3.083e-02]hash_cache_v1:  78%|#######7  | 2335/3000 [2:02:57<32:54,  2.97s/it, lr: 1.0e-04 loss: 3.083e-02]hash_cache_v1:  78%|#######7  | 2335/3000 [2:03:01<32:54,  2.97s/it, lr: 1.0e-04 loss: 1.983e-02]hash_cache_v1:  78%|#######7  | 2335/3000 [2:03:01<32:54,  2.97s/it, lr: 1.0e-04 loss: 1.983e-02]hash_cache_v1:  78%|#######7  | 2336/3000 [2:03:01<37:02,  3.35s/it, lr: 1.0e-04 loss: 1.983e-02]hash_cache_v1:  78%|#######7  | 2336/3000 [2:03:01<37:02,  3.35s/it, lr: 1.0e-04 loss: 1.983e-02]hash_cache_v1:  78%|#######7  | 2336/3000 [2:03:04<37:02,  3.35s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######7  | 2336/3000 [2:03:04<37:02,  3.35s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######7  | 2337/3000 [2:03:04<35:28,  3.21s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######7  | 2337/3000 [2:03:04<35:28,  3.21s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######7  | 2337/3000 [2:03:07<35:28,  3.21s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  78%|#######7  | 2337/3000 [2:03:07<35:28,  3.21s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  78%|#######7  | 2338/3000 [2:03:07<35:14,  3.19s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  78%|#######7  | 2338/3000 [2:03:07<35:14,  3.19s/it, lr: 1.0e-04 loss: 1.246e-01]hash_cache_v1:  78%|#######7  | 2338/3000 [2:03:11<35:14,  3.19s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  78%|#######7  | 2338/3000 [2:03:11<35:14,  3.19s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  78%|#######7  | 2339/3000 [2:03:11<38:50,  3.53s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  78%|#######7  | 2339/3000 [2:03:11<38:50,  3.53s/it, lr: 1.0e-04 loss: 1.446e-01]hash_cache_v1:  78%|#######7  | 2339/3000 [2:03:14<38:50,  3.53s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  78%|#######7  | 2339/3000 [2:03:14<38:50,  3.53s/it, lr: 1.0e-04 loss: 1.065e-01]hash_cache_v1:  78%|#######8  | 2340/3000 [2:03:18<38:46,  3.53s/it, lr: 1.0e-04 loss: 3.434e-02]hash_cache_v1:  78%|#######8  | 2340/3000 [2:03:18<38:46,  3.53s/it, lr: 1.0e-04 loss: 3.434e-02]hash_cache_v1:  78%|#######8  | 2341/3000 [2:03:18<32:35,  2.97s/it, lr: 1.0e-04 loss: 3.434e-02]hash_cache_v1:  78%|#######8  | 2341/3000 [2:03:18<32:35,  2.97s/it, lr: 1.0e-04 loss: 3.434e-02]hash_cache_v1:  78%|#######8  | 2341/3000 [2:03:21<32:35,  2.97s/it, lr: 1.0e-04 loss: 3.923e-02]hash_cache_v1:  78%|#######8  | 2341/3000 [2:03:21<32:35,  2.97s/it, lr: 1.0e-04 loss: 3.923e-02]hash_cache_v1:  78%|#######8  | 2342/3000 [2:03:21<30:15,  2.76s/it, lr: 1.0e-04 loss: 3.923e-02]hash_cache_v1:  78%|#######8  | 2342/3000 [2:03:21<30:15,  2.76s/it, lr: 1.0e-04 loss: 3.923e-02]hash_cache_v1:  78%|#######8  | 2342/3000 [2:03:25<30:15,  2.76s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  78%|#######8  | 2342/3000 [2:03:25<30:15,  2.76s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  78%|#######8  | 2343/3000 [2:03:25<34:32,  3.15s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  78%|#######8  | 2343/3000 [2:03:25<34:32,  3.15s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  78%|#######8  | 2343/3000 [2:03:27<34:32,  3.15s/it, lr: 1.0e-04 loss: 4.365e-02]hash_cache_v1:  78%|#######8  | 2343/3000 [2:03:27<34:32,  3.15s/it, lr: 1.0e-04 loss: 4.365e-02]hash_cache_v1:  78%|#######8  | 2344/3000 [2:03:27<31:20,  2.87s/it, lr: 1.0e-04 loss: 4.365e-02]hash_cache_v1:  78%|#######8  | 2344/3000 [2:03:27<31:20,  2.87s/it, lr: 1.0e-04 loss: 4.365e-02]hash_cache_v1:  78%|#######8  | 2344/3000 [2:03:30<31:20,  2.87s/it, lr: 1.0e-04 loss: 1.974e-02]hash_cache_v1:  78%|#######8  | 2344/3000 [2:03:30<31:20,  2.87s/it, lr: 1.0e-04 loss: 1.974e-02]hash_cache_v1:  78%|#######8  | 2345/3000 [2:03:30<31:57,  2.93s/it, lr: 1.0e-04 loss: 1.974e-02]hash_cache_v1:  78%|#######8  | 2345/3000 [2:03:30<31:57,  2.93s/it, lr: 1.0e-04 loss: 1.974e-02]hash_cache_v1:  78%|#######8  | 2345/3000 [2:03:34<31:57,  2.93s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  78%|#######8  | 2345/3000 [2:03:34<31:57,  2.93s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  78%|#######8  | 2346/3000 [2:03:34<36:09,  3.32s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  78%|#######8  | 2346/3000 [2:03:34<36:09,  3.32s/it, lr: 1.0e-04 loss: 1.245e-01]hash_cache_v1:  78%|#######8  | 2346/3000 [2:03:36<36:09,  3.32s/it, lr: 1.0e-04 loss: 6.624e-02]hash_cache_v1:  78%|#######8  | 2346/3000 [2:03:36<36:09,  3.32s/it, lr: 1.0e-04 loss: 6.624e-02]hash_cache_v1:  78%|#######8  | 2347/3000 [2:03:36<32:18,  2.97s/it, lr: 1.0e-04 loss: 6.624e-02]hash_cache_v1:  78%|#######8  | 2347/3000 [2:03:36<32:18,  2.97s/it, lr: 1.0e-04 loss: 6.624e-02]hash_cache_v1:  78%|#######8  | 2347/3000 [2:03:40<32:18,  2.97s/it, lr: 1.0e-04 loss: 1.631e-01]hash_cache_v1:  78%|#######8  | 2347/3000 [2:03:40<32:18,  2.97s/it, lr: 1.0e-04 loss: 1.631e-01]hash_cache_v1:  78%|#######8  | 2348/3000 [2:03:40<32:35,  3.00s/it, lr: 1.0e-04 loss: 1.631e-01]hash_cache_v1:  78%|#######8  | 2348/3000 [2:03:40<32:35,  3.00s/it, lr: 1.0e-04 loss: 1.631e-01]hash_cache_v1:  78%|#######8  | 2348/3000 [2:03:44<32:35,  3.00s/it, lr: 1.0e-04 loss: 1.702e-02]hash_cache_v1:  78%|#######8  | 2348/3000 [2:03:44<32:35,  3.00s/it, lr: 1.0e-04 loss: 1.702e-02]hash_cache_v1:  78%|#######8  | 2349/3000 [2:03:44<36:45,  3.39s/it, lr: 1.0e-04 loss: 1.702e-02]hash_cache_v1:  78%|#######8  | 2349/3000 [2:03:44<36:45,  3.39s/it, lr: 1.0e-04 loss: 1.702e-02]hash_cache_v1:  78%|#######8  | 2349/3000 [2:03:48<36:45,  3.39s/it, lr: 1.0e-04 loss: 8.262e-02]hash_cache_v1:  78%|#######8  | 2349/3000 [2:03:48<36:45,  3.39s/it, lr: 1.0e-04 loss: 8.262e-02]hash_cache_v1:  78%|#######8  | 2350/3000 [2:03:52<36:42,  3.39s/it, lr: 1.0e-04 loss: 8.652e-02]hash_cache_v1:  78%|#######8  | 2350/3000 [2:03:52<36:42,  3.39s/it, lr: 1.0e-04 loss: 8.652e-02]hash_cache_v1:  78%|#######8  | 2351/3000 [2:03:52<30:37,  2.83s/it, lr: 1.0e-04 loss: 8.652e-02]hash_cache_v1:  78%|#######8  | 2351/3000 [2:03:52<30:37,  2.83s/it, lr: 1.0e-04 loss: 8.652e-02]hash_cache_v1:  78%|#######8  | 2351/3000 [2:03:57<30:37,  2.83s/it, lr: 1.0e-04 loss: 8.420e-02]hash_cache_v1:  78%|#######8  | 2351/3000 [2:03:57<30:37,  2.83s/it, lr: 1.0e-04 loss: 8.420e-02]hash_cache_v1:  78%|#######8  | 2352/3000 [2:03:57<35:08,  3.25s/it, lr: 1.0e-04 loss: 8.420e-02]hash_cache_v1:  78%|#######8  | 2352/3000 [2:03:57<35:08,  3.25s/it, lr: 1.0e-04 loss: 8.420e-02]hash_cache_v1:  78%|#######8  | 2352/3000 [2:03:59<35:08,  3.25s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######8  | 2352/3000 [2:03:59<35:08,  3.25s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######8  | 2353/3000 [2:03:59<31:51,  2.95s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######8  | 2353/3000 [2:03:59<31:51,  2.95s/it, lr: 1.0e-04 loss: 1.244e-01]hash_cache_v1:  78%|#######8  | 2353/3000 [2:04:02<31:51,  2.95s/it, lr: 1.0e-04 loss: 9.705e-02]hash_cache_v1:  78%|#######8  | 2353/3000 [2:04:02<31:51,  2.95s/it, lr: 1.0e-04 loss: 9.705e-02]hash_cache_v1:  78%|#######8  | 2354/3000 [2:04:02<31:28,  2.92s/it, lr: 1.0e-04 loss: 9.705e-02]hash_cache_v1:  78%|#######8  | 2354/3000 [2:04:02<31:28,  2.92s/it, lr: 1.0e-04 loss: 9.705e-02]hash_cache_v1:  78%|#######8  | 2354/3000 [2:04:05<31:28,  2.92s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  78%|#######8  | 2354/3000 [2:04:05<31:28,  2.92s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  78%|#######8  | 2355/3000 [2:04:05<31:54,  2.97s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  78%|#######8  | 2355/3000 [2:04:05<31:54,  2.97s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  78%|#######8  | 2355/3000 [2:04:09<31:54,  2.97s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  78%|#######8  | 2355/3000 [2:04:09<31:54,  2.97s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  79%|#######8  | 2356/3000 [2:04:09<35:59,  3.35s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  79%|#######8  | 2356/3000 [2:04:09<35:59,  3.35s/it, lr: 1.0e-04 loss: 1.309e-01]hash_cache_v1:  79%|#######8  | 2356/3000 [2:04:11<35:59,  3.35s/it, lr: 1.0e-04 loss: 2.274e-01]hash_cache_v1:  79%|#######8  | 2356/3000 [2:04:11<35:59,  3.35s/it, lr: 1.0e-04 loss: 2.274e-01]hash_cache_v1:  79%|#######8  | 2357/3000 [2:04:11<31:58,  2.98s/it, lr: 1.0e-04 loss: 2.274e-01]hash_cache_v1:  79%|#######8  | 2357/3000 [2:04:11<31:58,  2.98s/it, lr: 1.0e-04 loss: 2.274e-01]hash_cache_v1:  79%|#######8  | 2357/3000 [2:04:14<31:58,  2.98s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  79%|#######8  | 2357/3000 [2:04:14<31:58,  2.98s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  79%|#######8  | 2358/3000 [2:04:14<29:07,  2.72s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  79%|#######8  | 2358/3000 [2:04:14<29:07,  2.72s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  79%|#######8  | 2358/3000 [2:04:17<29:07,  2.72s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  79%|#######8  | 2358/3000 [2:04:17<29:07,  2.72s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  79%|#######8  | 2359/3000 [2:04:17<29:52,  2.80s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  79%|#######8  | 2359/3000 [2:04:17<29:52,  2.80s/it, lr: 1.0e-04 loss: 1.216e-01]hash_cache_v1:  79%|#######8  | 2359/3000 [2:04:21<29:52,  2.80s/it, lr: 1.0e-04 loss: 8.498e-02]hash_cache_v1:  79%|#######8  | 2359/3000 [2:04:21<29:52,  2.80s/it, lr: 1.0e-04 loss: 8.498e-02]hash_cache_v1:  79%|#######8  | 2360/3000 [2:04:25<29:49,  2.80s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  79%|#######8  | 2360/3000 [2:04:25<29:49,  2.80s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  79%|#######8  | 2361/3000 [2:04:25<26:38,  2.50s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  79%|#######8  | 2361/3000 [2:04:25<26:38,  2.50s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  79%|#######8  | 2361/3000 [2:04:28<26:38,  2.50s/it, lr: 1.0e-04 loss: 6.007e-02]hash_cache_v1:  79%|#######8  | 2361/3000 [2:04:28<26:38,  2.50s/it, lr: 1.0e-04 loss: 6.007e-02]hash_cache_v1:  79%|#######8  | 2362/3000 [2:04:28<27:33,  2.59s/it, lr: 1.0e-04 loss: 6.007e-02]hash_cache_v1:  79%|#######8  | 2362/3000 [2:04:28<27:33,  2.59s/it, lr: 1.0e-04 loss: 6.007e-02]hash_cache_v1:  79%|#######8  | 2362/3000 [2:04:31<27:33,  2.59s/it, lr: 1.0e-04 loss: 2.081e-02]hash_cache_v1:  79%|#######8  | 2362/3000 [2:04:31<27:33,  2.59s/it, lr: 1.0e-04 loss: 2.081e-02]hash_cache_v1:  79%|#######8  | 2363/3000 [2:04:31<28:47,  2.71s/it, lr: 1.0e-04 loss: 2.081e-02]hash_cache_v1:  79%|#######8  | 2363/3000 [2:04:31<28:47,  2.71s/it, lr: 1.0e-04 loss: 2.081e-02]hash_cache_v1:  79%|#######8  | 2363/3000 [2:04:34<28:47,  2.71s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  79%|#######8  | 2363/3000 [2:04:34<28:47,  2.71s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  79%|#######8  | 2364/3000 [2:04:34<29:14,  2.76s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  79%|#######8  | 2364/3000 [2:04:34<29:14,  2.76s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  79%|#######8  | 2364/3000 [2:04:36<29:14,  2.76s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  79%|#######8  | 2364/3000 [2:04:36<29:14,  2.76s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  79%|#######8  | 2365/3000 [2:04:36<27:10,  2.57s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  79%|#######8  | 2365/3000 [2:04:36<27:10,  2.57s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  79%|#######8  | 2365/3000 [2:04:38<27:10,  2.57s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:  79%|#######8  | 2365/3000 [2:04:38<27:10,  2.57s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:  79%|#######8  | 2366/3000 [2:04:38<26:31,  2.51s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:  79%|#######8  | 2366/3000 [2:04:38<26:31,  2.51s/it, lr: 1.0e-04 loss: 1.142e-01]hash_cache_v1:  79%|#######8  | 2366/3000 [2:04:41<26:31,  2.51s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  79%|#######8  | 2366/3000 [2:04:41<26:31,  2.51s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  79%|#######8  | 2367/3000 [2:04:41<27:34,  2.61s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  79%|#######8  | 2367/3000 [2:04:41<27:34,  2.61s/it, lr: 1.0e-04 loss: 1.574e-01]hash_cache_v1:  79%|#######8  | 2367/3000 [2:04:43<27:34,  2.61s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  79%|#######8  | 2367/3000 [2:04:43<27:34,  2.61s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  79%|#######8  | 2368/3000 [2:04:43<25:56,  2.46s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  79%|#######8  | 2368/3000 [2:04:43<25:56,  2.46s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  79%|#######8  | 2368/3000 [2:04:46<25:56,  2.46s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  79%|#######8  | 2368/3000 [2:04:46<25:56,  2.46s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  79%|#######8  | 2369/3000 [2:04:46<27:13,  2.59s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  79%|#######8  | 2369/3000 [2:04:46<27:13,  2.59s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  79%|#######8  | 2369/3000 [2:04:49<27:13,  2.59s/it, lr: 1.0e-04 loss: 4.475e-02]hash_cache_v1:  79%|#######8  | 2369/3000 [2:04:49<27:13,  2.59s/it, lr: 1.0e-04 loss: 4.475e-02]hash_cache_v1:  79%|#######9  | 2370/3000 [2:04:53<27:11,  2.59s/it, lr: 1.0e-04 loss: 9.388e-02]hash_cache_v1:  79%|#######9  | 2370/3000 [2:04:53<27:11,  2.59s/it, lr: 1.0e-04 loss: 9.388e-02]hash_cache_v1:  79%|#######9  | 2371/3000 [2:04:53<24:47,  2.37s/it, lr: 1.0e-04 loss: 9.388e-02]hash_cache_v1:  79%|#######9  | 2371/3000 [2:04:53<24:47,  2.37s/it, lr: 1.0e-04 loss: 9.388e-02]hash_cache_v1:  79%|#######9  | 2371/3000 [2:04:56<24:47,  2.37s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  79%|#######9  | 2371/3000 [2:04:56<24:47,  2.37s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  79%|#######9  | 2372/3000 [2:04:56<26:05,  2.49s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  79%|#######9  | 2372/3000 [2:04:56<26:05,  2.49s/it, lr: 1.0e-04 loss: 1.248e-01]hash_cache_v1:  79%|#######9  | 2372/3000 [2:04:59<26:05,  2.49s/it, lr: 1.0e-04 loss: 1.397e-01]hash_cache_v1:  79%|#######9  | 2372/3000 [2:04:59<26:05,  2.49s/it, lr: 1.0e-04 loss: 1.397e-01]hash_cache_v1:  79%|#######9  | 2373/3000 [2:04:59<27:07,  2.60s/it, lr: 1.0e-04 loss: 1.397e-01]hash_cache_v1:  79%|#######9  | 2373/3000 [2:04:59<27:07,  2.60s/it, lr: 1.0e-04 loss: 1.397e-01]hash_cache_v1:  79%|#######9  | 2373/3000 [2:05:02<27:07,  2.60s/it, lr: 1.0e-04 loss: 3.620e-02]hash_cache_v1:  79%|#######9  | 2373/3000 [2:05:02<27:07,  2.60s/it, lr: 1.0e-04 loss: 3.620e-02]hash_cache_v1:  79%|#######9  | 2374/3000 [2:05:02<28:07,  2.70s/it, lr: 1.0e-04 loss: 3.620e-02]hash_cache_v1:  79%|#######9  | 2374/3000 [2:05:02<28:07,  2.70s/it, lr: 1.0e-04 loss: 3.620e-02]hash_cache_v1:  79%|#######9  | 2374/3000 [2:05:04<28:07,  2.70s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  79%|#######9  | 2374/3000 [2:05:04<28:07,  2.70s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  79%|#######9  | 2375/3000 [2:05:04<26:18,  2.53s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  79%|#######9  | 2375/3000 [2:05:04<26:18,  2.53s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  79%|#######9  | 2375/3000 [2:05:06<26:18,  2.53s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  79%|#######9  | 2375/3000 [2:05:06<26:18,  2.53s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  79%|#######9  | 2376/3000 [2:05:06<25:00,  2.40s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  79%|#######9  | 2376/3000 [2:05:06<25:00,  2.40s/it, lr: 1.0e-04 loss: 1.680e-01]hash_cache_v1:  79%|#######9  | 2376/3000 [2:05:09<25:00,  2.40s/it, lr: 1.0e-04 loss: 1.843e-02]hash_cache_v1:  79%|#######9  | 2376/3000 [2:05:09<25:00,  2.40s/it, lr: 1.0e-04 loss: 1.843e-02]hash_cache_v1:  79%|#######9  | 2377/3000 [2:05:09<27:00,  2.60s/it, lr: 1.0e-04 loss: 1.843e-02]hash_cache_v1:  79%|#######9  | 2377/3000 [2:05:09<27:00,  2.60s/it, lr: 1.0e-04 loss: 1.843e-02]hash_cache_v1:  79%|#######9  | 2377/3000 [2:05:13<27:00,  2.60s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  79%|#######9  | 2377/3000 [2:05:13<27:00,  2.60s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  79%|#######9  | 2378/3000 [2:05:13<32:11,  3.11s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  79%|#######9  | 2378/3000 [2:05:13<32:11,  3.11s/it, lr: 1.0e-04 loss: 1.130e-01]hash_cache_v1:  79%|#######9  | 2378/3000 [2:05:16<32:11,  3.11s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  79%|#######9  | 2378/3000 [2:05:16<32:11,  3.11s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  79%|#######9  | 2379/3000 [2:05:16<31:26,  3.04s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  79%|#######9  | 2379/3000 [2:05:16<31:26,  3.04s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  79%|#######9  | 2379/3000 [2:05:19<31:26,  3.04s/it, lr: 1.0e-04 loss: 1.623e-01]hash_cache_v1:  79%|#######9  | 2379/3000 [2:05:19<31:26,  3.04s/it, lr: 1.0e-04 loss: 1.623e-01]hash_cache_v1:  79%|#######9  | 2380/3000 [2:05:21<31:23,  3.04s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  79%|#######9  | 2380/3000 [2:05:21<31:23,  3.04s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  79%|#######9  | 2381/3000 [2:05:21<22:39,  2.20s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  79%|#######9  | 2381/3000 [2:05:21<22:39,  2.20s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  79%|#######9  | 2381/3000 [2:05:26<22:39,  2.20s/it, lr: 1.0e-04 loss: 2.934e-02]hash_cache_v1:  79%|#######9  | 2381/3000 [2:05:26<22:39,  2.20s/it, lr: 1.0e-04 loss: 2.934e-02]hash_cache_v1:  79%|#######9  | 2382/3000 [2:05:26<27:54,  2.71s/it, lr: 1.0e-04 loss: 2.934e-02]hash_cache_v1:  79%|#######9  | 2382/3000 [2:05:26<27:54,  2.71s/it, lr: 1.0e-04 loss: 2.934e-02]hash_cache_v1:  79%|#######9  | 2382/3000 [2:05:28<27:54,  2.71s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  79%|#######9  | 2382/3000 [2:05:28<27:54,  2.71s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  79%|#######9  | 2383/3000 [2:05:28<26:14,  2.55s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  79%|#######9  | 2383/3000 [2:05:28<26:14,  2.55s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  79%|#######9  | 2383/3000 [2:05:32<26:14,  2.55s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  79%|#######9  | 2383/3000 [2:05:32<26:14,  2.55s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  79%|#######9  | 2384/3000 [2:05:32<31:06,  3.03s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  79%|#######9  | 2384/3000 [2:05:32<31:06,  3.03s/it, lr: 1.0e-04 loss: 1.137e-01]hash_cache_v1:  79%|#######9  | 2384/3000 [2:05:34<31:06,  3.03s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  79%|#######9  | 2384/3000 [2:05:34<31:06,  3.03s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  80%|#######9  | 2385/3000 [2:05:34<29:09,  2.85s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  80%|#######9  | 2385/3000 [2:05:34<29:09,  2.85s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  80%|#######9  | 2385/3000 [2:05:39<29:09,  2.85s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  80%|#######9  | 2385/3000 [2:05:39<29:09,  2.85s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  80%|#######9  | 2386/3000 [2:05:39<33:22,  3.26s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  80%|#######9  | 2386/3000 [2:05:39<33:22,  3.26s/it, lr: 1.0e-04 loss: 1.040e-01]hash_cache_v1:  80%|#######9  | 2386/3000 [2:05:42<33:22,  3.26s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  80%|#######9  | 2386/3000 [2:05:42<33:22,  3.26s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  80%|#######9  | 2387/3000 [2:05:42<32:09,  3.15s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  80%|#######9  | 2387/3000 [2:05:42<32:09,  3.15s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  80%|#######9  | 2387/3000 [2:05:46<32:09,  3.15s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  80%|#######9  | 2387/3000 [2:05:46<32:09,  3.15s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  80%|#######9  | 2388/3000 [2:05:46<36:06,  3.54s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  80%|#######9  | 2388/3000 [2:05:46<36:06,  3.54s/it, lr: 1.0e-04 loss: 1.265e-01]hash_cache_v1:  80%|#######9  | 2388/3000 [2:05:48<36:06,  3.54s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  80%|#######9  | 2388/3000 [2:05:48<36:06,  3.54s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  80%|#######9  | 2389/3000 [2:05:48<31:35,  3.10s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  80%|#######9  | 2389/3000 [2:05:48<31:35,  3.10s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  80%|#######9  | 2389/3000 [2:05:51<31:35,  3.10s/it, lr: 1.0e-04 loss: 6.958e-02]hash_cache_v1:  80%|#######9  | 2389/3000 [2:05:51<31:35,  3.10s/it, lr: 1.0e-04 loss: 6.958e-02]hash_cache_v1:  80%|#######9  | 2390/3000 [2:05:55<31:32,  3.10s/it, lr: 1.0e-04 loss: 8.033e-02]hash_cache_v1:  80%|#######9  | 2390/3000 [2:05:55<31:32,  3.10s/it, lr: 1.0e-04 loss: 8.033e-02]hash_cache_v1:  80%|#######9  | 2391/3000 [2:05:55<27:05,  2.67s/it, lr: 1.0e-04 loss: 8.033e-02]hash_cache_v1:  80%|#######9  | 2391/3000 [2:05:55<27:05,  2.67s/it, lr: 1.0e-04 loss: 8.033e-02]hash_cache_v1:  80%|#######9  | 2391/3000 [2:05:58<27:05,  2.67s/it, lr: 1.0e-04 loss: 1.442e-01]hash_cache_v1:  80%|#######9  | 2391/3000 [2:05:58<27:05,  2.67s/it, lr: 1.0e-04 loss: 1.442e-01]hash_cache_v1:  80%|#######9  | 2392/3000 [2:05:58<26:15,  2.59s/it, lr: 1.0e-04 loss: 1.442e-01]hash_cache_v1:  80%|#######9  | 2392/3000 [2:05:58<26:15,  2.59s/it, lr: 1.0e-04 loss: 1.442e-01]hash_cache_v1:  80%|#######9  | 2392/3000 [2:06:02<26:15,  2.59s/it, lr: 1.0e-04 loss: 8.594e-02]hash_cache_v1:  80%|#######9  | 2392/3000 [2:06:02<26:15,  2.59s/it, lr: 1.0e-04 loss: 8.594e-02]hash_cache_v1:  80%|#######9  | 2393/3000 [2:06:02<30:45,  3.04s/it, lr: 1.0e-04 loss: 8.594e-02]hash_cache_v1:  80%|#######9  | 2393/3000 [2:06:02<30:45,  3.04s/it, lr: 1.0e-04 loss: 8.594e-02]hash_cache_v1:  80%|#######9  | 2393/3000 [2:06:04<30:45,  3.04s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  80%|#######9  | 2393/3000 [2:06:04<30:45,  3.04s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  80%|#######9  | 2394/3000 [2:06:04<28:08,  2.79s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  80%|#######9  | 2394/3000 [2:06:04<28:08,  2.79s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  80%|#######9  | 2394/3000 [2:06:08<28:08,  2.79s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  80%|#######9  | 2394/3000 [2:06:08<28:08,  2.79s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  80%|#######9  | 2395/3000 [2:06:08<32:17,  3.20s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  80%|#######9  | 2395/3000 [2:06:08<32:17,  3.20s/it, lr: 1.0e-04 loss: 1.306e-01]hash_cache_v1:  80%|#######9  | 2395/3000 [2:06:13<32:17,  3.20s/it, lr: 1.0e-04 loss: 6.239e-02]hash_cache_v1:  80%|#######9  | 2395/3000 [2:06:13<32:17,  3.20s/it, lr: 1.0e-04 loss: 6.239e-02]hash_cache_v1:  80%|#######9  | 2396/3000 [2:06:13<36:03,  3.58s/it, lr: 1.0e-04 loss: 6.239e-02]hash_cache_v1:  80%|#######9  | 2396/3000 [2:06:13<36:03,  3.58s/it, lr: 1.0e-04 loss: 6.239e-02]hash_cache_v1:  80%|#######9  | 2396/3000 [2:06:16<36:03,  3.58s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  80%|#######9  | 2396/3000 [2:06:16<36:03,  3.58s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  80%|#######9  | 2397/3000 [2:06:16<33:51,  3.37s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  80%|#######9  | 2397/3000 [2:06:16<33:51,  3.37s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  80%|#######9  | 2397/3000 [2:06:19<33:51,  3.37s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  80%|#######9  | 2397/3000 [2:06:19<33:51,  3.37s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  80%|#######9  | 2398/3000 [2:06:19<32:17,  3.22s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  80%|#######9  | 2398/3000 [2:06:19<32:17,  3.22s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  80%|#######9  | 2398/3000 [2:06:21<32:17,  3.22s/it, lr: 1.0e-04 loss: 3.685e-02]hash_cache_v1:  80%|#######9  | 2398/3000 [2:06:21<32:17,  3.22s/it, lr: 1.0e-04 loss: 3.685e-02]hash_cache_v1:  80%|#######9  | 2399/3000 [2:06:21<29:45,  2.97s/it, lr: 1.0e-04 loss: 3.685e-02]hash_cache_v1:  80%|#######9  | 2399/3000 [2:06:21<29:45,  2.97s/it, lr: 1.0e-04 loss: 3.685e-02]hash_cache_v1:  80%|#######9  | 2399/3000 [2:06:24<29:45,  2.97s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  80%|#######9  | 2399/3000 [2:06:24<29:45,  2.97s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  80%|########  | 2400/3000 [2:06:26<29:42,  2.97s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  80%|########  | 2400/3000 [2:06:26<29:42,  2.97s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  80%|########  | 2401/3000 [2:06:26<20:51,  2.09s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  80%|########  | 2401/3000 [2:06:26<20:51,  2.09s/it, lr: 1.0e-04 loss: 1.180e-01]hash_cache_v1:  80%|########  | 2401/3000 [2:06:28<20:51,  2.09s/it, lr: 1.0e-04 loss: 2.461e-01]hash_cache_v1:  80%|########  | 2401/3000 [2:06:28<20:51,  2.09s/it, lr: 1.0e-04 loss: 2.461e-01]hash_cache_v1:  80%|########  | 2402/3000 [2:06:28<20:50,  2.09s/it, lr: 1.0e-04 loss: 2.461e-01]hash_cache_v1:  80%|########  | 2402/3000 [2:06:28<20:50,  2.09s/it, lr: 1.0e-04 loss: 2.461e-01]hash_cache_v1:  80%|########  | 2402/3000 [2:06:30<20:50,  2.09s/it, lr: 1.0e-04 loss: 1.524e-01]hash_cache_v1:  80%|########  | 2402/3000 [2:06:30<20:50,  2.09s/it, lr: 1.0e-04 loss: 1.524e-01]hash_cache_v1:  80%|########  | 2403/3000 [2:06:30<21:30,  2.16s/it, lr: 1.0e-04 loss: 1.524e-01]hash_cache_v1:  80%|########  | 2403/3000 [2:06:30<21:30,  2.16s/it, lr: 1.0e-04 loss: 1.524e-01]hash_cache_v1:  80%|########  | 2403/3000 [2:06:35<21:30,  2.16s/it, lr: 1.0e-04 loss: 7.602e-02]hash_cache_v1:  80%|########  | 2403/3000 [2:06:35<21:30,  2.16s/it, lr: 1.0e-04 loss: 7.602e-02]hash_cache_v1:  80%|########  | 2404/3000 [2:06:35<27:08,  2.73s/it, lr: 1.0e-04 loss: 7.602e-02]hash_cache_v1:  80%|########  | 2404/3000 [2:06:35<27:08,  2.73s/it, lr: 1.0e-04 loss: 7.602e-02]hash_cache_v1:  80%|########  | 2404/3000 [2:06:37<27:08,  2.73s/it, lr: 1.0e-04 loss: 3.976e-02]hash_cache_v1:  80%|########  | 2404/3000 [2:06:37<27:08,  2.73s/it, lr: 1.0e-04 loss: 3.976e-02]hash_cache_v1:  80%|########  | 2405/3000 [2:06:37<25:16,  2.55s/it, lr: 1.0e-04 loss: 3.976e-02]hash_cache_v1:  80%|########  | 2405/3000 [2:06:37<25:16,  2.55s/it, lr: 1.0e-04 loss: 3.976e-02]hash_cache_v1:  80%|########  | 2405/3000 [2:06:40<25:16,  2.55s/it, lr: 1.0e-04 loss: 9.747e-02]hash_cache_v1:  80%|########  | 2405/3000 [2:06:40<25:16,  2.55s/it, lr: 1.0e-04 loss: 9.747e-02]hash_cache_v1:  80%|########  | 2406/3000 [2:06:40<26:43,  2.70s/it, lr: 1.0e-04 loss: 9.747e-02]hash_cache_v1:  80%|########  | 2406/3000 [2:06:40<26:43,  2.70s/it, lr: 1.0e-04 loss: 9.747e-02]hash_cache_v1:  80%|########  | 2406/3000 [2:06:43<26:43,  2.70s/it, lr: 1.0e-04 loss: 1.677e-01]hash_cache_v1:  80%|########  | 2406/3000 [2:06:43<26:43,  2.70s/it, lr: 1.0e-04 loss: 1.677e-01]hash_cache_v1:  80%|########  | 2407/3000 [2:06:43<27:09,  2.75s/it, lr: 1.0e-04 loss: 1.677e-01]hash_cache_v1:  80%|########  | 2407/3000 [2:06:43<27:09,  2.75s/it, lr: 1.0e-04 loss: 1.677e-01]hash_cache_v1:  80%|########  | 2407/3000 [2:06:46<27:09,  2.75s/it, lr: 1.0e-04 loss: 1.381e-01]hash_cache_v1:  80%|########  | 2407/3000 [2:06:46<27:09,  2.75s/it, lr: 1.0e-04 loss: 1.381e-01]hash_cache_v1:  80%|########  | 2408/3000 [2:06:46<27:27,  2.78s/it, lr: 1.0e-04 loss: 1.381e-01]hash_cache_v1:  80%|########  | 2408/3000 [2:06:46<27:27,  2.78s/it, lr: 1.0e-04 loss: 1.381e-01]hash_cache_v1:  80%|########  | 2408/3000 [2:06:50<27:27,  2.78s/it, lr: 1.0e-04 loss: 4.779e-02]hash_cache_v1:  80%|########  | 2408/3000 [2:06:50<27:27,  2.78s/it, lr: 1.0e-04 loss: 4.779e-02]hash_cache_v1:  80%|########  | 2409/3000 [2:06:50<31:43,  3.22s/it, lr: 1.0e-04 loss: 4.779e-02]hash_cache_v1:  80%|########  | 2409/3000 [2:06:50<31:43,  3.22s/it, lr: 1.0e-04 loss: 4.779e-02]hash_cache_v1:  80%|########  | 2409/3000 [2:06:53<31:43,  3.22s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1:  80%|########  | 2409/3000 [2:06:53<31:43,  3.22s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1:  80%|########  | 2410/3000 [2:06:55<31:39,  3.22s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  80%|########  | 2410/3000 [2:06:55<31:39,  3.22s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  80%|########  | 2411/3000 [2:06:55<21:48,  2.22s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  80%|########  | 2411/3000 [2:06:55<21:48,  2.22s/it, lr: 1.0e-04 loss: 1.372e-01]hash_cache_v1:  80%|########  | 2411/3000 [2:06:58<21:48,  2.22s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  80%|########  | 2411/3000 [2:06:58<21:48,  2.22s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  80%|########  | 2412/3000 [2:06:58<23:18,  2.38s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  80%|########  | 2412/3000 [2:06:58<23:18,  2.38s/it, lr: 1.0e-04 loss: 1.468e-01]hash_cache_v1:  80%|########  | 2412/3000 [2:07:00<23:18,  2.38s/it, lr: 1.0e-04 loss: 1.424e-01]hash_cache_v1:  80%|########  | 2412/3000 [2:07:00<23:18,  2.38s/it, lr: 1.0e-04 loss: 1.424e-01]hash_cache_v1:  80%|########  | 2413/3000 [2:07:00<23:10,  2.37s/it, lr: 1.0e-04 loss: 1.424e-01]hash_cache_v1:  80%|########  | 2413/3000 [2:07:00<23:10,  2.37s/it, lr: 1.0e-04 loss: 1.424e-01]hash_cache_v1:  80%|########  | 2413/3000 [2:07:02<23:10,  2.37s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  80%|########  | 2413/3000 [2:07:02<23:10,  2.37s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  80%|########  | 2414/3000 [2:07:02<22:22,  2.29s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  80%|########  | 2414/3000 [2:07:02<22:22,  2.29s/it, lr: 1.0e-04 loss: 1.737e-01]hash_cache_v1:  80%|########  | 2414/3000 [2:07:06<22:22,  2.29s/it, lr: 1.0e-04 loss: 1.977e-02]hash_cache_v1:  80%|########  | 2414/3000 [2:07:06<22:22,  2.29s/it, lr: 1.0e-04 loss: 1.977e-02]hash_cache_v1:  80%|########  | 2415/3000 [2:07:06<27:50,  2.86s/it, lr: 1.0e-04 loss: 1.977e-02]hash_cache_v1:  80%|########  | 2415/3000 [2:07:06<27:50,  2.86s/it, lr: 1.0e-04 loss: 1.977e-02]hash_cache_v1:  80%|########  | 2415/3000 [2:07:09<27:50,  2.86s/it, lr: 1.0e-04 loss: 2.323e-02]hash_cache_v1:  80%|########  | 2415/3000 [2:07:09<27:50,  2.86s/it, lr: 1.0e-04 loss: 2.323e-02]hash_cache_v1:  81%|########  | 2416/3000 [2:07:09<27:44,  2.85s/it, lr: 1.0e-04 loss: 2.323e-02]hash_cache_v1:  81%|########  | 2416/3000 [2:07:09<27:44,  2.85s/it, lr: 1.0e-04 loss: 2.323e-02]hash_cache_v1:  81%|########  | 2416/3000 [2:07:14<27:44,  2.85s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  81%|########  | 2416/3000 [2:07:14<27:44,  2.85s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  81%|########  | 2417/3000 [2:07:14<32:16,  3.32s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  81%|########  | 2417/3000 [2:07:14<32:16,  3.32s/it, lr: 1.0e-04 loss: 1.078e-01]hash_cache_v1:  81%|########  | 2417/3000 [2:07:16<32:16,  3.32s/it, lr: 1.0e-04 loss: 1.971e-01]hash_cache_v1:  81%|########  | 2417/3000 [2:07:16<32:16,  3.32s/it, lr: 1.0e-04 loss: 1.971e-01]hash_cache_v1:  81%|########  | 2418/3000 [2:07:16<28:41,  2.96s/it, lr: 1.0e-04 loss: 1.971e-01]hash_cache_v1:  81%|########  | 2418/3000 [2:07:16<28:41,  2.96s/it, lr: 1.0e-04 loss: 1.971e-01]hash_cache_v1:  81%|########  | 2418/3000 [2:07:18<28:41,  2.96s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  81%|########  | 2418/3000 [2:07:18<28:41,  2.96s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  81%|########  | 2419/3000 [2:07:18<26:06,  2.70s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  81%|########  | 2419/3000 [2:07:18<26:06,  2.70s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  81%|########  | 2419/3000 [2:07:22<26:06,  2.70s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  81%|########  | 2419/3000 [2:07:22<26:06,  2.70s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  81%|########  | 2420/3000 [2:07:25<26:03,  2.70s/it, lr: 1.0e-04 loss: 3.859e-02]hash_cache_v1:  81%|########  | 2420/3000 [2:07:25<26:03,  2.70s/it, lr: 1.0e-04 loss: 3.859e-02]hash_cache_v1:  81%|########  | 2421/3000 [2:07:25<20:52,  2.16s/it, lr: 1.0e-04 loss: 3.859e-02]hash_cache_v1:  81%|########  | 2421/3000 [2:07:25<20:52,  2.16s/it, lr: 1.0e-04 loss: 3.859e-02]hash_cache_v1:  81%|########  | 2421/3000 [2:07:27<20:52,  2.16s/it, lr: 1.0e-04 loss: 9.053e-02]hash_cache_v1:  81%|########  | 2421/3000 [2:07:27<20:52,  2.16s/it, lr: 1.0e-04 loss: 9.053e-02]hash_cache_v1:  81%|########  | 2422/3000 [2:07:27<20:35,  2.14s/it, lr: 1.0e-04 loss: 9.053e-02]hash_cache_v1:  81%|########  | 2422/3000 [2:07:27<20:35,  2.14s/it, lr: 1.0e-04 loss: 9.053e-02]hash_cache_v1:  81%|########  | 2422/3000 [2:07:30<20:35,  2.14s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  81%|########  | 2422/3000 [2:07:30<20:35,  2.14s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  81%|########  | 2423/3000 [2:07:30<22:23,  2.33s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  81%|########  | 2423/3000 [2:07:30<22:23,  2.33s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  81%|########  | 2423/3000 [2:07:35<22:23,  2.33s/it, lr: 1.0e-04 loss: 5.338e-02]hash_cache_v1:  81%|########  | 2423/3000 [2:07:35<22:23,  2.33s/it, lr: 1.0e-04 loss: 5.338e-02]hash_cache_v1:  81%|########  | 2424/3000 [2:07:35<27:35,  2.87s/it, lr: 1.0e-04 loss: 5.338e-02]hash_cache_v1:  81%|########  | 2424/3000 [2:07:35<27:35,  2.87s/it, lr: 1.0e-04 loss: 5.338e-02]hash_cache_v1:  81%|########  | 2424/3000 [2:07:39<27:35,  2.87s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  81%|########  | 2424/3000 [2:07:39<27:35,  2.87s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  81%|########  | 2425/3000 [2:07:39<32:01,  3.34s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  81%|########  | 2425/3000 [2:07:39<32:01,  3.34s/it, lr: 1.0e-04 loss: 1.127e-01]hash_cache_v1:  81%|########  | 2425/3000 [2:07:43<32:01,  3.34s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  81%|########  | 2425/3000 [2:07:43<32:01,  3.34s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  81%|########  | 2426/3000 [2:07:43<34:34,  3.61s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  81%|########  | 2426/3000 [2:07:43<34:34,  3.61s/it, lr: 1.0e-04 loss: 1.214e-01]hash_cache_v1:  81%|########  | 2426/3000 [2:07:48<34:34,  3.61s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  81%|########  | 2426/3000 [2:07:48<34:34,  3.61s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  81%|########  | 2427/3000 [2:07:48<36:27,  3.82s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  81%|########  | 2427/3000 [2:07:48<36:27,  3.82s/it, lr: 1.0e-04 loss: 6.989e-02]hash_cache_v1:  81%|########  | 2427/3000 [2:07:51<36:27,  3.82s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  81%|########  | 2427/3000 [2:07:51<36:27,  3.82s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  81%|########  | 2428/3000 [2:07:51<34:14,  3.59s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  81%|########  | 2428/3000 [2:07:51<34:14,  3.59s/it, lr: 1.0e-04 loss: 1.412e-01]hash_cache_v1:  81%|########  | 2428/3000 [2:07:55<34:14,  3.59s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  81%|########  | 2428/3000 [2:07:55<34:14,  3.59s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  81%|########  | 2429/3000 [2:07:55<35:53,  3.77s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  81%|########  | 2429/3000 [2:07:55<35:53,  3.77s/it, lr: 1.0e-04 loss: 1.632e-01]hash_cache_v1:  81%|########  | 2429/3000 [2:08:00<35:53,  3.77s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  81%|########  | 2429/3000 [2:08:00<35:53,  3.77s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  81%|########1 | 2430/3000 [2:08:02<35:50,  3.77s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  81%|########1 | 2430/3000 [2:08:02<35:50,  3.77s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  81%|########1 | 2431/3000 [2:08:02<25:34,  2.70s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  81%|########1 | 2431/3000 [2:08:02<25:34,  2.70s/it, lr: 1.0e-04 loss: 1.092e-01]hash_cache_v1:  81%|########1 | 2431/3000 [2:08:05<25:34,  2.70s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  81%|########1 | 2431/3000 [2:08:05<25:34,  2.70s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  81%|########1 | 2432/3000 [2:08:05<25:01,  2.64s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  81%|########1 | 2432/3000 [2:08:05<25:01,  2.64s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  81%|########1 | 2432/3000 [2:08:09<25:01,  2.64s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  81%|########1 | 2432/3000 [2:08:09<25:01,  2.64s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  81%|########1 | 2433/3000 [2:08:09<28:58,  3.07s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  81%|########1 | 2433/3000 [2:08:09<28:58,  3.07s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  81%|########1 | 2433/3000 [2:08:13<28:58,  3.07s/it, lr: 1.0e-04 loss: 4.602e-02]hash_cache_v1:  81%|########1 | 2433/3000 [2:08:13<28:58,  3.07s/it, lr: 1.0e-04 loss: 4.602e-02]hash_cache_v1:  81%|########1 | 2434/3000 [2:08:13<32:07,  3.41s/it, lr: 1.0e-04 loss: 4.602e-02]hash_cache_v1:  81%|########1 | 2434/3000 [2:08:13<32:07,  3.41s/it, lr: 1.0e-04 loss: 4.602e-02]hash_cache_v1:  81%|########1 | 2434/3000 [2:08:16<32:07,  3.41s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  81%|########1 | 2434/3000 [2:08:16<32:07,  3.41s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  81%|########1 | 2435/3000 [2:08:16<28:34,  3.03s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  81%|########1 | 2435/3000 [2:08:16<28:34,  3.03s/it, lr: 1.0e-04 loss: 1.317e-01]hash_cache_v1:  81%|########1 | 2435/3000 [2:08:19<28:34,  3.03s/it, lr: 1.0e-04 loss: 3.318e-02]hash_cache_v1:  81%|########1 | 2435/3000 [2:08:19<28:34,  3.03s/it, lr: 1.0e-04 loss: 3.318e-02]hash_cache_v1:  81%|########1 | 2436/3000 [2:08:19<28:35,  3.04s/it, lr: 1.0e-04 loss: 3.318e-02]hash_cache_v1:  81%|########1 | 2436/3000 [2:08:19<28:35,  3.04s/it, lr: 1.0e-04 loss: 3.318e-02]hash_cache_v1:  81%|########1 | 2436/3000 [2:08:21<28:35,  3.04s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  81%|########1 | 2436/3000 [2:08:21<28:35,  3.04s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  81%|########1 | 2437/3000 [2:08:21<28:03,  2.99s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  81%|########1 | 2437/3000 [2:08:21<28:03,  2.99s/it, lr: 1.0e-04 loss: 1.908e-01]hash_cache_v1:  81%|########1 | 2437/3000 [2:08:26<28:03,  2.99s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  81%|########1 | 2437/3000 [2:08:26<28:03,  2.99s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  81%|########1 | 2438/3000 [2:08:26<31:32,  3.37s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  81%|########1 | 2438/3000 [2:08:26<31:32,  3.37s/it, lr: 1.0e-04 loss: 1.299e-01]hash_cache_v1:  81%|########1 | 2438/3000 [2:08:30<31:32,  3.37s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  81%|########1 | 2438/3000 [2:08:30<31:32,  3.37s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  81%|########1 | 2439/3000 [2:08:30<34:34,  3.70s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  81%|########1 | 2439/3000 [2:08:30<34:34,  3.70s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  81%|########1 | 2439/3000 [2:08:32<34:34,  3.70s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  81%|########1 | 2439/3000 [2:08:32<34:34,  3.70s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  81%|########1 | 2440/3000 [2:08:35<34:30,  3.70s/it, lr: 1.0e-04 loss: 9.539e-02]hash_cache_v1:  81%|########1 | 2440/3000 [2:08:35<34:30,  3.70s/it, lr: 1.0e-04 loss: 9.539e-02]hash_cache_v1:  81%|########1 | 2441/3000 [2:08:35<24:48,  2.66s/it, lr: 1.0e-04 loss: 9.539e-02]hash_cache_v1:  81%|########1 | 2441/3000 [2:08:35<24:48,  2.66s/it, lr: 1.0e-04 loss: 9.539e-02]hash_cache_v1:  81%|########1 | 2441/3000 [2:08:40<24:48,  2.66s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  81%|########1 | 2441/3000 [2:08:40<24:48,  2.66s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  81%|########1 | 2442/3000 [2:08:40<28:35,  3.07s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  81%|########1 | 2442/3000 [2:08:40<28:35,  3.07s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  81%|########1 | 2442/3000 [2:08:43<28:35,  3.07s/it, lr: 1.0e-04 loss: 7.864e-03]hash_cache_v1:  81%|########1 | 2442/3000 [2:08:43<28:35,  3.07s/it, lr: 1.0e-04 loss: 7.864e-03]hash_cache_v1:  81%|########1 | 2443/3000 [2:08:43<28:30,  3.07s/it, lr: 1.0e-04 loss: 7.864e-03]hash_cache_v1:  81%|########1 | 2443/3000 [2:08:43<28:30,  3.07s/it, lr: 1.0e-04 loss: 7.864e-03]hash_cache_v1:  81%|########1 | 2443/3000 [2:08:45<28:30,  3.07s/it, lr: 1.0e-04 loss: 7.765e-02]hash_cache_v1:  81%|########1 | 2443/3000 [2:08:45<28:30,  3.07s/it, lr: 1.0e-04 loss: 7.765e-02]hash_cache_v1:  81%|########1 | 2444/3000 [2:08:45<25:54,  2.80s/it, lr: 1.0e-04 loss: 7.765e-02]hash_cache_v1:  81%|########1 | 2444/3000 [2:08:45<25:54,  2.80s/it, lr: 1.0e-04 loss: 7.765e-02]hash_cache_v1:  81%|########1 | 2444/3000 [2:08:48<25:54,  2.80s/it, lr: 1.0e-04 loss: 6.515e-02]hash_cache_v1:  81%|########1 | 2444/3000 [2:08:48<25:54,  2.80s/it, lr: 1.0e-04 loss: 6.515e-02]hash_cache_v1:  82%|########1 | 2445/3000 [2:08:48<26:05,  2.82s/it, lr: 1.0e-04 loss: 6.515e-02]hash_cache_v1:  82%|########1 | 2445/3000 [2:08:48<26:05,  2.82s/it, lr: 1.0e-04 loss: 6.515e-02]hash_cache_v1:  82%|########1 | 2445/3000 [2:08:52<26:05,  2.82s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  82%|########1 | 2445/3000 [2:08:52<26:05,  2.82s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  82%|########1 | 2446/3000 [2:08:52<29:58,  3.25s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  82%|########1 | 2446/3000 [2:08:52<29:58,  3.25s/it, lr: 1.0e-04 loss: 1.461e-01]hash_cache_v1:  82%|########1 | 2446/3000 [2:08:54<29:58,  3.25s/it, lr: 1.0e-04 loss: 8.026e-02]hash_cache_v1:  82%|########1 | 2446/3000 [2:08:54<29:58,  3.25s/it, lr: 1.0e-04 loss: 8.026e-02]hash_cache_v1:  82%|########1 | 2447/3000 [2:08:54<27:31,  2.99s/it, lr: 1.0e-04 loss: 8.026e-02]hash_cache_v1:  82%|########1 | 2447/3000 [2:08:54<27:31,  2.99s/it, lr: 1.0e-04 loss: 8.026e-02]hash_cache_v1:  82%|########1 | 2447/3000 [2:08:59<27:31,  2.99s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  82%|########1 | 2447/3000 [2:08:59<27:31,  2.99s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  82%|########1 | 2448/3000 [2:08:59<31:04,  3.38s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  82%|########1 | 2448/3000 [2:08:59<31:04,  3.38s/it, lr: 1.0e-04 loss: 1.288e-01]hash_cache_v1:  82%|########1 | 2448/3000 [2:09:01<31:04,  3.38s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  82%|########1 | 2448/3000 [2:09:01<31:04,  3.38s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  82%|########1 | 2449/3000 [2:09:01<29:40,  3.23s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  82%|########1 | 2449/3000 [2:09:01<29:40,  3.23s/it, lr: 1.0e-04 loss: 1.359e-01]hash_cache_v1:  82%|########1 | 2449/3000 [2:09:04<29:40,  3.23s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  82%|########1 | 2449/3000 [2:09:04<29:40,  3.23s/it, lr: 1.0e-04 loss: 1.837e-01]hash_cache_v1:  82%|########1 | 2450/3000 [2:09:06<29:37,  3.23s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  82%|########1 | 2450/3000 [2:09:06<29:37,  3.23s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  82%|########1 | 2451/3000 [2:09:06<20:28,  2.24s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  82%|########1 | 2451/3000 [2:09:06<20:28,  2.24s/it, lr: 1.0e-04 loss: 1.758e-01]hash_cache_v1:  82%|########1 | 2451/3000 [2:09:08<20:28,  2.24s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:  82%|########1 | 2451/3000 [2:09:08<20:28,  2.24s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:  82%|########1 | 2452/3000 [2:09:08<20:05,  2.20s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:  82%|########1 | 2452/3000 [2:09:08<20:05,  2.20s/it, lr: 1.0e-04 loss: 1.719e-01]hash_cache_v1:  82%|########1 | 2452/3000 [2:09:10<20:05,  2.20s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  82%|########1 | 2452/3000 [2:09:10<20:05,  2.20s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  82%|########1 | 2453/3000 [2:09:10<19:46,  2.17s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  82%|########1 | 2453/3000 [2:09:10<19:46,  2.17s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  82%|########1 | 2453/3000 [2:09:12<19:46,  2.17s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  82%|########1 | 2453/3000 [2:09:12<19:46,  2.17s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  82%|########1 | 2454/3000 [2:09:12<20:10,  2.22s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  82%|########1 | 2454/3000 [2:09:12<20:10,  2.22s/it, lr: 1.0e-04 loss: 1.213e-01]hash_cache_v1:  82%|########1 | 2454/3000 [2:09:17<20:10,  2.22s/it, lr: 1.0e-04 loss: 2.462e-03]hash_cache_v1:  82%|########1 | 2454/3000 [2:09:17<20:10,  2.22s/it, lr: 1.0e-04 loss: 2.462e-03]hash_cache_v1:  82%|########1 | 2455/3000 [2:09:17<25:21,  2.79s/it, lr: 1.0e-04 loss: 2.462e-03]hash_cache_v1:  82%|########1 | 2455/3000 [2:09:17<25:21,  2.79s/it, lr: 1.0e-04 loss: 2.462e-03]hash_cache_v1:  82%|########1 | 2455/3000 [2:09:19<25:21,  2.79s/it, lr: 1.0e-04 loss: 2.644e-02]hash_cache_v1:  82%|########1 | 2455/3000 [2:09:19<25:21,  2.79s/it, lr: 1.0e-04 loss: 2.644e-02]hash_cache_v1:  82%|########1 | 2456/3000 [2:09:19<23:28,  2.59s/it, lr: 1.0e-04 loss: 2.644e-02]hash_cache_v1:  82%|########1 | 2456/3000 [2:09:19<23:28,  2.59s/it, lr: 1.0e-04 loss: 2.644e-02]hash_cache_v1:  82%|########1 | 2456/3000 [2:09:23<23:28,  2.59s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  82%|########1 | 2456/3000 [2:09:23<23:28,  2.59s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  82%|########1 | 2457/3000 [2:09:23<27:57,  3.09s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  82%|########1 | 2457/3000 [2:09:23<27:57,  3.09s/it, lr: 1.0e-04 loss: 1.808e-01]hash_cache_v1:  82%|########1 | 2457/3000 [2:09:26<27:57,  3.09s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  82%|########1 | 2457/3000 [2:09:26<27:57,  3.09s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  82%|########1 | 2458/3000 [2:09:26<26:28,  2.93s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  82%|########1 | 2458/3000 [2:09:26<26:28,  2.93s/it, lr: 1.0e-04 loss: 1.514e-01]hash_cache_v1:  82%|########1 | 2458/3000 [2:09:30<26:28,  2.93s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  82%|########1 | 2458/3000 [2:09:30<26:28,  2.93s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  82%|########1 | 2459/3000 [2:09:30<30:05,  3.34s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  82%|########1 | 2459/3000 [2:09:30<30:05,  3.34s/it, lr: 1.0e-04 loss: 7.932e-02]hash_cache_v1:  82%|########1 | 2459/3000 [2:09:33<30:05,  3.34s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  82%|########1 | 2459/3000 [2:09:33<30:05,  3.34s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  82%|########2 | 2460/3000 [2:09:37<30:01,  3.34s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  82%|########2 | 2460/3000 [2:09:37<30:01,  3.34s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  82%|########2 | 2461/3000 [2:09:37<25:30,  2.84s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  82%|########2 | 2461/3000 [2:09:37<25:30,  2.84s/it, lr: 1.0e-04 loss: 1.318e-01]hash_cache_v1:  82%|########2 | 2461/3000 [2:09:40<25:30,  2.84s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  82%|########2 | 2461/3000 [2:09:40<25:30,  2.84s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  82%|########2 | 2462/3000 [2:09:40<25:30,  2.85s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  82%|########2 | 2462/3000 [2:09:40<25:30,  2.85s/it, lr: 1.0e-04 loss: 8.197e-02]hash_cache_v1:  82%|########2 | 2462/3000 [2:09:43<25:30,  2.85s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  82%|########2 | 2462/3000 [2:09:43<25:30,  2.85s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  82%|########2 | 2463/3000 [2:09:43<25:32,  2.85s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  82%|########2 | 2463/3000 [2:09:43<25:32,  2.85s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  82%|########2 | 2463/3000 [2:09:46<25:32,  2.85s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  82%|########2 | 2463/3000 [2:09:46<25:32,  2.85s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  82%|########2 | 2464/3000 [2:09:46<25:33,  2.86s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  82%|########2 | 2464/3000 [2:09:46<25:33,  2.86s/it, lr: 1.0e-04 loss: 1.703e-01]hash_cache_v1:  82%|########2 | 2464/3000 [2:09:49<25:33,  2.86s/it, lr: 1.0e-04 loss: 7.270e-02]hash_cache_v1:  82%|########2 | 2464/3000 [2:09:49<25:33,  2.86s/it, lr: 1.0e-04 loss: 7.270e-02]hash_cache_v1:  82%|########2 | 2465/3000 [2:09:49<25:57,  2.91s/it, lr: 1.0e-04 loss: 7.270e-02]hash_cache_v1:  82%|########2 | 2465/3000 [2:09:49<25:57,  2.91s/it, lr: 1.0e-04 loss: 7.270e-02]hash_cache_v1:  82%|########2 | 2465/3000 [2:09:52<25:57,  2.91s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2465/3000 [2:09:52<25:57,  2.91s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2466/3000 [2:09:52<25:49,  2.90s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2466/3000 [2:09:52<25:49,  2.90s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2466/3000 [2:09:55<25:49,  2.90s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  82%|########2 | 2466/3000 [2:09:55<25:49,  2.90s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  82%|########2 | 2467/3000 [2:09:55<25:41,  2.89s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  82%|########2 | 2467/3000 [2:09:55<25:41,  2.89s/it, lr: 1.0e-04 loss: 1.637e-01]hash_cache_v1:  82%|########2 | 2467/3000 [2:09:57<25:41,  2.89s/it, lr: 1.0e-04 loss: 9.327e-02]hash_cache_v1:  82%|########2 | 2467/3000 [2:09:57<25:41,  2.89s/it, lr: 1.0e-04 loss: 9.327e-02]hash_cache_v1:  82%|########2 | 2468/3000 [2:09:57<23:38,  2.67s/it, lr: 1.0e-04 loss: 9.327e-02]hash_cache_v1:  82%|########2 | 2468/3000 [2:09:57<23:38,  2.67s/it, lr: 1.0e-04 loss: 9.327e-02]hash_cache_v1:  82%|########2 | 2468/3000 [2:09:59<23:38,  2.67s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2468/3000 [2:09:59<23:38,  2.67s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2469/3000 [2:09:59<22:55,  2.59s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2469/3000 [2:09:59<22:55,  2.59s/it, lr: 1.0e-04 loss: 1.410e-01]hash_cache_v1:  82%|########2 | 2469/3000 [2:10:02<22:55,  2.59s/it, lr: 1.0e-04 loss: 1.648e-01]hash_cache_v1:  82%|########2 | 2469/3000 [2:10:02<22:55,  2.59s/it, lr: 1.0e-04 loss: 1.648e-01]hash_cache_v1:  82%|########2 | 2470/3000 [2:10:04<22:52,  2.59s/it, lr: 1.0e-04 loss: 1.458e-01]hash_cache_v1:  82%|########2 | 2470/3000 [2:10:04<22:52,  2.59s/it, lr: 1.0e-04 loss: 1.458e-01]hash_cache_v1:  82%|########2 | 2471/3000 [2:10:04<16:39,  1.89s/it, lr: 1.0e-04 loss: 1.458e-01]hash_cache_v1:  82%|########2 | 2471/3000 [2:10:04<16:39,  1.89s/it, lr: 1.0e-04 loss: 1.458e-01]hash_cache_v1:  82%|########2 | 2471/3000 [2:10:06<16:39,  1.89s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  82%|########2 | 2471/3000 [2:10:06<16:39,  1.89s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  82%|########2 | 2472/3000 [2:10:06<17:44,  2.02s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  82%|########2 | 2472/3000 [2:10:06<17:44,  2.02s/it, lr: 1.0e-04 loss: 1.348e-01]hash_cache_v1:  82%|########2 | 2472/3000 [2:10:09<17:44,  2.02s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  82%|########2 | 2472/3000 [2:10:09<17:44,  2.02s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  82%|########2 | 2473/3000 [2:10:09<17:54,  2.04s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  82%|########2 | 2473/3000 [2:10:09<17:54,  2.04s/it, lr: 1.0e-04 loss: 1.741e-01]hash_cache_v1:  82%|########2 | 2473/3000 [2:10:11<17:54,  2.04s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  82%|########2 | 2473/3000 [2:10:11<17:54,  2.04s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  82%|########2 | 2474/3000 [2:10:11<19:35,  2.24s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  82%|########2 | 2474/3000 [2:10:11<19:35,  2.24s/it, lr: 1.0e-04 loss: 1.575e-01]hash_cache_v1:  82%|########2 | 2474/3000 [2:10:16<19:35,  2.24s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  82%|########2 | 2474/3000 [2:10:16<19:35,  2.24s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  82%|########2 | 2475/3000 [2:10:16<24:41,  2.82s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  82%|########2 | 2475/3000 [2:10:16<24:41,  2.82s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  82%|########2 | 2475/3000 [2:10:20<24:41,  2.82s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  82%|########2 | 2475/3000 [2:10:20<24:41,  2.82s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  83%|########2 | 2476/3000 [2:10:20<28:46,  3.29s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  83%|########2 | 2476/3000 [2:10:20<28:46,  3.29s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  83%|########2 | 2476/3000 [2:10:23<28:46,  3.29s/it, lr: 1.0e-04 loss: 8.724e-02]hash_cache_v1:  83%|########2 | 2476/3000 [2:10:23<28:46,  3.29s/it, lr: 1.0e-04 loss: 8.724e-02]hash_cache_v1:  83%|########2 | 2477/3000 [2:10:23<27:34,  3.16s/it, lr: 1.0e-04 loss: 8.724e-02]hash_cache_v1:  83%|########2 | 2477/3000 [2:10:23<27:34,  3.16s/it, lr: 1.0e-04 loss: 8.724e-02]hash_cache_v1:  83%|########2 | 2477/3000 [2:10:25<27:34,  3.16s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  83%|########2 | 2477/3000 [2:10:25<27:34,  3.16s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  83%|########2 | 2478/3000 [2:10:25<24:46,  2.85s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  83%|########2 | 2478/3000 [2:10:25<24:46,  2.85s/it, lr: 1.0e-04 loss: 1.383e-01]hash_cache_v1:  83%|########2 | 2478/3000 [2:10:29<24:46,  2.85s/it, lr: 1.0e-04 loss: 7.981e-02]hash_cache_v1:  83%|########2 | 2478/3000 [2:10:29<24:46,  2.85s/it, lr: 1.0e-04 loss: 7.981e-02]hash_cache_v1:  83%|########2 | 2479/3000 [2:10:29<28:37,  3.30s/it, lr: 1.0e-04 loss: 7.981e-02]hash_cache_v1:  83%|########2 | 2479/3000 [2:10:29<28:37,  3.30s/it, lr: 1.0e-04 loss: 7.981e-02]hash_cache_v1:  83%|########2 | 2479/3000 [2:10:33<28:37,  3.30s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  83%|########2 | 2479/3000 [2:10:33<28:37,  3.30s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  83%|########2 | 2480/3000 [2:10:35<28:33,  3.30s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  83%|########2 | 2480/3000 [2:10:35<28:33,  3.30s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  83%|########2 | 2481/3000 [2:10:35<19:37,  2.27s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  83%|########2 | 2481/3000 [2:10:35<19:37,  2.27s/it, lr: 1.0e-04 loss: 8.379e-02]hash_cache_v1:  83%|########2 | 2481/3000 [2:10:38<19:37,  2.27s/it, lr: 1.0e-04 loss: 4.095e-02]hash_cache_v1:  83%|########2 | 2481/3000 [2:10:38<19:37,  2.27s/it, lr: 1.0e-04 loss: 4.095e-02]hash_cache_v1:  83%|########2 | 2482/3000 [2:10:38<20:48,  2.41s/it, lr: 1.0e-04 loss: 4.095e-02]hash_cache_v1:  83%|########2 | 2482/3000 [2:10:38<20:48,  2.41s/it, lr: 1.0e-04 loss: 4.095e-02]hash_cache_v1:  83%|########2 | 2482/3000 [2:10:42<20:48,  2.41s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########2 | 2482/3000 [2:10:42<20:48,  2.41s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########2 | 2483/3000 [2:10:42<25:25,  2.95s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########2 | 2483/3000 [2:10:42<25:25,  2.95s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########2 | 2483/3000 [2:10:45<25:25,  2.95s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  83%|########2 | 2483/3000 [2:10:45<25:25,  2.95s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  83%|########2 | 2484/3000 [2:10:45<24:54,  2.90s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  83%|########2 | 2484/3000 [2:10:45<24:54,  2.90s/it, lr: 1.0e-04 loss: 1.380e-01]hash_cache_v1:  83%|########2 | 2484/3000 [2:10:47<24:54,  2.90s/it, lr: 1.0e-04 loss: 1.540e-01]hash_cache_v1:  83%|########2 | 2484/3000 [2:10:47<24:54,  2.90s/it, lr: 1.0e-04 loss: 1.540e-01]hash_cache_v1:  83%|########2 | 2485/3000 [2:10:47<23:00,  2.68s/it, lr: 1.0e-04 loss: 1.540e-01]hash_cache_v1:  83%|########2 | 2485/3000 [2:10:47<23:00,  2.68s/it, lr: 1.0e-04 loss: 1.540e-01]hash_cache_v1:  83%|########2 | 2485/3000 [2:10:50<23:00,  2.68s/it, lr: 1.0e-04 loss: 7.762e-02]hash_cache_v1:  83%|########2 | 2485/3000 [2:10:50<23:00,  2.68s/it, lr: 1.0e-04 loss: 7.762e-02]hash_cache_v1:  83%|########2 | 2486/3000 [2:10:50<23:28,  2.74s/it, lr: 1.0e-04 loss: 7.762e-02]hash_cache_v1:  83%|########2 | 2486/3000 [2:10:50<23:28,  2.74s/it, lr: 1.0e-04 loss: 7.762e-02]hash_cache_v1:  83%|########2 | 2486/3000 [2:10:53<23:28,  2.74s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  83%|########2 | 2486/3000 [2:10:53<23:28,  2.74s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  83%|########2 | 2487/3000 [2:10:53<24:14,  2.84s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  83%|########2 | 2487/3000 [2:10:53<24:14,  2.84s/it, lr: 1.0e-04 loss: 1.026e-01]hash_cache_v1:  83%|########2 | 2487/3000 [2:10:55<24:14,  2.84s/it, lr: 1.0e-04 loss: 8.714e-02]hash_cache_v1:  83%|########2 | 2487/3000 [2:10:55<24:14,  2.84s/it, lr: 1.0e-04 loss: 8.714e-02]hash_cache_v1:  83%|########2 | 2488/3000 [2:10:55<22:22,  2.62s/it, lr: 1.0e-04 loss: 8.714e-02]hash_cache_v1:  83%|########2 | 2488/3000 [2:10:55<22:22,  2.62s/it, lr: 1.0e-04 loss: 8.714e-02]hash_cache_v1:  83%|########2 | 2488/3000 [2:10:59<22:22,  2.62s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  83%|########2 | 2488/3000 [2:10:59<22:22,  2.62s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  83%|########2 | 2489/3000 [2:10:59<26:29,  3.11s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  83%|########2 | 2489/3000 [2:10:59<26:29,  3.11s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  83%|########2 | 2489/3000 [2:11:01<26:29,  3.11s/it, lr: 1.0e-04 loss: 1.683e-01]hash_cache_v1:  83%|########2 | 2489/3000 [2:11:01<26:29,  3.11s/it, lr: 1.0e-04 loss: 1.683e-01]hash_cache_v1:  83%|########2 | 2490/3000 [2:11:06<26:26,  3.11s/it, lr: 1.0e-04 loss: 3.308e-02]hash_cache_v1:  83%|########2 | 2490/3000 [2:11:06<26:26,  3.11s/it, lr: 1.0e-04 loss: 3.308e-02]hash_cache_v1:  83%|########3 | 2491/3000 [2:11:06<23:04,  2.72s/it, lr: 1.0e-04 loss: 3.308e-02]hash_cache_v1:  83%|########3 | 2491/3000 [2:11:06<23:04,  2.72s/it, lr: 1.0e-04 loss: 3.308e-02]hash_cache_v1:  83%|########3 | 2491/3000 [2:11:08<23:04,  2.72s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  83%|########3 | 2491/3000 [2:11:08<23:04,  2.72s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  83%|########3 | 2492/3000 [2:11:08<21:45,  2.57s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  83%|########3 | 2492/3000 [2:11:08<21:45,  2.57s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  83%|########3 | 2492/3000 [2:11:12<21:45,  2.57s/it, lr: 1.0e-04 loss: 3.173e-02]hash_cache_v1:  83%|########3 | 2492/3000 [2:11:12<21:45,  2.57s/it, lr: 1.0e-04 loss: 3.173e-02]hash_cache_v1:  83%|########3 | 2493/3000 [2:11:12<25:34,  3.03s/it, lr: 1.0e-04 loss: 3.173e-02]hash_cache_v1:  83%|########3 | 2493/3000 [2:11:12<25:34,  3.03s/it, lr: 1.0e-04 loss: 3.173e-02]hash_cache_v1:  83%|########3 | 2493/3000 [2:11:15<25:34,  3.03s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  83%|########3 | 2493/3000 [2:11:15<25:34,  3.03s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  83%|########3 | 2494/3000 [2:11:15<24:09,  2.86s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  83%|########3 | 2494/3000 [2:11:15<24:09,  2.86s/it, lr: 1.0e-04 loss: 1.341e-01]hash_cache_v1:  83%|########3 | 2494/3000 [2:11:18<24:09,  2.86s/it, lr: 1.0e-04 loss: 6.726e-02]hash_cache_v1:  83%|########3 | 2494/3000 [2:11:18<24:09,  2.86s/it, lr: 1.0e-04 loss: 6.726e-02]hash_cache_v1:  83%|########3 | 2495/3000 [2:11:18<24:09,  2.87s/it, lr: 1.0e-04 loss: 6.726e-02]hash_cache_v1:  83%|########3 | 2495/3000 [2:11:18<24:09,  2.87s/it, lr: 1.0e-04 loss: 6.726e-02]hash_cache_v1:  83%|########3 | 2495/3000 [2:11:20<24:09,  2.87s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  83%|########3 | 2495/3000 [2:11:20<24:09,  2.87s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  83%|########3 | 2496/3000 [2:11:20<24:07,  2.87s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  83%|########3 | 2496/3000 [2:11:20<24:07,  2.87s/it, lr: 1.0e-04 loss: 1.628e-01]hash_cache_v1:  83%|########3 | 2496/3000 [2:11:25<24:07,  2.87s/it, lr: 1.0e-04 loss: 2.361e-02]hash_cache_v1:  83%|########3 | 2496/3000 [2:11:25<24:07,  2.87s/it, lr: 1.0e-04 loss: 2.361e-02]hash_cache_v1:  83%|########3 | 2497/3000 [2:11:25<27:35,  3.29s/it, lr: 1.0e-04 loss: 2.361e-02]hash_cache_v1:  83%|########3 | 2497/3000 [2:11:25<27:35,  3.29s/it, lr: 1.0e-04 loss: 2.361e-02]hash_cache_v1:  83%|########3 | 2497/3000 [2:11:27<27:35,  3.29s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  83%|########3 | 2497/3000 [2:11:27<27:35,  3.29s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  83%|########3 | 2498/3000 [2:11:27<25:23,  3.03s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  83%|########3 | 2498/3000 [2:11:27<25:23,  3.03s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  83%|########3 | 2498/3000 [2:11:29<25:23,  3.03s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  83%|########3 | 2498/3000 [2:11:29<25:23,  3.03s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  83%|########3 | 2499/3000 [2:11:29<23:02,  2.76s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  83%|########3 | 2499/3000 [2:11:29<23:02,  2.76s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  83%|########3 | 2499/3000 [2:11:31<23:02,  2.76s/it, lr: 1.0e-04 loss: 2.419e-02]hash_cache_v1:  83%|########3 | 2499/3000 [2:11:31<23:02,  2.76s/it, lr: 1.0e-04 loss: 2.419e-02]
+Saving at step 2500
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000002500.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001500.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.15s/it]Generating Images:  25%|##5       | 1/4 [01:12<03:36, 72.15s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.36s/it]Generating Images:  50%|#####     | 2/4 [02:24<02:24, 72.36s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.37s/it]Generating Images:  75%|#######5  | 3/4 [03:37<01:12, 72.37s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:50<00:00, 72.67s/it]Generating Images: 100%|##########| 4/4 [04:50<00:00, 72.67s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  83%|########3 | 2500/3000 [2:11:35<23:00,  2.76s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########3 | 2500/3000 [2:11:35<23:00,  2.76s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########3 | 2501/3000 [2:11:35<18:16,  2.20s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########3 | 2501/3000 [2:11:35<18:16,  2.20s/it, lr: 1.0e-04 loss: 1.350e-01]hash_cache_v1:  83%|########3 | 2501/3000 [2:11:37<18:16,  2.20s/it, lr: 1.0e-04 loss: 9.010e-02]hash_cache_v1:  83%|########3 | 2501/3000 [2:11:37<18:16,  2.20s/it, lr: 1.0e-04 loss: 9.010e-02]hash_cache_v1:  83%|########3 | 2502/3000 [2:11:37<19:44,  2.38s/it, lr: 1.0e-04 loss: 9.010e-02]hash_cache_v1:  83%|########3 | 2502/3000 [2:11:37<19:44,  2.38s/it, lr: 1.0e-04 loss: 9.010e-02]hash_cache_v1:  83%|########3 | 2502/3000 [2:11:40<19:44,  2.38s/it, lr: 1.0e-04 loss: 8.469e-02]hash_cache_v1:  83%|########3 | 2502/3000 [2:11:40<19:44,  2.38s/it, lr: 1.0e-04 loss: 8.469e-02]hash_cache_v1:  83%|########3 | 2503/3000 [2:11:40<20:57,  2.53s/it, lr: 1.0e-04 loss: 8.469e-02]hash_cache_v1:  83%|########3 | 2503/3000 [2:11:40<20:57,  2.53s/it, lr: 1.0e-04 loss: 8.469e-02]hash_cache_v1:  83%|########3 | 2503/3000 [2:11:45<20:57,  2.53s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  83%|########3 | 2503/3000 [2:11:45<20:57,  2.53s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  83%|########3 | 2504/3000 [2:11:45<25:39,  3.10s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  83%|########3 | 2504/3000 [2:11:45<25:39,  3.10s/it, lr: 1.0e-04 loss: 1.108e-01]hash_cache_v1:  83%|########3 | 2504/3000 [2:11:48<25:39,  3.10s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  83%|########3 | 2504/3000 [2:11:48<25:39,  3.10s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  84%|########3 | 2505/3000 [2:11:48<25:21,  3.07s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  84%|########3 | 2505/3000 [2:11:48<25:21,  3.07s/it, lr: 1.0e-04 loss: 1.787e-01]hash_cache_v1:  84%|########3 | 2505/3000 [2:11:53<25:21,  3.07s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  84%|########3 | 2505/3000 [2:11:53<25:21,  3.07s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  84%|########3 | 2506/3000 [2:11:53<28:42,  3.49s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  84%|########3 | 2506/3000 [2:11:53<28:42,  3.49s/it, lr: 1.0e-04 loss: 1.789e-01]hash_cache_v1:  84%|########3 | 2506/3000 [2:11:57<28:42,  3.49s/it, lr: 1.0e-04 loss: 8.844e-02]hash_cache_v1:  84%|########3 | 2506/3000 [2:11:57<28:42,  3.49s/it, lr: 1.0e-04 loss: 8.844e-02]hash_cache_v1:  84%|########3 | 2507/3000 [2:11:57<30:33,  3.72s/it, lr: 1.0e-04 loss: 8.844e-02]hash_cache_v1:  84%|########3 | 2507/3000 [2:11:57<30:33,  3.72s/it, lr: 1.0e-04 loss: 8.844e-02]hash_cache_v1:  84%|########3 | 2507/3000 [2:12:00<30:33,  3.72s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  84%|########3 | 2507/3000 [2:12:00<30:33,  3.72s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  84%|########3 | 2508/3000 [2:12:00<29:05,  3.55s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  84%|########3 | 2508/3000 [2:12:00<29:05,  3.55s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  84%|########3 | 2508/3000 [2:12:04<29:05,  3.55s/it, lr: 1.0e-04 loss: 4.209e-02]hash_cache_v1:  84%|########3 | 2508/3000 [2:12:04<29:05,  3.55s/it, lr: 1.0e-04 loss: 4.209e-02]hash_cache_v1:  84%|########3 | 2509/3000 [2:12:04<30:51,  3.77s/it, lr: 1.0e-04 loss: 4.209e-02]hash_cache_v1:  84%|########3 | 2509/3000 [2:12:04<30:51,  3.77s/it, lr: 1.0e-04 loss: 4.209e-02]hash_cache_v1:  84%|########3 | 2509/3000 [2:12:09<30:51,  3.77s/it, lr: 1.0e-04 loss: 5.085e-02]hash_cache_v1:  84%|########3 | 2509/3000 [2:12:09<30:51,  3.77s/it, lr: 1.0e-04 loss: 5.085e-02]hash_cache_v1:  84%|########3 | 2510/3000 [2:12:13<30:48,  3.77s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  84%|########3 | 2510/3000 [2:12:13<30:48,  3.77s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  84%|########3 | 2511/3000 [2:12:13<25:07,  3.08s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  84%|########3 | 2511/3000 [2:12:13<25:07,  3.08s/it, lr: 1.0e-04 loss: 1.145e-01]hash_cache_v1:  84%|########3 | 2511/3000 [2:12:16<25:07,  3.08s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  84%|########3 | 2511/3000 [2:12:16<25:07,  3.08s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  84%|########3 | 2512/3000 [2:12:16<24:38,  3.03s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  84%|########3 | 2512/3000 [2:12:16<24:38,  3.03s/it, lr: 1.0e-04 loss: 1.467e-01]hash_cache_v1:  84%|########3 | 2512/3000 [2:12:20<24:38,  3.03s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  84%|########3 | 2512/3000 [2:12:20<24:38,  3.03s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  84%|########3 | 2513/3000 [2:12:20<27:19,  3.37s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  84%|########3 | 2513/3000 [2:12:20<27:19,  3.37s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  84%|########3 | 2513/3000 [2:12:25<27:19,  3.37s/it, lr: 1.0e-04 loss: 1.403e-01]hash_cache_v1:  84%|########3 | 2513/3000 [2:12:25<27:19,  3.37s/it, lr: 1.0e-04 loss: 1.403e-01]hash_cache_v1:  84%|########3 | 2514/3000 [2:12:25<29:19,  3.62s/it, lr: 1.0e-04 loss: 1.403e-01]hash_cache_v1:  84%|########3 | 2514/3000 [2:12:25<29:19,  3.62s/it, lr: 1.0e-04 loss: 1.403e-01]hash_cache_v1:  84%|########3 | 2514/3000 [2:12:27<29:19,  3.62s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  84%|########3 | 2514/3000 [2:12:27<29:19,  3.62s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  84%|########3 | 2515/3000 [2:12:27<26:27,  3.27s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  84%|########3 | 2515/3000 [2:12:27<26:27,  3.27s/it, lr: 1.0e-04 loss: 1.518e-01]hash_cache_v1:  84%|########3 | 2515/3000 [2:12:31<26:27,  3.27s/it, lr: 1.0e-04 loss: 5.927e-02]hash_cache_v1:  84%|########3 | 2515/3000 [2:12:31<26:27,  3.27s/it, lr: 1.0e-04 loss: 5.927e-02]hash_cache_v1:  84%|########3 | 2516/3000 [2:12:31<28:41,  3.56s/it, lr: 1.0e-04 loss: 5.927e-02]hash_cache_v1:  84%|########3 | 2516/3000 [2:12:31<28:41,  3.56s/it, lr: 1.0e-04 loss: 5.927e-02]hash_cache_v1:  84%|########3 | 2516/3000 [2:12:34<28:41,  3.56s/it, lr: 1.0e-04 loss: 2.106e-02]hash_cache_v1:  84%|########3 | 2516/3000 [2:12:34<28:41,  3.56s/it, lr: 1.0e-04 loss: 2.106e-02]hash_cache_v1:  84%|########3 | 2517/3000 [2:12:34<27:01,  3.36s/it, lr: 1.0e-04 loss: 2.106e-02]hash_cache_v1:  84%|########3 | 2517/3000 [2:12:34<27:01,  3.36s/it, lr: 1.0e-04 loss: 2.106e-02]hash_cache_v1:  84%|########3 | 2517/3000 [2:12:39<27:01,  3.36s/it, lr: 1.0e-04 loss: 5.021e-02]hash_cache_v1:  84%|########3 | 2517/3000 [2:12:39<27:01,  3.36s/it, lr: 1.0e-04 loss: 5.021e-02]hash_cache_v1:  84%|########3 | 2518/3000 [2:12:39<29:45,  3.70s/it, lr: 1.0e-04 loss: 5.021e-02]hash_cache_v1:  84%|########3 | 2518/3000 [2:12:39<29:45,  3.70s/it, lr: 1.0e-04 loss: 5.021e-02]hash_cache_v1:  84%|########3 | 2518/3000 [2:12:41<29:45,  3.70s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  84%|########3 | 2518/3000 [2:12:41<29:45,  3.70s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  84%|########3 | 2519/3000 [2:12:41<27:23,  3.42s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  84%|########3 | 2519/3000 [2:12:41<27:23,  3.42s/it, lr: 1.0e-04 loss: 1.105e-01]hash_cache_v1:  84%|########3 | 2519/3000 [2:12:44<27:23,  3.42s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  84%|########3 | 2519/3000 [2:12:44<27:23,  3.42s/it, lr: 1.0e-04 loss: 1.172e-01]hash_cache_v1:  84%|########4 | 2520/3000 [2:12:48<27:20,  3.42s/it, lr: 1.0e-04 loss: 8.726e-02]hash_cache_v1:  84%|########4 | 2520/3000 [2:12:48<27:20,  3.42s/it, lr: 1.0e-04 loss: 8.726e-02]hash_cache_v1:  84%|########4 | 2521/3000 [2:12:48<22:39,  2.84s/it, lr: 1.0e-04 loss: 8.726e-02]hash_cache_v1:  84%|########4 | 2521/3000 [2:12:48<22:39,  2.84s/it, lr: 1.0e-04 loss: 8.726e-02]hash_cache_v1:  84%|########4 | 2521/3000 [2:12:53<22:39,  2.84s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  84%|########4 | 2521/3000 [2:12:53<22:39,  2.84s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  84%|########4 | 2522/3000 [2:12:53<26:02,  3.27s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  84%|########4 | 2522/3000 [2:12:53<26:02,  3.27s/it, lr: 1.0e-04 loss: 6.442e-02]hash_cache_v1:  84%|########4 | 2522/3000 [2:12:55<26:02,  3.27s/it, lr: 1.0e-04 loss: 1.217e-01]hash_cache_v1:  84%|########4 | 2522/3000 [2:12:55<26:02,  3.27s/it, lr: 1.0e-04 loss: 1.217e-01]hash_cache_v1:  84%|########4 | 2523/3000 [2:12:55<24:07,  3.03s/it, lr: 1.0e-04 loss: 1.217e-01]hash_cache_v1:  84%|########4 | 2523/3000 [2:12:55<24:07,  3.03s/it, lr: 1.0e-04 loss: 1.217e-01]hash_cache_v1:  84%|########4 | 2523/3000 [2:12:59<24:07,  3.03s/it, lr: 1.0e-04 loss: 1.191e-01]hash_cache_v1:  84%|########4 | 2523/3000 [2:12:59<24:07,  3.03s/it, lr: 1.0e-04 loss: 1.191e-01]hash_cache_v1:  84%|########4 | 2524/3000 [2:12:59<26:43,  3.37s/it, lr: 1.0e-04 loss: 1.191e-01]hash_cache_v1:  84%|########4 | 2524/3000 [2:12:59<26:43,  3.37s/it, lr: 1.0e-04 loss: 1.191e-01]hash_cache_v1:  84%|########4 | 2524/3000 [2:13:02<26:43,  3.37s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  84%|########4 | 2524/3000 [2:13:02<26:43,  3.37s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  84%|########4 | 2525/3000 [2:13:02<23:47,  3.01s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  84%|########4 | 2525/3000 [2:13:02<23:47,  3.01s/it, lr: 1.0e-04 loss: 1.763e-01]hash_cache_v1:  84%|########4 | 2525/3000 [2:13:05<23:47,  3.01s/it, lr: 1.0e-04 loss: 6.894e-02]hash_cache_v1:  84%|########4 | 2525/3000 [2:13:05<23:47,  3.01s/it, lr: 1.0e-04 loss: 6.894e-02]hash_cache_v1:  84%|########4 | 2526/3000 [2:13:05<23:47,  3.01s/it, lr: 1.0e-04 loss: 6.894e-02]hash_cache_v1:  84%|########4 | 2526/3000 [2:13:05<23:47,  3.01s/it, lr: 1.0e-04 loss: 6.894e-02]hash_cache_v1:  84%|########4 | 2526/3000 [2:13:09<23:47,  3.01s/it, lr: 1.0e-04 loss: 6.741e-02]hash_cache_v1:  84%|########4 | 2526/3000 [2:13:09<23:47,  3.01s/it, lr: 1.0e-04 loss: 6.741e-02]hash_cache_v1:  84%|########4 | 2527/3000 [2:13:09<26:36,  3.38s/it, lr: 1.0e-04 loss: 6.741e-02]hash_cache_v1:  84%|########4 | 2527/3000 [2:13:09<26:36,  3.38s/it, lr: 1.0e-04 loss: 6.741e-02]hash_cache_v1:  84%|########4 | 2527/3000 [2:13:12<26:36,  3.38s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  84%|########4 | 2527/3000 [2:13:12<26:36,  3.38s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  84%|########4 | 2528/3000 [2:13:12<25:25,  3.23s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  84%|########4 | 2528/3000 [2:13:12<25:25,  3.23s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  84%|########4 | 2528/3000 [2:13:15<25:25,  3.23s/it, lr: 1.0e-04 loss: 8.372e-02]hash_cache_v1:  84%|########4 | 2528/3000 [2:13:15<25:25,  3.23s/it, lr: 1.0e-04 loss: 8.372e-02]hash_cache_v1:  84%|########4 | 2529/3000 [2:13:15<24:41,  3.15s/it, lr: 1.0e-04 loss: 8.372e-02]hash_cache_v1:  84%|########4 | 2529/3000 [2:13:15<24:41,  3.15s/it, lr: 1.0e-04 loss: 8.372e-02]hash_cache_v1:  84%|########4 | 2529/3000 [2:13:17<24:41,  3.15s/it, lr: 1.0e-04 loss: 1.531e-01]hash_cache_v1:  84%|########4 | 2529/3000 [2:13:17<24:41,  3.15s/it, lr: 1.0e-04 loss: 1.531e-01]hash_cache_v1:  84%|########4 | 2530/3000 [2:13:20<24:38,  3.15s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  84%|########4 | 2530/3000 [2:13:20<24:38,  3.15s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  84%|########4 | 2531/3000 [2:13:20<18:25,  2.36s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  84%|########4 | 2531/3000 [2:13:20<18:25,  2.36s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  84%|########4 | 2531/3000 [2:13:22<18:25,  2.36s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  84%|########4 | 2531/3000 [2:13:22<18:25,  2.36s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  84%|########4 | 2532/3000 [2:13:22<17:52,  2.29s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  84%|########4 | 2532/3000 [2:13:22<17:52,  2.29s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  84%|########4 | 2532/3000 [2:13:27<17:52,  2.29s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  84%|########4 | 2532/3000 [2:13:27<17:52,  2.29s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  84%|########4 | 2533/3000 [2:13:27<22:38,  2.91s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  84%|########4 | 2533/3000 [2:13:27<22:38,  2.91s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  84%|########4 | 2533/3000 [2:13:30<22:38,  2.91s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  84%|########4 | 2533/3000 [2:13:30<22:38,  2.91s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  84%|########4 | 2534/3000 [2:13:30<23:18,  3.00s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  84%|########4 | 2534/3000 [2:13:30<23:18,  3.00s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  84%|########4 | 2534/3000 [2:13:33<23:18,  3.00s/it, lr: 1.0e-04 loss: 1.792e-02]hash_cache_v1:  84%|########4 | 2534/3000 [2:13:33<23:18,  3.00s/it, lr: 1.0e-04 loss: 1.792e-02]hash_cache_v1:  84%|########4 | 2535/3000 [2:13:33<22:41,  2.93s/it, lr: 1.0e-04 loss: 1.792e-02]hash_cache_v1:  84%|########4 | 2535/3000 [2:13:33<22:41,  2.93s/it, lr: 1.0e-04 loss: 1.792e-02]hash_cache_v1:  84%|########4 | 2535/3000 [2:13:36<22:41,  2.93s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  84%|########4 | 2535/3000 [2:13:36<22:41,  2.93s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  85%|########4 | 2536/3000 [2:13:36<22:06,  2.86s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  85%|########4 | 2536/3000 [2:13:36<22:06,  2.86s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  85%|########4 | 2536/3000 [2:13:40<22:06,  2.86s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:  85%|########4 | 2536/3000 [2:13:40<22:06,  2.86s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:  85%|########4 | 2537/3000 [2:13:40<26:07,  3.39s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:  85%|########4 | 2537/3000 [2:13:40<26:07,  3.39s/it, lr: 1.0e-04 loss: 4.139e-02]hash_cache_v1:  85%|########4 | 2537/3000 [2:13:45<26:07,  3.39s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  85%|########4 | 2537/3000 [2:13:45<26:07,  3.39s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  85%|########4 | 2538/3000 [2:13:45<28:14,  3.67s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  85%|########4 | 2538/3000 [2:13:45<28:14,  3.67s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  85%|########4 | 2538/3000 [2:13:48<28:14,  3.67s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  85%|########4 | 2538/3000 [2:13:48<28:14,  3.67s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  85%|########4 | 2539/3000 [2:13:48<26:25,  3.44s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  85%|########4 | 2539/3000 [2:13:48<26:25,  3.44s/it, lr: 1.0e-04 loss: 1.432e-01]hash_cache_v1:  85%|########4 | 2539/3000 [2:13:51<26:25,  3.44s/it, lr: 1.0e-04 loss: 3.072e-02]hash_cache_v1:  85%|########4 | 2539/3000 [2:13:51<26:25,  3.44s/it, lr: 1.0e-04 loss: 3.072e-02]hash_cache_v1:  85%|########4 | 2540/3000 [2:13:53<26:22,  3.44s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  85%|########4 | 2540/3000 [2:13:53<26:22,  3.44s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  85%|########4 | 2541/3000 [2:13:53<19:03,  2.49s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  85%|########4 | 2541/3000 [2:13:53<19:03,  2.49s/it, lr: 1.0e-04 loss: 1.566e-01]hash_cache_v1:  85%|########4 | 2541/3000 [2:13:58<19:03,  2.49s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  85%|########4 | 2541/3000 [2:13:58<19:03,  2.49s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  85%|########4 | 2542/3000 [2:13:58<22:38,  2.97s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  85%|########4 | 2542/3000 [2:13:58<22:38,  2.97s/it, lr: 1.0e-04 loss: 1.496e-01]hash_cache_v1:  85%|########4 | 2542/3000 [2:14:02<22:38,  2.97s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  85%|########4 | 2542/3000 [2:14:02<22:38,  2.97s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  85%|########4 | 2543/3000 [2:14:02<25:24,  3.34s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  85%|########4 | 2543/3000 [2:14:02<25:24,  3.34s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  85%|########4 | 2543/3000 [2:14:05<25:24,  3.34s/it, lr: 1.0e-04 loss: 9.205e-02]hash_cache_v1:  85%|########4 | 2543/3000 [2:14:05<25:24,  3.34s/it, lr: 1.0e-04 loss: 9.205e-02]hash_cache_v1:  85%|########4 | 2544/3000 [2:14:05<25:06,  3.30s/it, lr: 1.0e-04 loss: 9.205e-02]hash_cache_v1:  85%|########4 | 2544/3000 [2:14:05<25:06,  3.30s/it, lr: 1.0e-04 loss: 9.205e-02]hash_cache_v1:  85%|########4 | 2544/3000 [2:14:08<25:06,  3.30s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  85%|########4 | 2544/3000 [2:14:08<25:06,  3.30s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  85%|########4 | 2545/3000 [2:14:08<23:48,  3.14s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  85%|########4 | 2545/3000 [2:14:08<23:48,  3.14s/it, lr: 1.0e-04 loss: 1.243e-01]hash_cache_v1:  85%|########4 | 2545/3000 [2:14:11<23:48,  3.14s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  85%|########4 | 2545/3000 [2:14:11<23:48,  3.14s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  85%|########4 | 2546/3000 [2:14:11<23:22,  3.09s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  85%|########4 | 2546/3000 [2:14:11<23:22,  3.09s/it, lr: 1.0e-04 loss: 1.237e-01]hash_cache_v1:  85%|########4 | 2546/3000 [2:14:14<23:22,  3.09s/it, lr: 1.0e-04 loss: 3.255e-02]hash_cache_v1:  85%|########4 | 2546/3000 [2:14:14<23:22,  3.09s/it, lr: 1.0e-04 loss: 3.255e-02]hash_cache_v1:  85%|########4 | 2547/3000 [2:14:14<22:58,  3.04s/it, lr: 1.0e-04 loss: 3.255e-02]hash_cache_v1:  85%|########4 | 2547/3000 [2:14:14<22:58,  3.04s/it, lr: 1.0e-04 loss: 3.255e-02]hash_cache_v1:  85%|########4 | 2547/3000 [2:14:17<22:58,  3.04s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  85%|########4 | 2547/3000 [2:14:17<22:58,  3.04s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  85%|########4 | 2548/3000 [2:14:17<23:24,  3.11s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  85%|########4 | 2548/3000 [2:14:17<23:24,  3.11s/it, lr: 1.0e-04 loss: 2.262e-01]hash_cache_v1:  85%|########4 | 2548/3000 [2:14:20<23:24,  3.11s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  85%|########4 | 2548/3000 [2:14:20<23:24,  3.11s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  85%|########4 | 2549/3000 [2:14:20<22:31,  3.00s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  85%|########4 | 2549/3000 [2:14:20<22:31,  3.00s/it, lr: 1.0e-04 loss: 1.592e-01]hash_cache_v1:  85%|########4 | 2549/3000 [2:14:24<22:31,  3.00s/it, lr: 1.0e-04 loss: 2.012e-02]hash_cache_v1:  85%|########4 | 2549/3000 [2:14:24<22:31,  3.00s/it, lr: 1.0e-04 loss: 2.012e-02]hash_cache_v1:  85%|########5 | 2550/3000 [2:14:29<22:28,  3.00s/it, lr: 1.0e-04 loss: 9.355e-02]hash_cache_v1:  85%|########5 | 2550/3000 [2:14:29<22:28,  3.00s/it, lr: 1.0e-04 loss: 9.355e-02]hash_cache_v1:  85%|########5 | 2551/3000 [2:14:29<20:07,  2.69s/it, lr: 1.0e-04 loss: 9.355e-02]hash_cache_v1:  85%|########5 | 2551/3000 [2:14:29<20:07,  2.69s/it, lr: 1.0e-04 loss: 9.355e-02]hash_cache_v1:  85%|########5 | 2551/3000 [2:14:32<20:07,  2.69s/it, lr: 1.0e-04 loss: 2.810e-02]hash_cache_v1:  85%|########5 | 2551/3000 [2:14:32<20:07,  2.69s/it, lr: 1.0e-04 loss: 2.810e-02]hash_cache_v1:  85%|########5 | 2552/3000 [2:14:32<20:05,  2.69s/it, lr: 1.0e-04 loss: 2.810e-02]hash_cache_v1:  85%|########5 | 2552/3000 [2:14:32<20:05,  2.69s/it, lr: 1.0e-04 loss: 2.810e-02]hash_cache_v1:  85%|########5 | 2552/3000 [2:14:34<20:05,  2.69s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  85%|########5 | 2552/3000 [2:14:34<20:05,  2.69s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  85%|########5 | 2553/3000 [2:14:34<19:55,  2.68s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  85%|########5 | 2553/3000 [2:14:34<19:55,  2.68s/it, lr: 1.0e-04 loss: 1.480e-01]hash_cache_v1:  85%|########5 | 2553/3000 [2:14:39<19:55,  2.68s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2553/3000 [2:14:39<19:55,  2.68s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2554/3000 [2:14:39<23:05,  3.11s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2554/3000 [2:14:39<23:05,  3.11s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2554/3000 [2:14:41<23:05,  3.11s/it, lr: 1.0e-04 loss: 6.643e-02]hash_cache_v1:  85%|########5 | 2554/3000 [2:14:41<23:05,  3.11s/it, lr: 1.0e-04 loss: 6.643e-02]hash_cache_v1:  85%|########5 | 2555/3000 [2:14:41<21:32,  2.90s/it, lr: 1.0e-04 loss: 6.643e-02]hash_cache_v1:  85%|########5 | 2555/3000 [2:14:41<21:32,  2.90s/it, lr: 1.0e-04 loss: 6.643e-02]hash_cache_v1:  85%|########5 | 2555/3000 [2:14:45<21:32,  2.90s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  85%|########5 | 2555/3000 [2:14:45<21:32,  2.90s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  85%|########5 | 2556/3000 [2:14:45<24:24,  3.30s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  85%|########5 | 2556/3000 [2:14:45<24:24,  3.30s/it, lr: 1.0e-04 loss: 1.104e-01]hash_cache_v1:  85%|########5 | 2556/3000 [2:14:48<24:24,  3.30s/it, lr: 1.0e-04 loss: 5.454e-02]hash_cache_v1:  85%|########5 | 2556/3000 [2:14:48<24:24,  3.30s/it, lr: 1.0e-04 loss: 5.454e-02]hash_cache_v1:  85%|########5 | 2557/3000 [2:14:48<23:27,  3.18s/it, lr: 1.0e-04 loss: 5.454e-02]hash_cache_v1:  85%|########5 | 2557/3000 [2:14:48<23:27,  3.18s/it, lr: 1.0e-04 loss: 5.454e-02]hash_cache_v1:  85%|########5 | 2557/3000 [2:14:50<23:27,  3.18s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  85%|########5 | 2557/3000 [2:14:50<23:27,  3.18s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  85%|########5 | 2558/3000 [2:14:50<21:05,  2.86s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  85%|########5 | 2558/3000 [2:14:50<21:05,  2.86s/it, lr: 1.0e-04 loss: 1.500e-01]hash_cache_v1:  85%|########5 | 2558/3000 [2:14:55<21:05,  2.86s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  85%|########5 | 2558/3000 [2:14:55<21:05,  2.86s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  85%|########5 | 2559/3000 [2:14:55<24:31,  3.34s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  85%|########5 | 2559/3000 [2:14:55<24:31,  3.34s/it, lr: 1.0e-04 loss: 1.263e-01]hash_cache_v1:  85%|########5 | 2559/3000 [2:14:58<24:31,  3.34s/it, lr: 1.0e-04 loss: 1.338e-01]hash_cache_v1:  85%|########5 | 2559/3000 [2:14:58<24:31,  3.34s/it, lr: 1.0e-04 loss: 1.338e-01]hash_cache_v1:  85%|########5 | 2560/3000 [2:15:00<24:28,  3.34s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  85%|########5 | 2560/3000 [2:15:00<24:28,  3.34s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  85%|########5 | 2561/3000 [2:15:00<18:03,  2.47s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  85%|########5 | 2561/3000 [2:15:00<18:03,  2.47s/it, lr: 1.0e-04 loss: 1.541e-01]hash_cache_v1:  85%|########5 | 2561/3000 [2:15:03<18:03,  2.47s/it, lr: 1.0e-04 loss: 5.489e-02]hash_cache_v1:  85%|########5 | 2561/3000 [2:15:03<18:03,  2.47s/it, lr: 1.0e-04 loss: 5.489e-02]hash_cache_v1:  85%|########5 | 2562/3000 [2:15:03<17:48,  2.44s/it, lr: 1.0e-04 loss: 5.489e-02]hash_cache_v1:  85%|########5 | 2562/3000 [2:15:03<17:48,  2.44s/it, lr: 1.0e-04 loss: 5.489e-02]hash_cache_v1:  85%|########5 | 2562/3000 [2:15:06<17:48,  2.44s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2562/3000 [2:15:06<17:48,  2.44s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2563/3000 [2:15:06<18:34,  2.55s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2563/3000 [2:15:06<18:34,  2.55s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  85%|########5 | 2563/3000 [2:15:10<18:34,  2.55s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  85%|########5 | 2563/3000 [2:15:10<18:34,  2.55s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  85%|########5 | 2564/3000 [2:15:10<21:59,  3.03s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  85%|########5 | 2564/3000 [2:15:10<21:59,  3.03s/it, lr: 1.0e-04 loss: 1.289e-01]hash_cache_v1:  85%|########5 | 2564/3000 [2:15:13<21:59,  3.03s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  85%|########5 | 2564/3000 [2:15:13<21:59,  3.03s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  86%|########5 | 2565/3000 [2:15:13<21:39,  2.99s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  86%|########5 | 2565/3000 [2:15:13<21:39,  2.99s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  86%|########5 | 2565/3000 [2:15:16<21:39,  2.99s/it, lr: 1.0e-04 loss: 9.923e-02]hash_cache_v1:  86%|########5 | 2565/3000 [2:15:16<21:39,  2.99s/it, lr: 1.0e-04 loss: 9.923e-02]hash_cache_v1:  86%|########5 | 2566/3000 [2:15:16<21:47,  3.01s/it, lr: 1.0e-04 loss: 9.923e-02]hash_cache_v1:  86%|########5 | 2566/3000 [2:15:16<21:47,  3.01s/it, lr: 1.0e-04 loss: 9.923e-02]hash_cache_v1:  86%|########5 | 2566/3000 [2:15:19<21:47,  3.01s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  86%|########5 | 2566/3000 [2:15:19<21:47,  3.01s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  86%|########5 | 2567/3000 [2:15:19<21:26,  2.97s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  86%|########5 | 2567/3000 [2:15:19<21:26,  2.97s/it, lr: 1.0e-04 loss: 2.033e-01]hash_cache_v1:  86%|########5 | 2567/3000 [2:15:21<21:26,  2.97s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  86%|########5 | 2567/3000 [2:15:21<21:26,  2.97s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  86%|########5 | 2568/3000 [2:15:21<19:45,  2.74s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  86%|########5 | 2568/3000 [2:15:21<19:45,  2.74s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  86%|########5 | 2568/3000 [2:15:25<19:45,  2.74s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  86%|########5 | 2568/3000 [2:15:25<19:45,  2.74s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  86%|########5 | 2569/3000 [2:15:25<22:59,  3.20s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  86%|########5 | 2569/3000 [2:15:25<22:59,  3.20s/it, lr: 1.0e-04 loss: 1.023e-01]hash_cache_v1:  86%|########5 | 2569/3000 [2:15:28<22:59,  3.20s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  86%|########5 | 2569/3000 [2:15:28<22:59,  3.20s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  86%|########5 | 2570/3000 [2:15:30<22:56,  3.20s/it, lr: 1.0e-04 loss: 8.810e-02]hash_cache_v1:  86%|########5 | 2570/3000 [2:15:30<22:56,  3.20s/it, lr: 1.0e-04 loss: 8.810e-02]hash_cache_v1:  86%|########5 | 2571/3000 [2:15:30<15:53,  2.22s/it, lr: 1.0e-04 loss: 8.810e-02]hash_cache_v1:  86%|########5 | 2571/3000 [2:15:30<15:53,  2.22s/it, lr: 1.0e-04 loss: 8.810e-02]hash_cache_v1:  86%|########5 | 2571/3000 [2:15:33<15:53,  2.22s/it, lr: 1.0e-04 loss: 2.075e-01]hash_cache_v1:  86%|########5 | 2571/3000 [2:15:33<15:53,  2.22s/it, lr: 1.0e-04 loss: 2.075e-01]hash_cache_v1:  86%|########5 | 2572/3000 [2:15:33<15:39,  2.20s/it, lr: 1.0e-04 loss: 2.075e-01]hash_cache_v1:  86%|########5 | 2572/3000 [2:15:33<15:39,  2.20s/it, lr: 1.0e-04 loss: 2.075e-01]hash_cache_v1:  86%|########5 | 2572/3000 [2:15:37<15:39,  2.20s/it, lr: 1.0e-04 loss: 3.081e-02]hash_cache_v1:  86%|########5 | 2572/3000 [2:15:37<15:39,  2.20s/it, lr: 1.0e-04 loss: 3.081e-02]hash_cache_v1:  86%|########5 | 2573/3000 [2:15:37<19:46,  2.78s/it, lr: 1.0e-04 loss: 3.081e-02]hash_cache_v1:  86%|########5 | 2573/3000 [2:15:37<19:46,  2.78s/it, lr: 1.0e-04 loss: 3.081e-02]hash_cache_v1:  86%|########5 | 2573/3000 [2:15:41<19:46,  2.78s/it, lr: 1.0e-04 loss: 4.292e-02]hash_cache_v1:  86%|########5 | 2573/3000 [2:15:41<19:46,  2.78s/it, lr: 1.0e-04 loss: 4.292e-02]hash_cache_v1:  86%|########5 | 2574/3000 [2:15:41<22:35,  3.18s/it, lr: 1.0e-04 loss: 4.292e-02]hash_cache_v1:  86%|########5 | 2574/3000 [2:15:41<22:35,  3.18s/it, lr: 1.0e-04 loss: 4.292e-02]hash_cache_v1:  86%|########5 | 2574/3000 [2:15:44<22:35,  3.18s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  86%|########5 | 2574/3000 [2:15:44<22:35,  3.18s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  86%|########5 | 2575/3000 [2:15:44<21:50,  3.08s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  86%|########5 | 2575/3000 [2:15:44<21:50,  3.08s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  86%|########5 | 2575/3000 [2:15:47<21:50,  3.08s/it, lr: 1.0e-04 loss: 1.534e-01]hash_cache_v1:  86%|########5 | 2575/3000 [2:15:47<21:50,  3.08s/it, lr: 1.0e-04 loss: 1.534e-01]hash_cache_v1:  86%|########5 | 2576/3000 [2:15:47<21:21,  3.02s/it, lr: 1.0e-04 loss: 1.534e-01]hash_cache_v1:  86%|########5 | 2576/3000 [2:15:47<21:21,  3.02s/it, lr: 1.0e-04 loss: 1.534e-01]hash_cache_v1:  86%|########5 | 2576/3000 [2:15:49<21:21,  3.02s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  86%|########5 | 2576/3000 [2:15:49<21:21,  3.02s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  86%|########5 | 2577/3000 [2:15:49<19:59,  2.84s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  86%|########5 | 2577/3000 [2:15:49<19:59,  2.84s/it, lr: 1.0e-04 loss: 2.054e-01]hash_cache_v1:  86%|########5 | 2577/3000 [2:15:51<19:59,  2.84s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  86%|########5 | 2577/3000 [2:15:51<19:59,  2.84s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  86%|########5 | 2578/3000 [2:15:51<18:27,  2.62s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  86%|########5 | 2578/3000 [2:15:51<18:27,  2.62s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  86%|########5 | 2578/3000 [2:15:54<18:27,  2.62s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  86%|########5 | 2578/3000 [2:15:54<18:27,  2.62s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  86%|########5 | 2579/3000 [2:15:54<18:57,  2.70s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  86%|########5 | 2579/3000 [2:15:54<18:57,  2.70s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  86%|########5 | 2579/3000 [2:15:57<18:57,  2.70s/it, lr: 1.0e-04 loss: 1.539e-01]hash_cache_v1:  86%|########5 | 2579/3000 [2:15:57<18:57,  2.70s/it, lr: 1.0e-04 loss: 1.539e-01]hash_cache_v1:  86%|########6 | 2580/3000 [2:16:02<18:55,  2.70s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  86%|########6 | 2580/3000 [2:16:02<18:55,  2.70s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  86%|########6 | 2581/3000 [2:16:02<17:24,  2.49s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  86%|########6 | 2581/3000 [2:16:02<17:24,  2.49s/it, lr: 1.0e-04 loss: 1.253e-01]hash_cache_v1:  86%|########6 | 2581/3000 [2:16:05<17:24,  2.49s/it, lr: 1.0e-04 loss: 7.788e-02]hash_cache_v1:  86%|########6 | 2581/3000 [2:16:05<17:24,  2.49s/it, lr: 1.0e-04 loss: 7.788e-02]hash_cache_v1:  86%|########6 | 2582/3000 [2:16:05<17:57,  2.58s/it, lr: 1.0e-04 loss: 7.788e-02]hash_cache_v1:  86%|########6 | 2582/3000 [2:16:05<17:57,  2.58s/it, lr: 1.0e-04 loss: 7.788e-02]hash_cache_v1:  86%|########6 | 2582/3000 [2:16:07<17:57,  2.58s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  86%|########6 | 2582/3000 [2:16:07<17:57,  2.58s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  86%|########6 | 2583/3000 [2:16:07<17:03,  2.46s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  86%|########6 | 2583/3000 [2:16:07<17:03,  2.46s/it, lr: 1.0e-04 loss: 1.640e-01]hash_cache_v1:  86%|########6 | 2583/3000 [2:16:10<17:03,  2.46s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  86%|########6 | 2583/3000 [2:16:10<17:03,  2.46s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  86%|########6 | 2584/3000 [2:16:10<18:12,  2.63s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  86%|########6 | 2584/3000 [2:16:10<18:12,  2.63s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  86%|########6 | 2584/3000 [2:16:14<18:12,  2.63s/it, lr: 1.0e-04 loss: 1.170e-01]hash_cache_v1:  86%|########6 | 2584/3000 [2:16:14<18:12,  2.63s/it, lr: 1.0e-04 loss: 1.170e-01]hash_cache_v1:  86%|########6 | 2585/3000 [2:16:14<21:24,  3.09s/it, lr: 1.0e-04 loss: 1.170e-01]hash_cache_v1:  86%|########6 | 2585/3000 [2:16:14<21:24,  3.09s/it, lr: 1.0e-04 loss: 1.170e-01]hash_cache_v1:  86%|########6 | 2585/3000 [2:16:16<21:24,  3.09s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  86%|########6 | 2585/3000 [2:16:16<21:24,  3.09s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  86%|########6 | 2586/3000 [2:16:16<19:23,  2.81s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  86%|########6 | 2586/3000 [2:16:16<19:23,  2.81s/it, lr: 1.0e-04 loss: 1.283e-01]hash_cache_v1:  86%|########6 | 2586/3000 [2:16:18<19:23,  2.81s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  86%|########6 | 2586/3000 [2:16:18<19:23,  2.81s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  86%|########6 | 2587/3000 [2:16:18<17:56,  2.61s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  86%|########6 | 2587/3000 [2:16:18<17:56,  2.61s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  86%|########6 | 2587/3000 [2:16:21<17:56,  2.61s/it, lr: 1.0e-04 loss: 4.718e-02]hash_cache_v1:  86%|########6 | 2587/3000 [2:16:21<17:56,  2.61s/it, lr: 1.0e-04 loss: 4.718e-02]hash_cache_v1:  86%|########6 | 2588/3000 [2:16:21<18:55,  2.76s/it, lr: 1.0e-04 loss: 4.718e-02]hash_cache_v1:  86%|########6 | 2588/3000 [2:16:21<18:55,  2.76s/it, lr: 1.0e-04 loss: 4.718e-02]hash_cache_v1:  86%|########6 | 2588/3000 [2:16:26<18:55,  2.76s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  86%|########6 | 2588/3000 [2:16:26<18:55,  2.76s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  86%|########6 | 2589/3000 [2:16:26<21:56,  3.20s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  86%|########6 | 2589/3000 [2:16:26<21:56,  3.20s/it, lr: 1.0e-04 loss: 1.226e-01]hash_cache_v1:  86%|########6 | 2589/3000 [2:16:28<21:56,  3.20s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  86%|########6 | 2589/3000 [2:16:28<21:56,  3.20s/it, lr: 1.0e-04 loss: 1.371e-01]hash_cache_v1:  86%|########6 | 2590/3000 [2:16:30<21:52,  3.20s/it, lr: 1.0e-04 loss: 1.292e-01]hash_cache_v1:  86%|########6 | 2590/3000 [2:16:30<21:52,  3.20s/it, lr: 1.0e-04 loss: 1.292e-01]hash_cache_v1:  86%|########6 | 2591/3000 [2:16:30<15:38,  2.30s/it, lr: 1.0e-04 loss: 1.292e-01]hash_cache_v1:  86%|########6 | 2591/3000 [2:16:30<15:38,  2.30s/it, lr: 1.0e-04 loss: 1.292e-01]hash_cache_v1:  86%|########6 | 2591/3000 [2:16:33<15:38,  2.30s/it, lr: 1.0e-04 loss: 1.030e-01]hash_cache_v1:  86%|########6 | 2591/3000 [2:16:33<15:38,  2.30s/it, lr: 1.0e-04 loss: 1.030e-01]hash_cache_v1:  86%|########6 | 2592/3000 [2:16:33<16:34,  2.44s/it, lr: 1.0e-04 loss: 1.030e-01]hash_cache_v1:  86%|########6 | 2592/3000 [2:16:33<16:34,  2.44s/it, lr: 1.0e-04 loss: 1.030e-01]hash_cache_v1:  86%|########6 | 2592/3000 [2:16:37<16:34,  2.44s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  86%|########6 | 2592/3000 [2:16:37<16:34,  2.44s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  86%|########6 | 2593/3000 [2:16:37<19:46,  2.92s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  86%|########6 | 2593/3000 [2:16:37<19:46,  2.92s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  86%|########6 | 2593/3000 [2:16:42<19:46,  2.92s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  86%|########6 | 2593/3000 [2:16:42<19:46,  2.92s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  86%|########6 | 2594/3000 [2:16:42<22:18,  3.30s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  86%|########6 | 2594/3000 [2:16:42<22:18,  3.30s/it, lr: 1.0e-04 loss: 1.453e-01]hash_cache_v1:  86%|########6 | 2594/3000 [2:16:44<22:18,  3.30s/it, lr: 1.0e-04 loss: 7.052e-02]hash_cache_v1:  86%|########6 | 2594/3000 [2:16:44<22:18,  3.30s/it, lr: 1.0e-04 loss: 7.052e-02]hash_cache_v1:  86%|########6 | 2595/3000 [2:16:44<20:31,  3.04s/it, lr: 1.0e-04 loss: 7.052e-02]hash_cache_v1:  86%|########6 | 2595/3000 [2:16:44<20:31,  3.04s/it, lr: 1.0e-04 loss: 7.052e-02]hash_cache_v1:  86%|########6 | 2595/3000 [2:16:46<20:31,  3.04s/it, lr: 1.0e-04 loss: 7.943e-02]hash_cache_v1:  86%|########6 | 2595/3000 [2:16:46<20:31,  3.04s/it, lr: 1.0e-04 loss: 7.943e-02]hash_cache_v1:  87%|########6 | 2596/3000 [2:16:46<18:41,  2.78s/it, lr: 1.0e-04 loss: 7.943e-02]hash_cache_v1:  87%|########6 | 2596/3000 [2:16:46<18:41,  2.78s/it, lr: 1.0e-04 loss: 7.943e-02]hash_cache_v1:  87%|########6 | 2596/3000 [2:16:49<18:41,  2.78s/it, lr: 1.0e-04 loss: 1.274e-01]hash_cache_v1:  87%|########6 | 2596/3000 [2:16:49<18:41,  2.78s/it, lr: 1.0e-04 loss: 1.274e-01]hash_cache_v1:  87%|########6 | 2597/3000 [2:16:49<18:46,  2.79s/it, lr: 1.0e-04 loss: 1.274e-01]hash_cache_v1:  87%|########6 | 2597/3000 [2:16:49<18:46,  2.79s/it, lr: 1.0e-04 loss: 1.274e-01]hash_cache_v1:  87%|########6 | 2597/3000 [2:16:51<18:46,  2.79s/it, lr: 1.0e-04 loss: 3.585e-02]hash_cache_v1:  87%|########6 | 2597/3000 [2:16:51<18:46,  2.79s/it, lr: 1.0e-04 loss: 3.585e-02]hash_cache_v1:  87%|########6 | 2598/3000 [2:16:51<17:22,  2.59s/it, lr: 1.0e-04 loss: 3.585e-02]hash_cache_v1:  87%|########6 | 2598/3000 [2:16:51<17:22,  2.59s/it, lr: 1.0e-04 loss: 3.585e-02]hash_cache_v1:  87%|########6 | 2598/3000 [2:16:56<17:22,  2.59s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  87%|########6 | 2598/3000 [2:16:56<17:22,  2.59s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  87%|########6 | 2599/3000 [2:16:56<21:08,  3.16s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  87%|########6 | 2599/3000 [2:16:56<21:08,  3.16s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  87%|########6 | 2599/3000 [2:16:59<21:08,  3.16s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  87%|########6 | 2599/3000 [2:16:59<21:08,  3.16s/it, lr: 1.0e-04 loss: 1.060e-01]hash_cache_v1:  87%|########6 | 2600/3000 [2:17:03<21:04,  3.16s/it, lr: 1.0e-04 loss: 9.314e-02]hash_cache_v1:  87%|########6 | 2600/3000 [2:17:03<21:04,  3.16s/it, lr: 1.0e-04 loss: 9.314e-02]hash_cache_v1:  87%|########6 | 2601/3000 [2:17:03<18:01,  2.71s/it, lr: 1.0e-04 loss: 9.314e-02]hash_cache_v1:  87%|########6 | 2601/3000 [2:17:03<18:01,  2.71s/it, lr: 1.0e-04 loss: 9.314e-02]hash_cache_v1:  87%|########6 | 2601/3000 [2:17:05<18:01,  2.71s/it, lr: 1.0e-04 loss: 1.009e-01]hash_cache_v1:  87%|########6 | 2601/3000 [2:17:05<18:01,  2.71s/it, lr: 1.0e-04 loss: 1.009e-01]hash_cache_v1:  87%|########6 | 2602/3000 [2:17:05<17:30,  2.64s/it, lr: 1.0e-04 loss: 1.009e-01]hash_cache_v1:  87%|########6 | 2602/3000 [2:17:05<17:30,  2.64s/it, lr: 1.0e-04 loss: 1.009e-01]hash_cache_v1:  87%|########6 | 2602/3000 [2:17:10<17:30,  2.64s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  87%|########6 | 2602/3000 [2:17:10<17:30,  2.64s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  87%|########6 | 2603/3000 [2:17:10<20:10,  3.05s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  87%|########6 | 2603/3000 [2:17:10<20:10,  3.05s/it, lr: 1.0e-04 loss: 8.535e-02]hash_cache_v1:  87%|########6 | 2603/3000 [2:17:14<20:10,  3.05s/it, lr: 1.0e-04 loss: 9.600e-02]hash_cache_v1:  87%|########6 | 2603/3000 [2:17:14<20:10,  3.05s/it, lr: 1.0e-04 loss: 9.600e-02]hash_cache_v1:  87%|########6 | 2604/3000 [2:17:14<22:22,  3.39s/it, lr: 1.0e-04 loss: 9.600e-02]hash_cache_v1:  87%|########6 | 2604/3000 [2:17:14<22:22,  3.39s/it, lr: 1.0e-04 loss: 9.600e-02]hash_cache_v1:  87%|########6 | 2604/3000 [2:17:18<22:22,  3.39s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  87%|########6 | 2604/3000 [2:17:18<22:22,  3.39s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  87%|########6 | 2605/3000 [2:17:18<24:01,  3.65s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  87%|########6 | 2605/3000 [2:17:18<24:01,  3.65s/it, lr: 1.0e-04 loss: 1.477e-01]hash_cache_v1:  87%|########6 | 2605/3000 [2:17:23<24:01,  3.65s/it, lr: 1.0e-04 loss: 6.031e-02]hash_cache_v1:  87%|########6 | 2605/3000 [2:17:23<24:01,  3.65s/it, lr: 1.0e-04 loss: 6.031e-02]hash_cache_v1:  87%|########6 | 2606/3000 [2:17:23<25:37,  3.90s/it, lr: 1.0e-04 loss: 6.031e-02]hash_cache_v1:  87%|########6 | 2606/3000 [2:17:23<25:37,  3.90s/it, lr: 1.0e-04 loss: 6.031e-02]hash_cache_v1:  87%|########6 | 2606/3000 [2:17:25<25:37,  3.90s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  87%|########6 | 2606/3000 [2:17:25<25:37,  3.90s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  87%|########6 | 2607/3000 [2:17:25<22:10,  3.39s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  87%|########6 | 2607/3000 [2:17:25<22:10,  3.39s/it, lr: 1.0e-04 loss: 1.395e-01]hash_cache_v1:  87%|########6 | 2607/3000 [2:17:29<22:10,  3.39s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  87%|########6 | 2607/3000 [2:17:29<22:10,  3.39s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  87%|########6 | 2608/3000 [2:17:29<23:55,  3.66s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  87%|########6 | 2608/3000 [2:17:29<23:55,  3.66s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  87%|########6 | 2608/3000 [2:17:32<23:55,  3.66s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  87%|########6 | 2608/3000 [2:17:32<23:55,  3.66s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  87%|########6 | 2609/3000 [2:17:32<22:25,  3.44s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  87%|########6 | 2609/3000 [2:17:32<22:25,  3.44s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  87%|########6 | 2609/3000 [2:17:36<22:25,  3.44s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:  87%|########6 | 2609/3000 [2:17:36<22:25,  3.44s/it, lr: 1.0e-04 loss: 1.427e-01]hash_cache_v1:  87%|########7 | 2610/3000 [2:17:39<22:22,  3.44s/it, lr: 1.0e-04 loss: 2.938e-02]hash_cache_v1:  87%|########7 | 2610/3000 [2:17:39<22:22,  3.44s/it, lr: 1.0e-04 loss: 2.938e-02]hash_cache_v1:  87%|########7 | 2611/3000 [2:17:39<16:21,  2.52s/it, lr: 1.0e-04 loss: 2.938e-02]hash_cache_v1:  87%|########7 | 2611/3000 [2:17:39<16:21,  2.52s/it, lr: 1.0e-04 loss: 2.938e-02]hash_cache_v1:  87%|########7 | 2611/3000 [2:17:41<16:21,  2.52s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  87%|########7 | 2611/3000 [2:17:41<16:21,  2.52s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  87%|########7 | 2612/3000 [2:17:41<15:38,  2.42s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  87%|########7 | 2612/3000 [2:17:41<15:38,  2.42s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  87%|########7 | 2612/3000 [2:17:43<15:38,  2.42s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  87%|########7 | 2612/3000 [2:17:43<15:38,  2.42s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  87%|########7 | 2613/3000 [2:17:43<15:36,  2.42s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  87%|########7 | 2613/3000 [2:17:43<15:36,  2.42s/it, lr: 1.0e-04 loss: 1.659e-01]hash_cache_v1:  87%|########7 | 2613/3000 [2:17:46<15:36,  2.42s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  87%|########7 | 2613/3000 [2:17:46<15:36,  2.42s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  87%|########7 | 2614/3000 [2:17:46<16:21,  2.54s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  87%|########7 | 2614/3000 [2:17:46<16:21,  2.54s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  87%|########7 | 2614/3000 [2:17:49<16:21,  2.54s/it, lr: 1.0e-04 loss: 4.994e-03]hash_cache_v1:  87%|########7 | 2614/3000 [2:17:49<16:21,  2.54s/it, lr: 1.0e-04 loss: 4.994e-03]hash_cache_v1:  87%|########7 | 2615/3000 [2:17:49<16:55,  2.64s/it, lr: 1.0e-04 loss: 4.994e-03]hash_cache_v1:  87%|########7 | 2615/3000 [2:17:49<16:55,  2.64s/it, lr: 1.0e-04 loss: 4.994e-03]hash_cache_v1:  87%|########7 | 2615/3000 [2:17:52<16:55,  2.64s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  87%|########7 | 2615/3000 [2:17:52<16:55,  2.64s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  87%|########7 | 2616/3000 [2:17:52<17:19,  2.71s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  87%|########7 | 2616/3000 [2:17:52<17:19,  2.71s/it, lr: 1.0e-04 loss: 1.077e-01]hash_cache_v1:  87%|########7 | 2616/3000 [2:17:56<17:19,  2.71s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:  87%|########7 | 2616/3000 [2:17:56<17:19,  2.71s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:  87%|########7 | 2617/3000 [2:17:56<20:36,  3.23s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:  87%|########7 | 2617/3000 [2:17:56<20:36,  3.23s/it, lr: 1.0e-04 loss: 1.168e-01]hash_cache_v1:  87%|########7 | 2617/3000 [2:17:58<20:36,  3.23s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  87%|########7 | 2617/3000 [2:17:58<20:36,  3.23s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  87%|########7 | 2618/3000 [2:17:58<18:28,  2.90s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  87%|########7 | 2618/3000 [2:17:58<18:28,  2.90s/it, lr: 1.0e-04 loss: 1.549e-01]hash_cache_v1:  87%|########7 | 2618/3000 [2:18:00<18:28,  2.90s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  87%|########7 | 2618/3000 [2:18:00<18:28,  2.90s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  87%|########7 | 2619/3000 [2:18:00<16:56,  2.67s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  87%|########7 | 2619/3000 [2:18:00<16:56,  2.67s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  87%|########7 | 2619/3000 [2:18:03<16:56,  2.67s/it, lr: 1.0e-04 loss: 2.174e-02]hash_cache_v1:  87%|########7 | 2619/3000 [2:18:03<16:56,  2.67s/it, lr: 1.0e-04 loss: 2.174e-02]hash_cache_v1:  87%|########7 | 2620/3000 [2:18:06<16:54,  2.67s/it, lr: 1.0e-04 loss: 4.589e-02]hash_cache_v1:  87%|########7 | 2620/3000 [2:18:06<16:54,  2.67s/it, lr: 1.0e-04 loss: 4.589e-02]hash_cache_v1:  87%|########7 | 2621/3000 [2:18:06<13:17,  2.10s/it, lr: 1.0e-04 loss: 4.589e-02]hash_cache_v1:  87%|########7 | 2621/3000 [2:18:06<13:17,  2.10s/it, lr: 1.0e-04 loss: 4.589e-02]hash_cache_v1:  87%|########7 | 2621/3000 [2:18:08<13:17,  2.10s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  87%|########7 | 2621/3000 [2:18:08<13:17,  2.10s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  87%|########7 | 2622/3000 [2:18:08<14:16,  2.27s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  87%|########7 | 2622/3000 [2:18:08<14:16,  2.27s/it, lr: 1.0e-04 loss: 1.462e-01]hash_cache_v1:  87%|########7 | 2622/3000 [2:18:11<14:16,  2.27s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  87%|########7 | 2622/3000 [2:18:11<14:16,  2.27s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  87%|########7 | 2623/3000 [2:18:11<13:59,  2.23s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  87%|########7 | 2623/3000 [2:18:11<13:59,  2.23s/it, lr: 1.0e-04 loss: 1.185e-01]hash_cache_v1:  87%|########7 | 2623/3000 [2:18:15<13:59,  2.23s/it, lr: 1.0e-04 loss: 8.148e-02]hash_cache_v1:  87%|########7 | 2623/3000 [2:18:15<13:59,  2.23s/it, lr: 1.0e-04 loss: 8.148e-02]hash_cache_v1:  87%|########7 | 2624/3000 [2:18:15<17:43,  2.83s/it, lr: 1.0e-04 loss: 8.148e-02]hash_cache_v1:  87%|########7 | 2624/3000 [2:18:15<17:43,  2.83s/it, lr: 1.0e-04 loss: 8.148e-02]hash_cache_v1:  87%|########7 | 2624/3000 [2:18:19<17:43,  2.83s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  87%|########7 | 2624/3000 [2:18:19<17:43,  2.83s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  88%|########7 | 2625/3000 [2:18:19<20:17,  3.25s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  88%|########7 | 2625/3000 [2:18:19<20:17,  3.25s/it, lr: 1.0e-04 loss: 1.260e-01]hash_cache_v1:  88%|########7 | 2625/3000 [2:18:21<20:17,  3.25s/it, lr: 1.0e-04 loss: 7.287e-02]hash_cache_v1:  88%|########7 | 2625/3000 [2:18:21<20:17,  3.25s/it, lr: 1.0e-04 loss: 7.287e-02]hash_cache_v1:  88%|########7 | 2626/3000 [2:18:21<18:12,  2.92s/it, lr: 1.0e-04 loss: 7.287e-02]hash_cache_v1:  88%|########7 | 2626/3000 [2:18:21<18:12,  2.92s/it, lr: 1.0e-04 loss: 7.287e-02]hash_cache_v1:  88%|########7 | 2626/3000 [2:18:24<18:12,  2.92s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  88%|########7 | 2626/3000 [2:18:24<18:12,  2.92s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  88%|########7 | 2627/3000 [2:18:24<17:59,  2.89s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  88%|########7 | 2627/3000 [2:18:24<17:59,  2.89s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  88%|########7 | 2627/3000 [2:18:27<17:59,  2.89s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  88%|########7 | 2627/3000 [2:18:27<17:59,  2.89s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  88%|########7 | 2628/3000 [2:18:27<18:14,  2.94s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  88%|########7 | 2628/3000 [2:18:27<18:14,  2.94s/it, lr: 1.0e-04 loss: 1.175e-01]hash_cache_v1:  88%|########7 | 2628/3000 [2:18:29<18:14,  2.94s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  88%|########7 | 2628/3000 [2:18:29<18:14,  2.94s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  88%|########7 | 2629/3000 [2:18:29<16:39,  2.69s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  88%|########7 | 2629/3000 [2:18:29<16:39,  2.69s/it, lr: 1.0e-04 loss: 1.193e-01]hash_cache_v1:  88%|########7 | 2629/3000 [2:18:34<16:39,  2.69s/it, lr: 1.0e-04 loss: 1.384e-01]hash_cache_v1:  88%|########7 | 2629/3000 [2:18:34<16:39,  2.69s/it, lr: 1.0e-04 loss: 1.384e-01]hash_cache_v1:  88%|########7 | 2630/3000 [2:18:38<16:37,  2.69s/it, lr: 1.0e-04 loss: 1.775e-01]hash_cache_v1:  88%|########7 | 2630/3000 [2:18:38<16:37,  2.69s/it, lr: 1.0e-04 loss: 1.775e-01]hash_cache_v1:  88%|########7 | 2631/3000 [2:18:38<15:21,  2.50s/it, lr: 1.0e-04 loss: 1.775e-01]hash_cache_v1:  88%|########7 | 2631/3000 [2:18:38<15:21,  2.50s/it, lr: 1.0e-04 loss: 1.775e-01]hash_cache_v1:  88%|########7 | 2631/3000 [2:18:40<15:21,  2.50s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:  88%|########7 | 2631/3000 [2:18:40<15:21,  2.50s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:  88%|########7 | 2632/3000 [2:18:40<14:41,  2.40s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:  88%|########7 | 2632/3000 [2:18:40<14:41,  2.40s/it, lr: 1.0e-04 loss: 1.857e-01]hash_cache_v1:  88%|########7 | 2632/3000 [2:18:45<14:41,  2.40s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  88%|########7 | 2632/3000 [2:18:45<14:41,  2.40s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  88%|########7 | 2633/3000 [2:18:45<17:38,  2.88s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  88%|########7 | 2633/3000 [2:18:45<17:38,  2.88s/it, lr: 1.0e-04 loss: 1.225e-01]hash_cache_v1:  88%|########7 | 2633/3000 [2:18:49<17:38,  2.88s/it, lr: 1.0e-04 loss: 3.949e-02]hash_cache_v1:  88%|########7 | 2633/3000 [2:18:49<17:38,  2.88s/it, lr: 1.0e-04 loss: 3.949e-02]hash_cache_v1:  88%|########7 | 2634/3000 [2:18:49<19:59,  3.28s/it, lr: 1.0e-04 loss: 3.949e-02]hash_cache_v1:  88%|########7 | 2634/3000 [2:18:49<19:59,  3.28s/it, lr: 1.0e-04 loss: 3.949e-02]hash_cache_v1:  88%|########7 | 2634/3000 [2:18:51<19:59,  3.28s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  88%|########7 | 2634/3000 [2:18:51<19:59,  3.28s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  88%|########7 | 2635/3000 [2:18:51<18:25,  3.03s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  88%|########7 | 2635/3000 [2:18:51<18:25,  3.03s/it, lr: 1.0e-04 loss: 1.098e-01]hash_cache_v1:  88%|########7 | 2635/3000 [2:18:56<18:25,  3.03s/it, lr: 1.0e-04 loss: 3.075e-03]hash_cache_v1:  88%|########7 | 2635/3000 [2:18:56<18:25,  3.03s/it, lr: 1.0e-04 loss: 3.075e-03]hash_cache_v1:  88%|########7 | 2636/3000 [2:18:56<20:32,  3.39s/it, lr: 1.0e-04 loss: 3.075e-03]hash_cache_v1:  88%|########7 | 2636/3000 [2:18:56<20:32,  3.39s/it, lr: 1.0e-04 loss: 3.075e-03]hash_cache_v1:  88%|########7 | 2636/3000 [2:18:58<20:32,  3.39s/it, lr: 1.0e-04 loss: 1.716e-01]hash_cache_v1:  88%|########7 | 2636/3000 [2:18:58<20:32,  3.39s/it, lr: 1.0e-04 loss: 1.716e-01]hash_cache_v1:  88%|########7 | 2637/3000 [2:18:58<18:15,  3.02s/it, lr: 1.0e-04 loss: 1.716e-01]hash_cache_v1:  88%|########7 | 2637/3000 [2:18:58<18:15,  3.02s/it, lr: 1.0e-04 loss: 1.716e-01]hash_cache_v1:  88%|########7 | 2637/3000 [2:19:00<18:15,  3.02s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  88%|########7 | 2637/3000 [2:19:00<18:15,  3.02s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  88%|########7 | 2638/3000 [2:19:00<16:35,  2.75s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  88%|########7 | 2638/3000 [2:19:00<16:35,  2.75s/it, lr: 1.0e-04 loss: 3.093e-02]hash_cache_v1:  88%|########7 | 2638/3000 [2:19:03<16:35,  2.75s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  88%|########7 | 2638/3000 [2:19:03<16:35,  2.75s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  88%|########7 | 2639/3000 [2:19:03<17:04,  2.84s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  88%|########7 | 2639/3000 [2:19:03<17:04,  2.84s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  88%|########7 | 2639/3000 [2:19:06<17:04,  2.84s/it, lr: 1.0e-04 loss: 6.637e-02]hash_cache_v1:  88%|########7 | 2639/3000 [2:19:06<17:04,  2.84s/it, lr: 1.0e-04 loss: 6.637e-02]hash_cache_v1:  88%|########8 | 2640/3000 [2:19:09<17:02,  2.84s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  88%|########8 | 2640/3000 [2:19:09<17:02,  2.84s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  88%|########8 | 2641/3000 [2:19:09<13:06,  2.19s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  88%|########8 | 2641/3000 [2:19:09<13:06,  2.19s/it, lr: 1.0e-04 loss: 1.320e-01]hash_cache_v1:  88%|########8 | 2641/3000 [2:19:13<13:06,  2.19s/it, lr: 1.0e-04 loss: 9.835e-02]hash_cache_v1:  88%|########8 | 2641/3000 [2:19:13<13:06,  2.19s/it, lr: 1.0e-04 loss: 9.835e-02]hash_cache_v1:  88%|########8 | 2642/3000 [2:19:13<16:18,  2.73s/it, lr: 1.0e-04 loss: 9.835e-02]hash_cache_v1:  88%|########8 | 2642/3000 [2:19:13<16:18,  2.73s/it, lr: 1.0e-04 loss: 9.835e-02]hash_cache_v1:  88%|########8 | 2642/3000 [2:19:15<16:18,  2.73s/it, lr: 1.0e-04 loss: 1.413e-01]hash_cache_v1:  88%|########8 | 2642/3000 [2:19:15<16:18,  2.73s/it, lr: 1.0e-04 loss: 1.413e-01]hash_cache_v1:  88%|########8 | 2643/3000 [2:19:15<15:18,  2.57s/it, lr: 1.0e-04 loss: 1.413e-01]hash_cache_v1:  88%|########8 | 2643/3000 [2:19:15<15:18,  2.57s/it, lr: 1.0e-04 loss: 1.413e-01]hash_cache_v1:  88%|########8 | 2643/3000 [2:19:17<15:18,  2.57s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  88%|########8 | 2643/3000 [2:19:17<15:18,  2.57s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  88%|########8 | 2644/3000 [2:19:17<14:32,  2.45s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  88%|########8 | 2644/3000 [2:19:17<14:32,  2.45s/it, lr: 1.0e-04 loss: 1.254e-01]hash_cache_v1:  88%|########8 | 2644/3000 [2:19:19<14:32,  2.45s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  88%|########8 | 2644/3000 [2:19:19<14:32,  2.45s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  88%|########8 | 2645/3000 [2:19:19<13:54,  2.35s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  88%|########8 | 2645/3000 [2:19:19<13:54,  2.35s/it, lr: 1.0e-04 loss: 1.639e-01]hash_cache_v1:  88%|########8 | 2645/3000 [2:19:22<13:54,  2.35s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  88%|########8 | 2645/3000 [2:19:22<13:54,  2.35s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  88%|########8 | 2646/3000 [2:19:22<15:06,  2.56s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  88%|########8 | 2646/3000 [2:19:22<15:06,  2.56s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  88%|########8 | 2646/3000 [2:19:27<15:06,  2.56s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  88%|########8 | 2646/3000 [2:19:27<15:06,  2.56s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  88%|########8 | 2647/3000 [2:19:27<18:05,  3.08s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  88%|########8 | 2647/3000 [2:19:27<18:05,  3.08s/it, lr: 1.0e-04 loss: 1.377e-01]hash_cache_v1:  88%|########8 | 2647/3000 [2:19:30<18:05,  3.08s/it, lr: 1.0e-04 loss: 6.561e-02]hash_cache_v1:  88%|########8 | 2647/3000 [2:19:30<18:05,  3.08s/it, lr: 1.0e-04 loss: 6.561e-02]hash_cache_v1:  88%|########8 | 2648/3000 [2:19:30<17:42,  3.02s/it, lr: 1.0e-04 loss: 6.561e-02]hash_cache_v1:  88%|########8 | 2648/3000 [2:19:30<17:42,  3.02s/it, lr: 1.0e-04 loss: 6.561e-02]hash_cache_v1:  88%|########8 | 2648/3000 [2:19:32<17:42,  3.02s/it, lr: 1.0e-04 loss: 5.758e-02]hash_cache_v1:  88%|########8 | 2648/3000 [2:19:32<17:42,  3.02s/it, lr: 1.0e-04 loss: 5.758e-02]hash_cache_v1:  88%|########8 | 2649/3000 [2:19:32<17:12,  2.94s/it, lr: 1.0e-04 loss: 5.758e-02]hash_cache_v1:  88%|########8 | 2649/3000 [2:19:32<17:12,  2.94s/it, lr: 1.0e-04 loss: 5.758e-02]hash_cache_v1:  88%|########8 | 2649/3000 [2:19:37<17:12,  2.94s/it, lr: 1.0e-04 loss: 8.400e-02]hash_cache_v1:  88%|########8 | 2649/3000 [2:19:37<17:12,  2.94s/it, lr: 1.0e-04 loss: 8.400e-02]hash_cache_v1:  88%|########8 | 2650/3000 [2:19:39<17:09,  2.94s/it, lr: 1.0e-04 loss: 8.568e-02]hash_cache_v1:  88%|########8 | 2650/3000 [2:19:39<17:09,  2.94s/it, lr: 1.0e-04 loss: 8.568e-02]hash_cache_v1:  88%|########8 | 2651/3000 [2:19:39<12:05,  2.08s/it, lr: 1.0e-04 loss: 8.568e-02]hash_cache_v1:  88%|########8 | 2651/3000 [2:19:39<12:05,  2.08s/it, lr: 1.0e-04 loss: 8.568e-02]hash_cache_v1:  88%|########8 | 2651/3000 [2:19:43<12:05,  2.08s/it, lr: 1.0e-04 loss: 8.486e-02]hash_cache_v1:  88%|########8 | 2651/3000 [2:19:43<12:05,  2.08s/it, lr: 1.0e-04 loss: 8.486e-02]hash_cache_v1:  88%|########8 | 2652/3000 [2:19:43<15:13,  2.63s/it, lr: 1.0e-04 loss: 8.486e-02]hash_cache_v1:  88%|########8 | 2652/3000 [2:19:43<15:13,  2.63s/it, lr: 1.0e-04 loss: 8.486e-02]hash_cache_v1:  88%|########8 | 2652/3000 [2:19:46<15:13,  2.63s/it, lr: 1.0e-04 loss: 7.615e-02]hash_cache_v1:  88%|########8 | 2652/3000 [2:19:46<15:13,  2.63s/it, lr: 1.0e-04 loss: 7.615e-02]hash_cache_v1:  88%|########8 | 2653/3000 [2:19:46<15:53,  2.75s/it, lr: 1.0e-04 loss: 7.615e-02]hash_cache_v1:  88%|########8 | 2653/3000 [2:19:46<15:53,  2.75s/it, lr: 1.0e-04 loss: 7.615e-02]hash_cache_v1:  88%|########8 | 2653/3000 [2:19:49<15:53,  2.75s/it, lr: 1.0e-04 loss: 9.567e-02]hash_cache_v1:  88%|########8 | 2653/3000 [2:19:49<15:53,  2.75s/it, lr: 1.0e-04 loss: 9.567e-02]hash_cache_v1:  88%|########8 | 2654/3000 [2:19:49<14:50,  2.57s/it, lr: 1.0e-04 loss: 9.567e-02]hash_cache_v1:  88%|########8 | 2654/3000 [2:19:49<14:50,  2.57s/it, lr: 1.0e-04 loss: 9.567e-02]hash_cache_v1:  88%|########8 | 2654/3000 [2:19:51<14:50,  2.57s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  88%|########8 | 2654/3000 [2:19:51<14:50,  2.57s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  88%|########8 | 2655/3000 [2:19:51<15:15,  2.65s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  88%|########8 | 2655/3000 [2:19:51<15:15,  2.65s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  88%|########8 | 2655/3000 [2:19:56<15:15,  2.65s/it, lr: 1.0e-04 loss: 3.419e-02]hash_cache_v1:  88%|########8 | 2655/3000 [2:19:56<15:15,  2.65s/it, lr: 1.0e-04 loss: 3.419e-02]hash_cache_v1:  89%|########8 | 2656/3000 [2:19:56<17:57,  3.13s/it, lr: 1.0e-04 loss: 3.419e-02]hash_cache_v1:  89%|########8 | 2656/3000 [2:19:56<17:57,  3.13s/it, lr: 1.0e-04 loss: 3.419e-02]hash_cache_v1:  89%|########8 | 2656/3000 [2:19:58<17:57,  3.13s/it, lr: 1.0e-04 loss: 9.170e-02]hash_cache_v1:  89%|########8 | 2656/3000 [2:19:58<17:57,  3.13s/it, lr: 1.0e-04 loss: 9.170e-02]hash_cache_v1:  89%|########8 | 2657/3000 [2:19:58<16:41,  2.92s/it, lr: 1.0e-04 loss: 9.170e-02]hash_cache_v1:  89%|########8 | 2657/3000 [2:19:58<16:41,  2.92s/it, lr: 1.0e-04 loss: 9.170e-02]hash_cache_v1:  89%|########8 | 2657/3000 [2:20:02<16:41,  2.92s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  89%|########8 | 2657/3000 [2:20:02<16:41,  2.92s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  89%|########8 | 2658/3000 [2:20:02<19:00,  3.33s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  89%|########8 | 2658/3000 [2:20:02<19:00,  3.33s/it, lr: 1.0e-04 loss: 6.276e-02]hash_cache_v1:  89%|########8 | 2658/3000 [2:20:05<19:00,  3.33s/it, lr: 1.0e-04 loss: 2.233e-02]hash_cache_v1:  89%|########8 | 2658/3000 [2:20:05<19:00,  3.33s/it, lr: 1.0e-04 loss: 2.233e-02]hash_cache_v1:  89%|########8 | 2659/3000 [2:20:05<16:57,  2.98s/it, lr: 1.0e-04 loss: 2.233e-02]hash_cache_v1:  89%|########8 | 2659/3000 [2:20:05<16:57,  2.98s/it, lr: 1.0e-04 loss: 2.233e-02]hash_cache_v1:  89%|########8 | 2659/3000 [2:20:09<16:57,  2.98s/it, lr: 1.0e-04 loss: 9.483e-02]hash_cache_v1:  89%|########8 | 2659/3000 [2:20:09<16:57,  2.98s/it, lr: 1.0e-04 loss: 9.483e-02]hash_cache_v1:  89%|########8 | 2660/3000 [2:20:11<16:54,  2.98s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  89%|########8 | 2660/3000 [2:20:11<16:54,  2.98s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  89%|########8 | 2661/3000 [2:20:11<12:15,  2.17s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  89%|########8 | 2661/3000 [2:20:11<12:15,  2.17s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  89%|########8 | 2661/3000 [2:20:13<12:15,  2.17s/it, lr: 1.0e-04 loss: 4.625e-02]hash_cache_v1:  89%|########8 | 2661/3000 [2:20:13<12:15,  2.17s/it, lr: 1.0e-04 loss: 4.625e-02]hash_cache_v1:  89%|########8 | 2662/3000 [2:20:13<12:08,  2.16s/it, lr: 1.0e-04 loss: 4.625e-02]hash_cache_v1:  89%|########8 | 2662/3000 [2:20:13<12:08,  2.16s/it, lr: 1.0e-04 loss: 4.625e-02]hash_cache_v1:  89%|########8 | 2662/3000 [2:20:18<12:08,  2.16s/it, lr: 1.0e-04 loss: 1.201e-01]hash_cache_v1:  89%|########8 | 2662/3000 [2:20:18<12:08,  2.16s/it, lr: 1.0e-04 loss: 1.201e-01]hash_cache_v1:  89%|########8 | 2663/3000 [2:20:18<15:16,  2.72s/it, lr: 1.0e-04 loss: 1.201e-01]hash_cache_v1:  89%|########8 | 2663/3000 [2:20:18<15:16,  2.72s/it, lr: 1.0e-04 loss: 1.201e-01]hash_cache_v1:  89%|########8 | 2663/3000 [2:20:21<15:16,  2.72s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  89%|########8 | 2663/3000 [2:20:21<15:16,  2.72s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  89%|########8 | 2664/3000 [2:20:21<15:47,  2.82s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  89%|########8 | 2664/3000 [2:20:21<15:47,  2.82s/it, lr: 1.0e-04 loss: 1.096e-01]hash_cache_v1:  89%|########8 | 2664/3000 [2:20:25<15:47,  2.82s/it, lr: 1.0e-04 loss: 9.247e-02]hash_cache_v1:  89%|########8 | 2664/3000 [2:20:25<15:47,  2.82s/it, lr: 1.0e-04 loss: 9.247e-02]hash_cache_v1:  89%|########8 | 2665/3000 [2:20:25<18:01,  3.23s/it, lr: 1.0e-04 loss: 9.247e-02]hash_cache_v1:  89%|########8 | 2665/3000 [2:20:25<18:01,  3.23s/it, lr: 1.0e-04 loss: 9.247e-02]hash_cache_v1:  89%|########8 | 2665/3000 [2:20:27<18:01,  3.23s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  89%|########8 | 2665/3000 [2:20:27<18:01,  3.23s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  89%|########8 | 2666/3000 [2:20:27<16:10,  2.90s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  89%|########8 | 2666/3000 [2:20:27<16:10,  2.90s/it, lr: 1.0e-04 loss: 1.521e-01]hash_cache_v1:  89%|########8 | 2666/3000 [2:20:31<16:10,  2.90s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  89%|########8 | 2666/3000 [2:20:31<16:10,  2.90s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  89%|########8 | 2667/3000 [2:20:31<18:19,  3.30s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  89%|########8 | 2667/3000 [2:20:31<18:19,  3.30s/it, lr: 1.0e-04 loss: 1.192e-01]hash_cache_v1:  89%|########8 | 2667/3000 [2:20:36<18:19,  3.30s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  89%|########8 | 2667/3000 [2:20:36<18:19,  3.30s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  89%|########8 | 2668/3000 [2:20:36<20:13,  3.65s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  89%|########8 | 2668/3000 [2:20:36<20:13,  3.65s/it, lr: 1.0e-04 loss: 1.519e-01]hash_cache_v1:  89%|########8 | 2668/3000 [2:20:40<20:13,  3.65s/it, lr: 1.0e-04 loss: 2.733e-02]hash_cache_v1:  89%|########8 | 2668/3000 [2:20:40<20:13,  3.65s/it, lr: 1.0e-04 loss: 2.733e-02]hash_cache_v1:  89%|########8 | 2669/3000 [2:20:40<21:12,  3.84s/it, lr: 1.0e-04 loss: 2.733e-02]hash_cache_v1:  89%|########8 | 2669/3000 [2:20:40<21:12,  3.84s/it, lr: 1.0e-04 loss: 2.733e-02]hash_cache_v1:  89%|########8 | 2669/3000 [2:20:45<21:12,  3.84s/it, lr: 1.0e-04 loss: 1.233e-01]hash_cache_v1:  89%|########8 | 2669/3000 [2:20:45<21:12,  3.84s/it, lr: 1.0e-04 loss: 1.233e-01]hash_cache_v1:  89%|########9 | 2670/3000 [2:20:47<21:08,  3.84s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  89%|########9 | 2670/3000 [2:20:47<21:08,  3.84s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  89%|########9 | 2671/3000 [2:20:47<14:04,  2.57s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  89%|########9 | 2671/3000 [2:20:47<14:04,  2.57s/it, lr: 1.0e-04 loss: 1.296e-01]hash_cache_v1:  89%|########9 | 2671/3000 [2:20:50<14:04,  2.57s/it, lr: 1.0e-04 loss: 4.087e-02]hash_cache_v1:  89%|########9 | 2671/3000 [2:20:50<14:04,  2.57s/it, lr: 1.0e-04 loss: 4.087e-02]hash_cache_v1:  89%|########9 | 2672/3000 [2:20:50<14:44,  2.70s/it, lr: 1.0e-04 loss: 4.087e-02]hash_cache_v1:  89%|########9 | 2672/3000 [2:20:50<14:44,  2.70s/it, lr: 1.0e-04 loss: 4.087e-02]hash_cache_v1:  89%|########9 | 2672/3000 [2:20:54<14:44,  2.70s/it, lr: 1.0e-04 loss: 1.724e-01]hash_cache_v1:  89%|########9 | 2672/3000 [2:20:54<14:44,  2.70s/it, lr: 1.0e-04 loss: 1.724e-01]hash_cache_v1:  89%|########9 | 2673/3000 [2:20:54<16:59,  3.12s/it, lr: 1.0e-04 loss: 1.724e-01]hash_cache_v1:  89%|########9 | 2673/3000 [2:20:54<16:59,  3.12s/it, lr: 1.0e-04 loss: 1.724e-01]hash_cache_v1:  89%|########9 | 2673/3000 [2:20:57<16:59,  3.12s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  89%|########9 | 2673/3000 [2:20:57<16:59,  3.12s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  89%|########9 | 2674/3000 [2:20:57<16:37,  3.06s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  89%|########9 | 2674/3000 [2:20:57<16:37,  3.06s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  89%|########9 | 2674/3000 [2:21:02<16:37,  3.06s/it, lr: 1.0e-04 loss: 2.624e-02]hash_cache_v1:  89%|########9 | 2674/3000 [2:21:02<16:37,  3.06s/it, lr: 1.0e-04 loss: 2.624e-02]hash_cache_v1:  89%|########9 | 2675/3000 [2:21:02<18:56,  3.50s/it, lr: 1.0e-04 loss: 2.624e-02]hash_cache_v1:  89%|########9 | 2675/3000 [2:21:02<18:56,  3.50s/it, lr: 1.0e-04 loss: 2.624e-02]hash_cache_v1:  89%|########9 | 2675/3000 [2:21:04<18:56,  3.50s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  89%|########9 | 2675/3000 [2:21:04<18:56,  3.50s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  89%|########9 | 2676/3000 [2:21:04<16:44,  3.10s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  89%|########9 | 2676/3000 [2:21:04<16:44,  3.10s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  89%|########9 | 2676/3000 [2:21:06<16:44,  3.10s/it, lr: 1.0e-04 loss: 6.427e-02]hash_cache_v1:  89%|########9 | 2676/3000 [2:21:06<16:44,  3.10s/it, lr: 1.0e-04 loss: 6.427e-02]hash_cache_v1:  89%|########9 | 2677/3000 [2:21:06<15:06,  2.81s/it, lr: 1.0e-04 loss: 6.427e-02]hash_cache_v1:  89%|########9 | 2677/3000 [2:21:06<15:06,  2.81s/it, lr: 1.0e-04 loss: 6.427e-02]hash_cache_v1:  89%|########9 | 2677/3000 [2:21:08<15:06,  2.81s/it, lr: 1.0e-04 loss: 6.023e-03]hash_cache_v1:  89%|########9 | 2677/3000 [2:21:08<15:06,  2.81s/it, lr: 1.0e-04 loss: 6.023e-03]hash_cache_v1:  89%|########9 | 2678/3000 [2:21:08<13:57,  2.60s/it, lr: 1.0e-04 loss: 6.023e-03]hash_cache_v1:  89%|########9 | 2678/3000 [2:21:08<13:57,  2.60s/it, lr: 1.0e-04 loss: 6.023e-03]hash_cache_v1:  89%|########9 | 2678/3000 [2:21:12<13:57,  2.60s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:  89%|########9 | 2678/3000 [2:21:12<13:57,  2.60s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:  89%|########9 | 2679/3000 [2:21:12<16:56,  3.17s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:  89%|########9 | 2679/3000 [2:21:12<16:56,  3.17s/it, lr: 1.0e-04 loss: 1.085e-01]hash_cache_v1:  89%|########9 | 2679/3000 [2:21:15<16:56,  3.17s/it, lr: 1.0e-04 loss: 5.435e-02]hash_cache_v1:  89%|########9 | 2679/3000 [2:21:15<16:56,  3.17s/it, lr: 1.0e-04 loss: 5.435e-02]hash_cache_v1:  89%|########9 | 2680/3000 [2:21:18<16:53,  3.17s/it, lr: 1.0e-04 loss: 1.233e-01]hash_cache_v1:  89%|########9 | 2680/3000 [2:21:18<16:53,  3.17s/it, lr: 1.0e-04 loss: 1.233e-01]hash_cache_v1:  89%|########9 | 2681/3000 [2:21:18<12:39,  2.38s/it, lr: 1.0e-04 loss: 1.233e-01]hash_cache_v1:  89%|########9 | 2681/3000 [2:21:18<12:39,  2.38s/it, lr: 1.0e-04 loss: 1.233e-01]hash_cache_v1:  89%|########9 | 2681/3000 [2:21:21<12:39,  2.38s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  89%|########9 | 2681/3000 [2:21:21<12:39,  2.38s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  89%|########9 | 2682/3000 [2:21:21<13:32,  2.56s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  89%|########9 | 2682/3000 [2:21:21<13:32,  2.56s/it, lr: 1.0e-04 loss: 1.328e-01]hash_cache_v1:  89%|########9 | 2682/3000 [2:21:23<13:32,  2.56s/it, lr: 1.0e-04 loss: 7.264e-02]hash_cache_v1:  89%|########9 | 2682/3000 [2:21:23<13:32,  2.56s/it, lr: 1.0e-04 loss: 7.264e-02]hash_cache_v1:  89%|########9 | 2683/3000 [2:21:23<12:53,  2.44s/it, lr: 1.0e-04 loss: 7.264e-02]hash_cache_v1:  89%|########9 | 2683/3000 [2:21:23<12:53,  2.44s/it, lr: 1.0e-04 loss: 7.264e-02]hash_cache_v1:  89%|########9 | 2683/3000 [2:21:26<12:53,  2.44s/it, lr: 1.0e-04 loss: 2.008e-02]hash_cache_v1:  89%|########9 | 2683/3000 [2:21:26<12:53,  2.44s/it, lr: 1.0e-04 loss: 2.008e-02]hash_cache_v1:  89%|########9 | 2684/3000 [2:21:26<13:31,  2.57s/it, lr: 1.0e-04 loss: 2.008e-02]hash_cache_v1:  89%|########9 | 2684/3000 [2:21:26<13:31,  2.57s/it, lr: 1.0e-04 loss: 2.008e-02]hash_cache_v1:  89%|########9 | 2684/3000 [2:21:29<13:31,  2.57s/it, lr: 1.0e-04 loss: 7.162e-02]hash_cache_v1:  89%|########9 | 2684/3000 [2:21:29<13:31,  2.57s/it, lr: 1.0e-04 loss: 7.162e-02]hash_cache_v1:  90%|########9 | 2685/3000 [2:21:29<13:54,  2.65s/it, lr: 1.0e-04 loss: 7.162e-02]hash_cache_v1:  90%|########9 | 2685/3000 [2:21:29<13:54,  2.65s/it, lr: 1.0e-04 loss: 7.162e-02]hash_cache_v1:  90%|########9 | 2685/3000 [2:21:34<13:54,  2.65s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  90%|########9 | 2685/3000 [2:21:34<13:54,  2.65s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  90%|########9 | 2686/3000 [2:21:34<16:42,  3.19s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  90%|########9 | 2686/3000 [2:21:34<16:42,  3.19s/it, lr: 1.0e-04 loss: 8.511e-02]hash_cache_v1:  90%|########9 | 2686/3000 [2:21:37<16:42,  3.19s/it, lr: 1.0e-04 loss: 7.446e-02]hash_cache_v1:  90%|########9 | 2686/3000 [2:21:37<16:42,  3.19s/it, lr: 1.0e-04 loss: 7.446e-02]hash_cache_v1:  90%|########9 | 2687/3000 [2:21:37<16:19,  3.13s/it, lr: 1.0e-04 loss: 7.446e-02]hash_cache_v1:  90%|########9 | 2687/3000 [2:21:37<16:19,  3.13s/it, lr: 1.0e-04 loss: 7.446e-02]hash_cache_v1:  90%|########9 | 2687/3000 [2:21:39<16:19,  3.13s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  90%|########9 | 2687/3000 [2:21:39<16:19,  3.13s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  90%|########9 | 2688/3000 [2:21:39<14:43,  2.83s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  90%|########9 | 2688/3000 [2:21:39<14:43,  2.83s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  90%|########9 | 2688/3000 [2:21:43<14:43,  2.83s/it, lr: 1.0e-04 loss: 8.200e-02]hash_cache_v1:  90%|########9 | 2688/3000 [2:21:43<14:43,  2.83s/it, lr: 1.0e-04 loss: 8.200e-02]hash_cache_v1:  90%|########9 | 2689/3000 [2:21:43<16:55,  3.27s/it, lr: 1.0e-04 loss: 8.200e-02]hash_cache_v1:  90%|########9 | 2689/3000 [2:21:43<16:55,  3.27s/it, lr: 1.0e-04 loss: 8.200e-02]hash_cache_v1:  90%|########9 | 2689/3000 [2:21:48<16:55,  3.27s/it, lr: 1.0e-04 loss: 1.112e-01]hash_cache_v1:  90%|########9 | 2689/3000 [2:21:48<16:55,  3.27s/it, lr: 1.0e-04 loss: 1.112e-01]hash_cache_v1:  90%|########9 | 2690/3000 [2:21:50<16:52,  3.27s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  90%|########9 | 2690/3000 [2:21:50<16:52,  3.27s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  90%|########9 | 2691/3000 [2:21:50<12:28,  2.42s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  90%|########9 | 2691/3000 [2:21:50<12:28,  2.42s/it, lr: 1.0e-04 loss: 1.333e-01]hash_cache_v1:  90%|########9 | 2691/3000 [2:21:53<12:28,  2.42s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  90%|########9 | 2691/3000 [2:21:53<12:28,  2.42s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  90%|########9 | 2692/3000 [2:21:53<12:57,  2.53s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  90%|########9 | 2692/3000 [2:21:53<12:57,  2.53s/it, lr: 1.0e-04 loss: 1.330e-01]hash_cache_v1:  90%|########9 | 2692/3000 [2:21:57<12:57,  2.53s/it, lr: 1.0e-04 loss: 9.375e-02]hash_cache_v1:  90%|########9 | 2692/3000 [2:21:57<12:57,  2.53s/it, lr: 1.0e-04 loss: 9.375e-02]hash_cache_v1:  90%|########9 | 2693/3000 [2:21:57<13:47,  2.69s/it, lr: 1.0e-04 loss: 9.375e-02]hash_cache_v1:  90%|########9 | 2693/3000 [2:21:57<13:47,  2.69s/it, lr: 1.0e-04 loss: 9.375e-02]hash_cache_v1:  90%|########9 | 2693/3000 [2:22:01<13:47,  2.69s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  90%|########9 | 2693/3000 [2:22:01<13:47,  2.69s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  90%|########9 | 2694/3000 [2:22:01<16:08,  3.16s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  90%|########9 | 2694/3000 [2:22:01<16:08,  3.16s/it, lr: 1.0e-04 loss: 1.353e-01]hash_cache_v1:  90%|########9 | 2694/3000 [2:22:04<16:08,  3.16s/it, lr: 1.0e-04 loss: 9.127e-02]hash_cache_v1:  90%|########9 | 2694/3000 [2:22:04<16:08,  3.16s/it, lr: 1.0e-04 loss: 9.127e-02]hash_cache_v1:  90%|########9 | 2695/3000 [2:22:04<15:28,  3.04s/it, lr: 1.0e-04 loss: 9.127e-02]hash_cache_v1:  90%|########9 | 2695/3000 [2:22:04<15:28,  3.04s/it, lr: 1.0e-04 loss: 9.127e-02]hash_cache_v1:  90%|########9 | 2695/3000 [2:22:07<15:28,  3.04s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  90%|########9 | 2695/3000 [2:22:07<15:28,  3.04s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  90%|########9 | 2696/3000 [2:22:07<15:19,  3.03s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  90%|########9 | 2696/3000 [2:22:07<15:19,  3.03s/it, lr: 1.0e-04 loss: 1.115e-01]hash_cache_v1:  90%|########9 | 2696/3000 [2:22:11<15:19,  3.03s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  90%|########9 | 2696/3000 [2:22:11<15:19,  3.03s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  90%|########9 | 2697/3000 [2:22:11<17:41,  3.50s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  90%|########9 | 2697/3000 [2:22:11<17:41,  3.50s/it, lr: 1.0e-04 loss: 1.322e-01]hash_cache_v1:  90%|########9 | 2697/3000 [2:22:16<17:41,  3.50s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  90%|########9 | 2697/3000 [2:22:16<17:41,  3.50s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  90%|########9 | 2698/3000 [2:22:16<18:55,  3.76s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  90%|########9 | 2698/3000 [2:22:16<18:55,  3.76s/it, lr: 1.0e-04 loss: 1.068e-01]hash_cache_v1:  90%|########9 | 2698/3000 [2:22:18<18:55,  3.76s/it, lr: 1.0e-04 loss: 2.334e-01]hash_cache_v1:  90%|########9 | 2698/3000 [2:22:18<18:55,  3.76s/it, lr: 1.0e-04 loss: 2.334e-01]hash_cache_v1:  90%|########9 | 2699/3000 [2:22:18<17:18,  3.45s/it, lr: 1.0e-04 loss: 2.334e-01]hash_cache_v1:  90%|########9 | 2699/3000 [2:22:18<17:18,  3.45s/it, lr: 1.0e-04 loss: 2.334e-01]hash_cache_v1:  90%|########9 | 2699/3000 [2:22:23<17:18,  3.45s/it, lr: 1.0e-04 loss: 2.789e-02]hash_cache_v1:  90%|########9 | 2699/3000 [2:22:23<17:18,  3.45s/it, lr: 1.0e-04 loss: 2.789e-02]hash_cache_v1:  90%|######### | 2700/3000 [2:22:28<17:15,  3.45s/it, lr: 1.0e-04 loss: 9.521e-02]hash_cache_v1:  90%|######### | 2700/3000 [2:22:28<17:15,  3.45s/it, lr: 1.0e-04 loss: 9.521e-02]hash_cache_v1:  90%|######### | 2701/3000 [2:22:28<14:53,  2.99s/it, lr: 1.0e-04 loss: 9.521e-02]hash_cache_v1:  90%|######### | 2701/3000 [2:22:28<14:53,  2.99s/it, lr: 1.0e-04 loss: 9.521e-02]hash_cache_v1:  90%|######### | 2701/3000 [2:22:31<14:53,  2.99s/it, lr: 1.0e-04 loss: 5.491e-02]hash_cache_v1:  90%|######### | 2701/3000 [2:22:31<14:53,  2.99s/it, lr: 1.0e-04 loss: 5.491e-02]hash_cache_v1:  90%|######### | 2702/3000 [2:22:31<14:49,  2.98s/it, lr: 1.0e-04 loss: 5.491e-02]hash_cache_v1:  90%|######### | 2702/3000 [2:22:31<14:49,  2.98s/it, lr: 1.0e-04 loss: 5.491e-02]hash_cache_v1:  90%|######### | 2702/3000 [2:22:35<14:49,  2.98s/it, lr: 1.0e-04 loss: 6.645e-02]hash_cache_v1:  90%|######### | 2702/3000 [2:22:35<14:49,  2.98s/it, lr: 1.0e-04 loss: 6.645e-02]hash_cache_v1:  90%|######### | 2703/3000 [2:22:35<16:33,  3.35s/it, lr: 1.0e-04 loss: 6.645e-02]hash_cache_v1:  90%|######### | 2703/3000 [2:22:35<16:33,  3.35s/it, lr: 1.0e-04 loss: 6.645e-02]hash_cache_v1:  90%|######### | 2703/3000 [2:22:39<16:33,  3.35s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  90%|######### | 2703/3000 [2:22:39<16:33,  3.35s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  90%|######### | 2704/3000 [2:22:39<16:20,  3.31s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  90%|######### | 2704/3000 [2:22:39<16:20,  3.31s/it, lr: 1.0e-04 loss: 1.507e-01]hash_cache_v1:  90%|######### | 2704/3000 [2:22:43<16:20,  3.31s/it, lr: 1.0e-04 loss: 2.191e-02]hash_cache_v1:  90%|######### | 2704/3000 [2:22:43<16:20,  3.31s/it, lr: 1.0e-04 loss: 2.191e-02]hash_cache_v1:  90%|######### | 2705/3000 [2:22:43<17:44,  3.61s/it, lr: 1.0e-04 loss: 2.191e-02]hash_cache_v1:  90%|######### | 2705/3000 [2:22:43<17:44,  3.61s/it, lr: 1.0e-04 loss: 2.191e-02]hash_cache_v1:  90%|######### | 2705/3000 [2:22:46<17:44,  3.61s/it, lr: 1.0e-04 loss: 2.926e-02]hash_cache_v1:  90%|######### | 2705/3000 [2:22:46<17:44,  3.61s/it, lr: 1.0e-04 loss: 2.926e-02]hash_cache_v1:  90%|######### | 2706/3000 [2:22:46<16:48,  3.43s/it, lr: 1.0e-04 loss: 2.926e-02]hash_cache_v1:  90%|######### | 2706/3000 [2:22:46<16:48,  3.43s/it, lr: 1.0e-04 loss: 2.926e-02]hash_cache_v1:  90%|######### | 2706/3000 [2:22:48<16:48,  3.43s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  90%|######### | 2706/3000 [2:22:48<16:48,  3.43s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  90%|######### | 2707/3000 [2:22:48<15:16,  3.13s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  90%|######### | 2707/3000 [2:22:48<15:16,  3.13s/it, lr: 1.0e-04 loss: 1.517e-01]hash_cache_v1:  90%|######### | 2707/3000 [2:22:53<15:16,  3.13s/it, lr: 1.0e-04 loss: 4.931e-03]hash_cache_v1:  90%|######### | 2707/3000 [2:22:53<15:16,  3.13s/it, lr: 1.0e-04 loss: 4.931e-03]hash_cache_v1:  90%|######### | 2708/3000 [2:22:53<17:13,  3.54s/it, lr: 1.0e-04 loss: 4.931e-03]hash_cache_v1:  90%|######### | 2708/3000 [2:22:53<17:13,  3.54s/it, lr: 1.0e-04 loss: 4.931e-03]hash_cache_v1:  90%|######### | 2708/3000 [2:22:55<17:13,  3.54s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  90%|######### | 2708/3000 [2:22:55<17:13,  3.54s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  90%|######### | 2709/3000 [2:22:55<15:07,  3.12s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  90%|######### | 2709/3000 [2:22:55<15:07,  3.12s/it, lr: 1.0e-04 loss: 1.043e-01]hash_cache_v1:  90%|######### | 2709/3000 [2:22:57<15:07,  3.12s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  90%|######### | 2709/3000 [2:22:57<15:07,  3.12s/it, lr: 1.0e-04 loss: 1.184e-01]hash_cache_v1:  90%|######### | 2710/3000 [2:23:02<15:03,  3.12s/it, lr: 1.0e-04 loss: 4.885e-02]hash_cache_v1:  90%|######### | 2710/3000 [2:23:02<15:03,  3.12s/it, lr: 1.0e-04 loss: 4.885e-02]hash_cache_v1:  90%|######### | 2711/3000 [2:23:02<13:08,  2.73s/it, lr: 1.0e-04 loss: 4.885e-02]hash_cache_v1:  90%|######### | 2711/3000 [2:23:02<13:08,  2.73s/it, lr: 1.0e-04 loss: 4.885e-02]hash_cache_v1:  90%|######### | 2711/3000 [2:23:06<13:08,  2.73s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  90%|######### | 2711/3000 [2:23:06<13:08,  2.73s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  90%|######### | 2712/3000 [2:23:06<14:59,  3.12s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  90%|######### | 2712/3000 [2:23:06<14:59,  3.12s/it, lr: 1.0e-04 loss: 5.835e-02]hash_cache_v1:  90%|######### | 2712/3000 [2:23:08<14:59,  3.12s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  90%|######### | 2712/3000 [2:23:08<14:59,  3.12s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  90%|######### | 2713/3000 [2:23:08<13:40,  2.86s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  90%|######### | 2713/3000 [2:23:08<13:40,  2.86s/it, lr: 1.0e-04 loss: 1.113e-01]hash_cache_v1:  90%|######### | 2713/3000 [2:23:10<13:40,  2.86s/it, lr: 1.0e-04 loss: 1.162e-01]hash_cache_v1:  90%|######### | 2713/3000 [2:23:10<13:40,  2.86s/it, lr: 1.0e-04 loss: 1.162e-01]hash_cache_v1:  90%|######### | 2714/3000 [2:23:10<12:38,  2.65s/it, lr: 1.0e-04 loss: 1.162e-01]hash_cache_v1:  90%|######### | 2714/3000 [2:23:10<12:38,  2.65s/it, lr: 1.0e-04 loss: 1.162e-01]hash_cache_v1:  90%|######### | 2714/3000 [2:23:13<12:38,  2.65s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  90%|######### | 2714/3000 [2:23:13<12:38,  2.65s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  90%|######### | 2715/3000 [2:23:13<12:16,  2.58s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  90%|######### | 2715/3000 [2:23:13<12:16,  2.58s/it, lr: 1.0e-04 loss: 1.425e-01]hash_cache_v1:  90%|######### | 2715/3000 [2:23:17<12:16,  2.58s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  90%|######### | 2715/3000 [2:23:17<12:16,  2.58s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  91%|######### | 2716/3000 [2:23:17<14:30,  3.06s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  91%|######### | 2716/3000 [2:23:17<14:30,  3.06s/it, lr: 1.0e-04 loss: 1.029e-01]hash_cache_v1:  91%|######### | 2716/3000 [2:23:20<14:30,  3.06s/it, lr: 1.0e-04 loss: 2.830e-02]hash_cache_v1:  91%|######### | 2716/3000 [2:23:20<14:30,  3.06s/it, lr: 1.0e-04 loss: 2.830e-02]hash_cache_v1:  91%|######### | 2717/3000 [2:23:20<14:11,  3.01s/it, lr: 1.0e-04 loss: 2.830e-02]hash_cache_v1:  91%|######### | 2717/3000 [2:23:20<14:11,  3.01s/it, lr: 1.0e-04 loss: 2.830e-02]hash_cache_v1:  91%|######### | 2717/3000 [2:23:23<14:11,  3.01s/it, lr: 1.0e-04 loss: 2.676e-02]hash_cache_v1:  91%|######### | 2717/3000 [2:23:23<14:11,  3.01s/it, lr: 1.0e-04 loss: 2.676e-02]hash_cache_v1:  91%|######### | 2718/3000 [2:23:23<14:06,  3.00s/it, lr: 1.0e-04 loss: 2.676e-02]hash_cache_v1:  91%|######### | 2718/3000 [2:23:23<14:06,  3.00s/it, lr: 1.0e-04 loss: 2.676e-02]hash_cache_v1:  91%|######### | 2718/3000 [2:23:25<14:06,  3.00s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  91%|######### | 2718/3000 [2:23:25<14:06,  3.00s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  91%|######### | 2719/3000 [2:23:25<13:35,  2.90s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  91%|######### | 2719/3000 [2:23:25<13:35,  2.90s/it, lr: 1.0e-04 loss: 1.406e-01]hash_cache_v1:  91%|######### | 2719/3000 [2:23:28<13:35,  2.90s/it, lr: 1.0e-04 loss: 9.826e-02]hash_cache_v1:  91%|######### | 2719/3000 [2:23:28<13:35,  2.90s/it, lr: 1.0e-04 loss: 9.826e-02]hash_cache_v1:  91%|######### | 2720/3000 [2:23:30<13:32,  2.90s/it, lr: 1.0e-04 loss: 8.341e-02]hash_cache_v1:  91%|######### | 2720/3000 [2:23:30<13:32,  2.90s/it, lr: 1.0e-04 loss: 8.341e-02]hash_cache_v1:  91%|######### | 2721/3000 [2:23:30<09:34,  2.06s/it, lr: 1.0e-04 loss: 8.341e-02]hash_cache_v1:  91%|######### | 2721/3000 [2:23:30<09:34,  2.06s/it, lr: 1.0e-04 loss: 8.341e-02]hash_cache_v1:  91%|######### | 2721/3000 [2:23:33<09:34,  2.06s/it, lr: 1.0e-04 loss: 9.733e-02]hash_cache_v1:  91%|######### | 2721/3000 [2:23:33<09:34,  2.06s/it, lr: 1.0e-04 loss: 9.733e-02]hash_cache_v1:  91%|######### | 2722/3000 [2:23:33<10:40,  2.30s/it, lr: 1.0e-04 loss: 9.733e-02]hash_cache_v1:  91%|######### | 2722/3000 [2:23:33<10:40,  2.30s/it, lr: 1.0e-04 loss: 9.733e-02]hash_cache_v1:  91%|######### | 2722/3000 [2:23:38<10:40,  2.30s/it, lr: 1.0e-04 loss: 6.818e-02]hash_cache_v1:  91%|######### | 2722/3000 [2:23:38<10:40,  2.30s/it, lr: 1.0e-04 loss: 6.818e-02]hash_cache_v1:  91%|######### | 2723/3000 [2:23:38<12:58,  2.81s/it, lr: 1.0e-04 loss: 6.818e-02]hash_cache_v1:  91%|######### | 2723/3000 [2:23:38<12:58,  2.81s/it, lr: 1.0e-04 loss: 6.818e-02]hash_cache_v1:  91%|######### | 2723/3000 [2:23:40<12:58,  2.81s/it, lr: 1.0e-04 loss: 1.630e-01]hash_cache_v1:  91%|######### | 2723/3000 [2:23:40<12:58,  2.81s/it, lr: 1.0e-04 loss: 1.630e-01]hash_cache_v1:  91%|######### | 2724/3000 [2:23:40<12:10,  2.65s/it, lr: 1.0e-04 loss: 1.630e-01]hash_cache_v1:  91%|######### | 2724/3000 [2:23:40<12:10,  2.65s/it, lr: 1.0e-04 loss: 1.630e-01]hash_cache_v1:  91%|######### | 2724/3000 [2:23:43<12:10,  2.65s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  91%|######### | 2724/3000 [2:23:43<12:10,  2.65s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  91%|######### | 2725/3000 [2:23:43<12:28,  2.72s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  91%|######### | 2725/3000 [2:23:43<12:28,  2.72s/it, lr: 1.0e-04 loss: 1.702e-01]hash_cache_v1:  91%|######### | 2725/3000 [2:23:46<12:28,  2.72s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  91%|######### | 2725/3000 [2:23:46<12:28,  2.72s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  91%|######### | 2726/3000 [2:23:46<13:27,  2.95s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  91%|######### | 2726/3000 [2:23:46<13:27,  2.95s/it, lr: 1.0e-04 loss: 1.399e-01]hash_cache_v1:  91%|######### | 2726/3000 [2:23:49<13:27,  2.95s/it, lr: 1.0e-04 loss: 1.401e-01]hash_cache_v1:  91%|######### | 2726/3000 [2:23:49<13:27,  2.95s/it, lr: 1.0e-04 loss: 1.401e-01]hash_cache_v1:  91%|######### | 2727/3000 [2:23:49<13:08,  2.89s/it, lr: 1.0e-04 loss: 1.401e-01]hash_cache_v1:  91%|######### | 2727/3000 [2:23:49<13:08,  2.89s/it, lr: 1.0e-04 loss: 1.401e-01]hash_cache_v1:  91%|######### | 2727/3000 [2:23:52<13:08,  2.89s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  91%|######### | 2727/3000 [2:23:52<13:08,  2.89s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  91%|######### | 2728/3000 [2:23:52<13:02,  2.88s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  91%|######### | 2728/3000 [2:23:52<13:02,  2.88s/it, lr: 1.0e-04 loss: 1.342e-01]hash_cache_v1:  91%|######### | 2728/3000 [2:23:56<13:02,  2.88s/it, lr: 1.0e-04 loss: 6.200e-02]hash_cache_v1:  91%|######### | 2728/3000 [2:23:56<13:02,  2.88s/it, lr: 1.0e-04 loss: 6.200e-02]hash_cache_v1:  91%|######### | 2729/3000 [2:23:56<14:58,  3.32s/it, lr: 1.0e-04 loss: 6.200e-02]hash_cache_v1:  91%|######### | 2729/3000 [2:23:56<14:58,  3.32s/it, lr: 1.0e-04 loss: 6.200e-02]hash_cache_v1:  91%|######### | 2729/3000 [2:23:59<14:58,  3.32s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  91%|######### | 2729/3000 [2:23:59<14:58,  3.32s/it, lr: 1.0e-04 loss: 1.163e-01]hash_cache_v1:  91%|#########1| 2730/3000 [2:24:04<14:55,  3.32s/it, lr: 1.0e-04 loss: 3.917e-02]hash_cache_v1:  91%|#########1| 2730/3000 [2:24:04<14:55,  3.32s/it, lr: 1.0e-04 loss: 3.917e-02]hash_cache_v1:  91%|#########1| 2731/3000 [2:24:04<12:34,  2.81s/it, lr: 1.0e-04 loss: 3.917e-02]hash_cache_v1:  91%|#########1| 2731/3000 [2:24:04<12:34,  2.81s/it, lr: 1.0e-04 loss: 3.917e-02]hash_cache_v1:  91%|#########1| 2731/3000 [2:24:08<12:34,  2.81s/it, lr: 1.0e-04 loss: 4.933e-02]hash_cache_v1:  91%|#########1| 2731/3000 [2:24:08<12:34,  2.81s/it, lr: 1.0e-04 loss: 4.933e-02]hash_cache_v1:  91%|#########1| 2732/3000 [2:24:08<14:18,  3.20s/it, lr: 1.0e-04 loss: 4.933e-02]hash_cache_v1:  91%|#########1| 2732/3000 [2:24:08<14:18,  3.20s/it, lr: 1.0e-04 loss: 4.933e-02]hash_cache_v1:  91%|#########1| 2732/3000 [2:24:11<14:18,  3.20s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  91%|#########1| 2732/3000 [2:24:11<14:18,  3.20s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  91%|#########1| 2733/3000 [2:24:11<14:23,  3.23s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  91%|#########1| 2733/3000 [2:24:11<14:23,  3.23s/it, lr: 1.0e-04 loss: 1.186e-01]hash_cache_v1:  91%|#########1| 2733/3000 [2:24:14<14:23,  3.23s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  91%|#########1| 2733/3000 [2:24:14<14:23,  3.23s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  91%|#########1| 2734/3000 [2:24:14<13:42,  3.09s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  91%|#########1| 2734/3000 [2:24:14<13:42,  3.09s/it, lr: 1.0e-04 loss: 4.572e-02]hash_cache_v1:  91%|#########1| 2734/3000 [2:24:19<13:42,  3.09s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  91%|#########1| 2734/3000 [2:24:19<13:42,  3.09s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  91%|#########1| 2735/3000 [2:24:19<15:23,  3.48s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  91%|#########1| 2735/3000 [2:24:19<15:23,  3.48s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  91%|#########1| 2735/3000 [2:24:22<15:23,  3.48s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  91%|#########1| 2735/3000 [2:24:22<15:23,  3.48s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  91%|#########1| 2736/3000 [2:24:22<15:02,  3.42s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  91%|#########1| 2736/3000 [2:24:22<15:02,  3.42s/it, lr: 1.0e-04 loss: 1.361e-01]hash_cache_v1:  91%|#########1| 2736/3000 [2:24:27<15:02,  3.42s/it, lr: 1.0e-04 loss: 8.564e-02]hash_cache_v1:  91%|#########1| 2736/3000 [2:24:27<15:02,  3.42s/it, lr: 1.0e-04 loss: 8.564e-02]hash_cache_v1:  91%|#########1| 2737/3000 [2:24:27<16:35,  3.78s/it, lr: 1.0e-04 loss: 8.564e-02]hash_cache_v1:  91%|#########1| 2737/3000 [2:24:27<16:35,  3.78s/it, lr: 1.0e-04 loss: 8.564e-02]hash_cache_v1:  91%|#########1| 2737/3000 [2:24:30<16:35,  3.78s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  91%|#########1| 2737/3000 [2:24:30<16:35,  3.78s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  91%|#########1| 2738/3000 [2:24:30<15:29,  3.55s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  91%|#########1| 2738/3000 [2:24:30<15:29,  3.55s/it, lr: 1.0e-04 loss: 1.209e-01]hash_cache_v1:  91%|#########1| 2738/3000 [2:24:33<15:29,  3.55s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  91%|#########1| 2738/3000 [2:24:33<15:29,  3.55s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  91%|#########1| 2739/3000 [2:24:33<14:41,  3.38s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  91%|#########1| 2739/3000 [2:24:33<14:41,  3.38s/it, lr: 1.0e-04 loss: 1.366e-01]hash_cache_v1:  91%|#########1| 2739/3000 [2:24:37<14:41,  3.38s/it, lr: 1.0e-04 loss: 8.323e-02]hash_cache_v1:  91%|#########1| 2739/3000 [2:24:37<14:41,  3.38s/it, lr: 1.0e-04 loss: 8.323e-02]hash_cache_v1:  91%|#########1| 2740/3000 [2:24:40<14:37,  3.38s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  91%|#########1| 2740/3000 [2:24:40<14:37,  3.38s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  91%|#########1| 2741/3000 [2:24:40<10:53,  2.52s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  91%|#########1| 2741/3000 [2:24:40<10:53,  2.52s/it, lr: 1.0e-04 loss: 8.527e-02]hash_cache_v1:  91%|#########1| 2741/3000 [2:24:42<10:53,  2.52s/it, lr: 1.0e-04 loss: 1.548e-01]hash_cache_v1:  91%|#########1| 2741/3000 [2:24:42<10:53,  2.52s/it, lr: 1.0e-04 loss: 1.548e-01]hash_cache_v1:  91%|#########1| 2742/3000 [2:24:42<10:24,  2.42s/it, lr: 1.0e-04 loss: 1.548e-01]hash_cache_v1:  91%|#########1| 2742/3000 [2:24:42<10:24,  2.42s/it, lr: 1.0e-04 loss: 1.548e-01]hash_cache_v1:  91%|#########1| 2742/3000 [2:24:45<10:24,  2.42s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  91%|#########1| 2742/3000 [2:24:45<10:24,  2.42s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  91%|#########1| 2743/3000 [2:24:45<10:48,  2.52s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  91%|#########1| 2743/3000 [2:24:45<10:48,  2.52s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  91%|#########1| 2743/3000 [2:24:48<10:48,  2.52s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  91%|#########1| 2743/3000 [2:24:48<10:48,  2.52s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  91%|#########1| 2744/3000 [2:24:48<11:22,  2.67s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  91%|#########1| 2744/3000 [2:24:48<11:22,  2.67s/it, lr: 1.0e-04 loss: 1.571e-01]hash_cache_v1:  91%|#########1| 2744/3000 [2:24:52<11:22,  2.67s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  91%|#########1| 2744/3000 [2:24:52<11:22,  2.67s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  92%|#########1| 2745/3000 [2:24:52<13:12,  3.11s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  92%|#########1| 2745/3000 [2:24:52<13:12,  3.11s/it, lr: 1.0e-04 loss: 9.490e-02]hash_cache_v1:  92%|#########1| 2745/3000 [2:24:56<13:12,  3.11s/it, lr: 1.0e-04 loss: 3.496e-02]hash_cache_v1:  92%|#########1| 2745/3000 [2:24:56<13:12,  3.11s/it, lr: 1.0e-04 loss: 3.496e-02]hash_cache_v1:  92%|#########1| 2746/3000 [2:24:56<14:30,  3.43s/it, lr: 1.0e-04 loss: 3.496e-02]hash_cache_v1:  92%|#########1| 2746/3000 [2:24:56<14:30,  3.43s/it, lr: 1.0e-04 loss: 3.496e-02]hash_cache_v1:  92%|#########1| 2746/3000 [2:24:58<14:30,  3.43s/it, lr: 1.0e-04 loss: 5.023e-02]hash_cache_v1:  92%|#########1| 2746/3000 [2:24:58<14:30,  3.43s/it, lr: 1.0e-04 loss: 5.023e-02]hash_cache_v1:  92%|#########1| 2747/3000 [2:24:58<12:54,  3.06s/it, lr: 1.0e-04 loss: 5.023e-02]hash_cache_v1:  92%|#########1| 2747/3000 [2:24:58<12:54,  3.06s/it, lr: 1.0e-04 loss: 5.023e-02]hash_cache_v1:  92%|#########1| 2747/3000 [2:25:03<12:54,  3.06s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  92%|#########1| 2747/3000 [2:25:03<12:54,  3.06s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  92%|#########1| 2748/3000 [2:25:03<14:35,  3.47s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  92%|#########1| 2748/3000 [2:25:03<14:35,  3.47s/it, lr: 1.0e-04 loss: 1.013e-01]hash_cache_v1:  92%|#########1| 2748/3000 [2:25:06<14:35,  3.47s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  92%|#########1| 2748/3000 [2:25:06<14:35,  3.47s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  92%|#########1| 2749/3000 [2:25:06<13:46,  3.29s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  92%|#########1| 2749/3000 [2:25:06<13:46,  3.29s/it, lr: 1.0e-04 loss: 1.298e-01]hash_cache_v1:  92%|#########1| 2749/3000 [2:25:09<13:46,  3.29s/it, lr: 1.0e-04 loss: 5.642e-02]hash_cache_v1:  92%|#########1| 2749/3000 [2:25:09<13:46,  3.29s/it, lr: 1.0e-04 loss: 5.642e-02]
+Saving at step 2750
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000002750.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
+Removing old save: /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1_000001750.safetensors
+
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s][A[A
+
+Generating Images:  25%|##5       | 1/4 [01:13<03:41, 73.71s/it]Generating Images:  25%|##5       | 1/4 [01:13<03:41, 73.71s/it][A[A
+
+Generating Images:  50%|#####     | 2/4 [02:28<02:28, 74.34s/it]Generating Images:  50%|#####     | 2/4 [02:28<02:28, 74.34s/it][A[A
+
+Generating Images:  75%|#######5  | 3/4 [03:42<01:14, 74.09s/it]Generating Images:  75%|#######5  | 3/4 [03:42<01:14, 74.09s/it][A[A
+
+Generating Images: 100%|##########| 4/4 [04:55<00:00, 73.81s/it]Generating Images: 100%|##########| 4/4 [04:55<00:00, 73.81s/it][A[A
+
+                                                                                                                                [A[Ahash_cache_v1:  92%|#########1| 2750/3000 [2:25:13<13:43,  3.29s/it, lr: 1.0e-04 loss: 1.264e-01]hash_cache_v1:  92%|#########1| 2750/3000 [2:25:13<13:43,  3.29s/it, lr: 1.0e-04 loss: 1.264e-01]hash_cache_v1:  92%|#########1| 2751/3000 [2:25:13<11:46,  2.84s/it, lr: 1.0e-04 loss: 1.264e-01]hash_cache_v1:  92%|#########1| 2751/3000 [2:25:13<11:46,  2.84s/it, lr: 1.0e-04 loss: 1.264e-01]hash_cache_v1:  92%|#########1| 2751/3000 [2:25:15<11:46,  2.84s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  92%|#########1| 2751/3000 [2:25:15<11:46,  2.84s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  92%|#########1| 2752/3000 [2:25:15<10:59,  2.66s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  92%|#########1| 2752/3000 [2:25:15<10:59,  2.66s/it, lr: 1.0e-04 loss: 1.721e-01]hash_cache_v1:  92%|#########1| 2752/3000 [2:25:17<10:59,  2.66s/it, lr: 1.0e-04 loss: 6.050e-02]hash_cache_v1:  92%|#########1| 2752/3000 [2:25:17<10:59,  2.66s/it, lr: 1.0e-04 loss: 6.050e-02]hash_cache_v1:  92%|#########1| 2753/3000 [2:25:17<10:20,  2.51s/it, lr: 1.0e-04 loss: 6.050e-02]hash_cache_v1:  92%|#########1| 2753/3000 [2:25:17<10:20,  2.51s/it, lr: 1.0e-04 loss: 6.050e-02]hash_cache_v1:  92%|#########1| 2753/3000 [2:25:22<10:20,  2.51s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  92%|#########1| 2753/3000 [2:25:22<10:20,  2.51s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  92%|#########1| 2754/3000 [2:25:22<12:28,  3.04s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  92%|#########1| 2754/3000 [2:25:22<12:28,  3.04s/it, lr: 1.0e-04 loss: 1.016e-01]hash_cache_v1:  92%|#########1| 2754/3000 [2:25:25<12:28,  3.04s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  92%|#########1| 2754/3000 [2:25:25<12:28,  3.04s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  92%|#########1| 2755/3000 [2:25:25<12:13,  2.99s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  92%|#########1| 2755/3000 [2:25:25<12:13,  2.99s/it, lr: 1.0e-04 loss: 1.325e-01]hash_cache_v1:  92%|#########1| 2755/3000 [2:25:29<12:13,  2.99s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  92%|#########1| 2755/3000 [2:25:29<12:13,  2.99s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  92%|#########1| 2756/3000 [2:25:29<13:45,  3.38s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  92%|#########1| 2756/3000 [2:25:29<13:45,  3.38s/it, lr: 1.0e-04 loss: 1.021e-01]hash_cache_v1:  92%|#########1| 2756/3000 [2:25:32<13:45,  3.38s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  92%|#########1| 2756/3000 [2:25:32<13:45,  3.38s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  92%|#########1| 2757/3000 [2:25:32<12:52,  3.18s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  92%|#########1| 2757/3000 [2:25:32<12:52,  3.18s/it, lr: 1.0e-04 loss: 1.369e-01]hash_cache_v1:  92%|#########1| 2757/3000 [2:25:35<12:52,  3.18s/it, lr: 1.0e-04 loss: 9.018e-03]hash_cache_v1:  92%|#########1| 2757/3000 [2:25:35<12:52,  3.18s/it, lr: 1.0e-04 loss: 9.018e-03]hash_cache_v1:  92%|#########1| 2758/3000 [2:25:35<13:00,  3.22s/it, lr: 1.0e-04 loss: 9.018e-03]hash_cache_v1:  92%|#########1| 2758/3000 [2:25:35<13:00,  3.22s/it, lr: 1.0e-04 loss: 9.018e-03]hash_cache_v1:  92%|#########1| 2758/3000 [2:25:40<13:00,  3.22s/it, lr: 1.0e-04 loss: 1.730e-01]hash_cache_v1:  92%|#########1| 2758/3000 [2:25:40<13:00,  3.22s/it, lr: 1.0e-04 loss: 1.730e-01]hash_cache_v1:  92%|#########1| 2759/3000 [2:25:40<14:22,  3.58s/it, lr: 1.0e-04 loss: 1.730e-01]hash_cache_v1:  92%|#########1| 2759/3000 [2:25:40<14:22,  3.58s/it, lr: 1.0e-04 loss: 1.730e-01]hash_cache_v1:  92%|#########1| 2759/3000 [2:25:43<14:22,  3.58s/it, lr: 1.0e-04 loss: 8.394e-02]hash_cache_v1:  92%|#########1| 2759/3000 [2:25:43<14:22,  3.58s/it, lr: 1.0e-04 loss: 8.394e-02]hash_cache_v1:  92%|#########2| 2760/3000 [2:25:47<14:18,  3.58s/it, lr: 1.0e-04 loss: 3.115e-02]hash_cache_v1:  92%|#########2| 2760/3000 [2:25:47<14:18,  3.58s/it, lr: 1.0e-04 loss: 3.115e-02]hash_cache_v1:  92%|#########2| 2761/3000 [2:25:47<11:58,  3.01s/it, lr: 1.0e-04 loss: 3.115e-02]hash_cache_v1:  92%|#########2| 2761/3000 [2:25:47<11:58,  3.01s/it, lr: 1.0e-04 loss: 3.115e-02]hash_cache_v1:  92%|#########2| 2761/3000 [2:25:52<11:58,  3.01s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  92%|#########2| 2761/3000 [2:25:52<11:58,  3.01s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  92%|#########2| 2762/3000 [2:25:52<13:15,  3.34s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  92%|#########2| 2762/3000 [2:25:52<13:15,  3.34s/it, lr: 1.0e-04 loss: 1.166e-01]hash_cache_v1:  92%|#########2| 2762/3000 [2:25:54<13:15,  3.34s/it, lr: 1.0e-04 loss: 7.674e-02]hash_cache_v1:  92%|#########2| 2762/3000 [2:25:54<13:15,  3.34s/it, lr: 1.0e-04 loss: 7.674e-02]hash_cache_v1:  92%|#########2| 2763/3000 [2:25:54<12:26,  3.15s/it, lr: 1.0e-04 loss: 7.674e-02]hash_cache_v1:  92%|#########2| 2763/3000 [2:25:54<12:26,  3.15s/it, lr: 1.0e-04 loss: 7.674e-02]hash_cache_v1:  92%|#########2| 2763/3000 [2:25:59<12:26,  3.15s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  92%|#########2| 2763/3000 [2:25:59<12:26,  3.15s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  92%|#########2| 2764/3000 [2:25:59<13:40,  3.48s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  92%|#########2| 2764/3000 [2:25:59<13:40,  3.48s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  92%|#########2| 2764/3000 [2:26:03<13:40,  3.48s/it, lr: 1.0e-04 loss: 1.005e-01]hash_cache_v1:  92%|#########2| 2764/3000 [2:26:03<13:40,  3.48s/it, lr: 1.0e-04 loss: 1.005e-01]hash_cache_v1:  92%|#########2| 2765/3000 [2:26:03<14:53,  3.80s/it, lr: 1.0e-04 loss: 1.005e-01]hash_cache_v1:  92%|#########2| 2765/3000 [2:26:03<14:53,  3.80s/it, lr: 1.0e-04 loss: 1.005e-01]hash_cache_v1:  92%|#########2| 2765/3000 [2:26:05<14:53,  3.80s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  92%|#########2| 2765/3000 [2:26:05<14:53,  3.80s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  92%|#########2| 2766/3000 [2:26:05<12:55,  3.32s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  92%|#########2| 2766/3000 [2:26:05<12:55,  3.32s/it, lr: 1.0e-04 loss: 1.435e-01]hash_cache_v1:  92%|#########2| 2766/3000 [2:26:08<12:55,  3.32s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  92%|#########2| 2766/3000 [2:26:08<12:55,  3.32s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  92%|#########2| 2767/3000 [2:26:08<12:23,  3.19s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  92%|#########2| 2767/3000 [2:26:08<12:23,  3.19s/it, lr: 1.0e-04 loss: 1.428e-01]hash_cache_v1:  92%|#########2| 2767/3000 [2:26:11<12:23,  3.19s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  92%|#########2| 2767/3000 [2:26:11<12:23,  3.19s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  92%|#########2| 2768/3000 [2:26:11<12:13,  3.16s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  92%|#########2| 2768/3000 [2:26:11<12:13,  3.16s/it, lr: 1.0e-04 loss: 1.239e-01]hash_cache_v1:  92%|#########2| 2768/3000 [2:26:13<12:13,  3.16s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  92%|#########2| 2768/3000 [2:26:13<12:13,  3.16s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  92%|#########2| 2769/3000 [2:26:13<10:58,  2.85s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  92%|#########2| 2769/3000 [2:26:13<10:58,  2.85s/it, lr: 1.0e-04 loss: 1.190e-01]hash_cache_v1:  92%|#########2| 2769/3000 [2:26:16<10:58,  2.85s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  92%|#########2| 2769/3000 [2:26:16<10:58,  2.85s/it, lr: 1.0e-04 loss: 1.535e-01]hash_cache_v1:  92%|#########2| 2770/3000 [2:26:21<10:55,  2.85s/it, lr: 1.0e-04 loss: 9.039e-02]hash_cache_v1:  92%|#########2| 2770/3000 [2:26:21<10:55,  2.85s/it, lr: 1.0e-04 loss: 9.039e-02]hash_cache_v1:  92%|#########2| 2771/3000 [2:26:21<09:40,  2.53s/it, lr: 1.0e-04 loss: 9.039e-02]hash_cache_v1:  92%|#########2| 2771/3000 [2:26:21<09:40,  2.53s/it, lr: 1.0e-04 loss: 9.039e-02]hash_cache_v1:  92%|#########2| 2771/3000 [2:26:24<09:40,  2.53s/it, lr: 1.0e-04 loss: 9.044e-02]hash_cache_v1:  92%|#########2| 2771/3000 [2:26:24<09:40,  2.53s/it, lr: 1.0e-04 loss: 9.044e-02]hash_cache_v1:  92%|#########2| 2772/3000 [2:26:24<10:10,  2.68s/it, lr: 1.0e-04 loss: 9.044e-02]hash_cache_v1:  92%|#########2| 2772/3000 [2:26:24<10:10,  2.68s/it, lr: 1.0e-04 loss: 9.044e-02]hash_cache_v1:  92%|#########2| 2772/3000 [2:26:27<10:10,  2.68s/it, lr: 1.0e-04 loss: 6.326e-02]hash_cache_v1:  92%|#########2| 2772/3000 [2:26:27<10:10,  2.68s/it, lr: 1.0e-04 loss: 6.326e-02]hash_cache_v1:  92%|#########2| 2773/3000 [2:26:27<10:20,  2.73s/it, lr: 1.0e-04 loss: 6.326e-02]hash_cache_v1:  92%|#########2| 2773/3000 [2:26:27<10:20,  2.73s/it, lr: 1.0e-04 loss: 6.326e-02]hash_cache_v1:  92%|#########2| 2773/3000 [2:26:29<10:20,  2.73s/it, lr: 1.0e-04 loss: 6.267e-02]hash_cache_v1:  92%|#########2| 2773/3000 [2:26:29<10:20,  2.73s/it, lr: 1.0e-04 loss: 6.267e-02]hash_cache_v1:  92%|#########2| 2774/3000 [2:26:29<09:39,  2.56s/it, lr: 1.0e-04 loss: 6.267e-02]hash_cache_v1:  92%|#########2| 2774/3000 [2:26:29<09:39,  2.56s/it, lr: 1.0e-04 loss: 6.267e-02]hash_cache_v1:  92%|#########2| 2774/3000 [2:26:31<09:39,  2.56s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  92%|#########2| 2774/3000 [2:26:31<09:39,  2.56s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  92%|#########2| 2775/3000 [2:26:31<09:08,  2.44s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  92%|#########2| 2775/3000 [2:26:31<09:08,  2.44s/it, lr: 1.0e-04 loss: 1.621e-02]hash_cache_v1:  92%|#########2| 2775/3000 [2:26:33<09:08,  2.44s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  92%|#########2| 2775/3000 [2:26:33<09:08,  2.44s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  93%|#########2| 2776/3000 [2:26:33<09:05,  2.44s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  93%|#########2| 2776/3000 [2:26:33<09:05,  2.44s/it, lr: 1.0e-04 loss: 1.684e-01]hash_cache_v1:  93%|#########2| 2776/3000 [2:26:35<09:05,  2.44s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  93%|#########2| 2776/3000 [2:26:35<09:05,  2.44s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  93%|#########2| 2777/3000 [2:26:35<08:41,  2.34s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  93%|#########2| 2777/3000 [2:26:35<08:41,  2.34s/it, lr: 1.0e-04 loss: 1.479e-01]hash_cache_v1:  93%|#########2| 2777/3000 [2:26:40<08:41,  2.34s/it, lr: 1.0e-04 loss: 9.364e-02]hash_cache_v1:  93%|#########2| 2777/3000 [2:26:40<08:41,  2.34s/it, lr: 1.0e-04 loss: 9.364e-02]hash_cache_v1:  93%|#########2| 2778/3000 [2:26:40<10:47,  2.92s/it, lr: 1.0e-04 loss: 9.364e-02]hash_cache_v1:  93%|#########2| 2778/3000 [2:26:40<10:47,  2.92s/it, lr: 1.0e-04 loss: 9.364e-02]hash_cache_v1:  93%|#########2| 2778/3000 [2:26:42<10:47,  2.92s/it, lr: 1.0e-04 loss: 1.495e-01]hash_cache_v1:  93%|#########2| 2778/3000 [2:26:42<10:47,  2.92s/it, lr: 1.0e-04 loss: 1.495e-01]hash_cache_v1:  93%|#########2| 2779/3000 [2:26:42<10:40,  2.90s/it, lr: 1.0e-04 loss: 1.495e-01]hash_cache_v1:  93%|#########2| 2779/3000 [2:26:42<10:40,  2.90s/it, lr: 1.0e-04 loss: 1.495e-01]hash_cache_v1:  93%|#########2| 2779/3000 [2:26:47<10:40,  2.90s/it, lr: 1.0e-04 loss: 1.025e-01]hash_cache_v1:  93%|#########2| 2779/3000 [2:26:47<10:40,  2.90s/it, lr: 1.0e-04 loss: 1.025e-01]hash_cache_v1:  93%|#########2| 2780/3000 [2:26:50<10:37,  2.90s/it, lr: 1.0e-04 loss: 1.679e-01]hash_cache_v1:  93%|#########2| 2780/3000 [2:26:50<10:37,  2.90s/it, lr: 1.0e-04 loss: 1.679e-01]hash_cache_v1:  93%|#########2| 2781/3000 [2:26:50<08:08,  2.23s/it, lr: 1.0e-04 loss: 1.679e-01]hash_cache_v1:  93%|#########2| 2781/3000 [2:26:50<08:08,  2.23s/it, lr: 1.0e-04 loss: 1.679e-01]hash_cache_v1:  93%|#########2| 2781/3000 [2:26:52<08:08,  2.23s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  93%|#########2| 2781/3000 [2:26:52<08:08,  2.23s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  93%|#########2| 2782/3000 [2:26:52<07:59,  2.20s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  93%|#########2| 2782/3000 [2:26:52<07:59,  2.20s/it, lr: 1.0e-04 loss: 1.051e-01]hash_cache_v1:  93%|#########2| 2782/3000 [2:26:55<07:59,  2.20s/it, lr: 1.0e-04 loss: 8.837e-02]hash_cache_v1:  93%|#########2| 2782/3000 [2:26:55<07:59,  2.20s/it, lr: 1.0e-04 loss: 8.837e-02]hash_cache_v1:  93%|#########2| 2783/3000 [2:26:55<08:48,  2.44s/it, lr: 1.0e-04 loss: 8.837e-02]hash_cache_v1:  93%|#########2| 2783/3000 [2:26:55<08:48,  2.44s/it, lr: 1.0e-04 loss: 8.837e-02]hash_cache_v1:  93%|#########2| 2783/3000 [2:26:58<08:48,  2.44s/it, lr: 1.0e-04 loss: 2.876e-02]hash_cache_v1:  93%|#########2| 2783/3000 [2:26:58<08:48,  2.44s/it, lr: 1.0e-04 loss: 2.876e-02]hash_cache_v1:  93%|#########2| 2784/3000 [2:26:58<09:10,  2.55s/it, lr: 1.0e-04 loss: 2.876e-02]hash_cache_v1:  93%|#########2| 2784/3000 [2:26:58<09:10,  2.55s/it, lr: 1.0e-04 loss: 2.876e-02]hash_cache_v1:  93%|#########2| 2784/3000 [2:27:00<09:10,  2.55s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  93%|#########2| 2784/3000 [2:27:00<09:10,  2.55s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  93%|#########2| 2785/3000 [2:27:00<08:41,  2.43s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  93%|#########2| 2785/3000 [2:27:00<08:41,  2.43s/it, lr: 1.0e-04 loss: 1.885e-01]hash_cache_v1:  93%|#########2| 2785/3000 [2:27:03<08:41,  2.43s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  93%|#########2| 2785/3000 [2:27:03<08:41,  2.43s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  93%|#########2| 2786/3000 [2:27:03<09:05,  2.55s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  93%|#########2| 2786/3000 [2:27:03<09:05,  2.55s/it, lr: 1.0e-04 loss: 1.154e-01]hash_cache_v1:  93%|#########2| 2786/3000 [2:27:08<09:05,  2.55s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  93%|#########2| 2786/3000 [2:27:08<09:05,  2.55s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  93%|#########2| 2787/3000 [2:27:08<11:08,  3.14s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  93%|#########2| 2787/3000 [2:27:08<11:08,  3.14s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  93%|#########2| 2787/3000 [2:27:10<11:08,  3.14s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  93%|#########2| 2787/3000 [2:27:10<11:08,  3.14s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  93%|#########2| 2788/3000 [2:27:10<10:01,  2.84s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  93%|#########2| 2788/3000 [2:27:10<10:01,  2.84s/it, lr: 1.0e-04 loss: 1.638e-01]hash_cache_v1:  93%|#########2| 2788/3000 [2:27:12<10:01,  2.84s/it, lr: 1.0e-04 loss: 3.486e-02]hash_cache_v1:  93%|#########2| 2788/3000 [2:27:12<10:01,  2.84s/it, lr: 1.0e-04 loss: 3.486e-02]hash_cache_v1:  93%|#########2| 2789/3000 [2:27:12<09:12,  2.62s/it, lr: 1.0e-04 loss: 3.486e-02]hash_cache_v1:  93%|#########2| 2789/3000 [2:27:12<09:12,  2.62s/it, lr: 1.0e-04 loss: 3.486e-02]hash_cache_v1:  93%|#########2| 2789/3000 [2:27:15<09:12,  2.62s/it, lr: 1.0e-04 loss: 2.130e-02]hash_cache_v1:  93%|#########2| 2789/3000 [2:27:15<09:12,  2.62s/it, lr: 1.0e-04 loss: 2.130e-02]hash_cache_v1:  93%|#########3| 2790/3000 [2:27:17<09:10,  2.62s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  93%|#########3| 2790/3000 [2:27:17<09:10,  2.62s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  93%|#########3| 2791/3000 [2:27:17<06:38,  1.91s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  93%|#########3| 2791/3000 [2:27:17<06:38,  1.91s/it, lr: 1.0e-04 loss: 1.618e-01]hash_cache_v1:  93%|#########3| 2791/3000 [2:27:19<06:38,  1.91s/it, lr: 1.0e-04 loss: 4.325e-03]hash_cache_v1:  93%|#########3| 2791/3000 [2:27:19<06:38,  1.91s/it, lr: 1.0e-04 loss: 4.325e-03]hash_cache_v1:  93%|#########3| 2792/3000 [2:27:19<06:47,  1.96s/it, lr: 1.0e-04 loss: 4.325e-03]hash_cache_v1:  93%|#########3| 2792/3000 [2:27:19<06:47,  1.96s/it, lr: 1.0e-04 loss: 4.325e-03]hash_cache_v1:  93%|#########3| 2792/3000 [2:27:24<06:47,  1.96s/it, lr: 1.0e-04 loss: 1.079e-01]hash_cache_v1:  93%|#########3| 2792/3000 [2:27:24<06:47,  1.96s/it, lr: 1.0e-04 loss: 1.079e-01]hash_cache_v1:  93%|#########3| 2793/3000 [2:27:24<08:49,  2.56s/it, lr: 1.0e-04 loss: 1.079e-01]hash_cache_v1:  93%|#########3| 2793/3000 [2:27:24<08:49,  2.56s/it, lr: 1.0e-04 loss: 1.079e-01]hash_cache_v1:  93%|#########3| 2793/3000 [2:27:26<08:49,  2.56s/it, lr: 1.0e-04 loss: 6.877e-02]hash_cache_v1:  93%|#########3| 2793/3000 [2:27:26<08:49,  2.56s/it, lr: 1.0e-04 loss: 6.877e-02]hash_cache_v1:  93%|#########3| 2794/3000 [2:27:26<08:40,  2.53s/it, lr: 1.0e-04 loss: 6.877e-02]hash_cache_v1:  93%|#########3| 2794/3000 [2:27:26<08:40,  2.53s/it, lr: 1.0e-04 loss: 6.877e-02]hash_cache_v1:  93%|#########3| 2794/3000 [2:27:30<08:40,  2.53s/it, lr: 1.0e-04 loss: 3.345e-02]hash_cache_v1:  93%|#########3| 2794/3000 [2:27:30<08:40,  2.53s/it, lr: 1.0e-04 loss: 3.345e-02]hash_cache_v1:  93%|#########3| 2795/3000 [2:27:30<10:16,  3.01s/it, lr: 1.0e-04 loss: 3.345e-02]hash_cache_v1:  93%|#########3| 2795/3000 [2:27:30<10:16,  3.01s/it, lr: 1.0e-04 loss: 3.345e-02]hash_cache_v1:  93%|#########3| 2795/3000 [2:27:35<10:16,  3.01s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  93%|#########3| 2795/3000 [2:27:35<10:16,  3.01s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  93%|#########3| 2796/3000 [2:27:35<11:29,  3.38s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  93%|#########3| 2796/3000 [2:27:35<11:29,  3.38s/it, lr: 1.0e-04 loss: 1.607e-01]hash_cache_v1:  93%|#########3| 2796/3000 [2:27:38<11:29,  3.38s/it, lr: 1.0e-04 loss: 5.866e-02]hash_cache_v1:  93%|#########3| 2796/3000 [2:27:38<11:29,  3.38s/it, lr: 1.0e-04 loss: 5.866e-02]hash_cache_v1:  93%|#########3| 2797/3000 [2:27:38<10:54,  3.22s/it, lr: 1.0e-04 loss: 5.866e-02]hash_cache_v1:  93%|#########3| 2797/3000 [2:27:38<10:54,  3.22s/it, lr: 1.0e-04 loss: 5.866e-02]hash_cache_v1:  93%|#########3| 2797/3000 [2:27:42<10:54,  3.22s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  93%|#########3| 2797/3000 [2:27:42<10:54,  3.22s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  93%|#########3| 2798/3000 [2:27:42<12:06,  3.60s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  93%|#########3| 2798/3000 [2:27:42<12:06,  3.60s/it, lr: 1.0e-04 loss: 1.179e-01]hash_cache_v1:  93%|#########3| 2798/3000 [2:27:46<12:06,  3.60s/it, lr: 1.0e-04 loss: 1.714e-01]hash_cache_v1:  93%|#########3| 2798/3000 [2:27:46<12:06,  3.60s/it, lr: 1.0e-04 loss: 1.714e-01]hash_cache_v1:  93%|#########3| 2799/3000 [2:27:46<12:40,  3.78s/it, lr: 1.0e-04 loss: 1.714e-01]hash_cache_v1:  93%|#########3| 2799/3000 [2:27:46<12:40,  3.78s/it, lr: 1.0e-04 loss: 1.714e-01]hash_cache_v1:  93%|#########3| 2799/3000 [2:27:49<12:40,  3.78s/it, lr: 1.0e-04 loss: 4.661e-02]hash_cache_v1:  93%|#########3| 2799/3000 [2:27:49<12:40,  3.78s/it, lr: 1.0e-04 loss: 4.661e-02]hash_cache_v1:  93%|#########3| 2800/3000 [2:27:52<12:36,  3.78s/it, lr: 1.0e-04 loss: 8.955e-02]hash_cache_v1:  93%|#########3| 2800/3000 [2:27:52<12:36,  3.78s/it, lr: 1.0e-04 loss: 8.955e-02]hash_cache_v1:  93%|#########3| 2801/3000 [2:27:52<09:11,  2.77s/it, lr: 1.0e-04 loss: 8.955e-02]hash_cache_v1:  93%|#########3| 2801/3000 [2:27:52<09:11,  2.77s/it, lr: 1.0e-04 loss: 8.955e-02]hash_cache_v1:  93%|#########3| 2801/3000 [2:27:57<09:11,  2.77s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  93%|#########3| 2801/3000 [2:27:57<09:11,  2.77s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  93%|#########3| 2802/3000 [2:27:57<10:23,  3.15s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  93%|#########3| 2802/3000 [2:27:57<10:23,  3.15s/it, lr: 1.0e-04 loss: 1.091e-01]hash_cache_v1:  93%|#########3| 2802/3000 [2:27:59<10:23,  3.15s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  93%|#########3| 2802/3000 [2:27:59<10:23,  3.15s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  93%|#########3| 2803/3000 [2:27:59<10:06,  3.08s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  93%|#########3| 2803/3000 [2:27:59<10:06,  3.08s/it, lr: 1.0e-04 loss: 1.388e-01]hash_cache_v1:  93%|#########3| 2803/3000 [2:28:02<10:06,  3.08s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  93%|#########3| 2803/3000 [2:28:02<10:06,  3.08s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  93%|#########3| 2804/3000 [2:28:02<09:12,  2.82s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  93%|#########3| 2804/3000 [2:28:02<09:12,  2.82s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  93%|#########3| 2804/3000 [2:28:05<09:12,  2.82s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  93%|#########3| 2804/3000 [2:28:05<09:12,  2.82s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  94%|#########3| 2805/3000 [2:28:05<09:26,  2.91s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  94%|#########3| 2805/3000 [2:28:05<09:26,  2.91s/it, lr: 1.0e-04 loss: 1.173e-01]hash_cache_v1:  94%|#########3| 2805/3000 [2:28:09<09:26,  2.91s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  94%|#########3| 2805/3000 [2:28:09<09:26,  2.91s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  94%|#########3| 2806/3000 [2:28:09<10:43,  3.32s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  94%|#########3| 2806/3000 [2:28:09<10:43,  3.32s/it, lr: 1.0e-04 loss: 1.687e-01]hash_cache_v1:  94%|#########3| 2806/3000 [2:28:11<10:43,  3.32s/it, lr: 1.0e-04 loss: 2.154e-01]hash_cache_v1:  94%|#########3| 2806/3000 [2:28:11<10:43,  3.32s/it, lr: 1.0e-04 loss: 2.154e-01]hash_cache_v1:  94%|#########3| 2807/3000 [2:28:11<09:33,  2.97s/it, lr: 1.0e-04 loss: 2.154e-01]hash_cache_v1:  94%|#########3| 2807/3000 [2:28:11<09:33,  2.97s/it, lr: 1.0e-04 loss: 2.154e-01]hash_cache_v1:  94%|#########3| 2807/3000 [2:28:13<09:33,  2.97s/it, lr: 1.0e-04 loss: 9.890e-02]hash_cache_v1:  94%|#########3| 2807/3000 [2:28:13<09:33,  2.97s/it, lr: 1.0e-04 loss: 9.890e-02]hash_cache_v1:  94%|#########3| 2808/3000 [2:28:13<08:41,  2.72s/it, lr: 1.0e-04 loss: 9.890e-02]hash_cache_v1:  94%|#########3| 2808/3000 [2:28:13<08:41,  2.72s/it, lr: 1.0e-04 loss: 9.890e-02]hash_cache_v1:  94%|#########3| 2808/3000 [2:28:16<08:41,  2.72s/it, lr: 1.0e-04 loss: 2.091e-01]hash_cache_v1:  94%|#########3| 2808/3000 [2:28:16<08:41,  2.72s/it, lr: 1.0e-04 loss: 2.091e-01]hash_cache_v1:  94%|#########3| 2809/3000 [2:28:16<08:22,  2.63s/it, lr: 1.0e-04 loss: 2.091e-01]hash_cache_v1:  94%|#########3| 2809/3000 [2:28:16<08:22,  2.63s/it, lr: 1.0e-04 loss: 2.091e-01]hash_cache_v1:  94%|#########3| 2809/3000 [2:28:20<08:22,  2.63s/it, lr: 1.0e-04 loss: 1.107e-01]hash_cache_v1:  94%|#########3| 2809/3000 [2:28:20<08:22,  2.63s/it, lr: 1.0e-04 loss: 1.107e-01]hash_cache_v1:  94%|#########3| 2810/3000 [2:28:22<08:20,  2.63s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  94%|#########3| 2810/3000 [2:28:22<08:20,  2.63s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  94%|#########3| 2811/3000 [2:28:22<06:00,  1.91s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  94%|#########3| 2811/3000 [2:28:22<06:00,  1.91s/it, lr: 1.0e-04 loss: 1.054e-01]hash_cache_v1:  94%|#########3| 2811/3000 [2:28:27<06:00,  1.91s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  94%|#########3| 2811/3000 [2:28:27<06:00,  1.91s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  94%|#########3| 2812/3000 [2:28:27<07:59,  2.55s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  94%|#########3| 2812/3000 [2:28:27<07:59,  2.55s/it, lr: 1.0e-04 loss: 1.136e-01]hash_cache_v1:  94%|#########3| 2812/3000 [2:28:31<07:59,  2.55s/it, lr: 1.0e-04 loss: 4.826e-02]hash_cache_v1:  94%|#########3| 2812/3000 [2:28:31<07:59,  2.55s/it, lr: 1.0e-04 loss: 4.826e-02]hash_cache_v1:  94%|#########3| 2813/3000 [2:28:31<09:23,  3.01s/it, lr: 1.0e-04 loss: 4.826e-02]hash_cache_v1:  94%|#########3| 2813/3000 [2:28:31<09:23,  3.01s/it, lr: 1.0e-04 loss: 4.826e-02]hash_cache_v1:  94%|#########3| 2813/3000 [2:28:34<09:23,  3.01s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  94%|#########3| 2813/3000 [2:28:34<09:23,  3.01s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  94%|#########3| 2814/3000 [2:28:34<09:12,  2.97s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  94%|#########3| 2814/3000 [2:28:34<09:12,  2.97s/it, lr: 1.0e-04 loss: 1.141e-01]hash_cache_v1:  94%|#########3| 2814/3000 [2:28:37<09:12,  2.97s/it, lr: 1.0e-04 loss: 1.082e-01]hash_cache_v1:  94%|#########3| 2814/3000 [2:28:37<09:12,  2.97s/it, lr: 1.0e-04 loss: 1.082e-01]hash_cache_v1:  94%|#########3| 2815/3000 [2:28:37<09:04,  2.95s/it, lr: 1.0e-04 loss: 1.082e-01]hash_cache_v1:  94%|#########3| 2815/3000 [2:28:37<09:04,  2.95s/it, lr: 1.0e-04 loss: 1.082e-01]hash_cache_v1:  94%|#########3| 2815/3000 [2:28:40<09:04,  2.95s/it, lr: 1.0e-04 loss: 3.349e-02]hash_cache_v1:  94%|#########3| 2815/3000 [2:28:40<09:04,  2.95s/it, lr: 1.0e-04 loss: 3.349e-02]hash_cache_v1:  94%|#########3| 2816/3000 [2:28:40<09:11,  3.00s/it, lr: 1.0e-04 loss: 3.349e-02]hash_cache_v1:  94%|#########3| 2816/3000 [2:28:40<09:11,  3.00s/it, lr: 1.0e-04 loss: 3.349e-02]hash_cache_v1:  94%|#########3| 2816/3000 [2:28:43<09:11,  3.00s/it, lr: 1.0e-04 loss: 8.381e-02]hash_cache_v1:  94%|#########3| 2816/3000 [2:28:43<09:11,  3.00s/it, lr: 1.0e-04 loss: 8.381e-02]hash_cache_v1:  94%|#########3| 2817/3000 [2:28:43<08:56,  2.93s/it, lr: 1.0e-04 loss: 8.381e-02]hash_cache_v1:  94%|#########3| 2817/3000 [2:28:43<08:56,  2.93s/it, lr: 1.0e-04 loss: 8.381e-02]hash_cache_v1:  94%|#########3| 2817/3000 [2:28:45<08:56,  2.93s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  94%|#########3| 2817/3000 [2:28:45<08:56,  2.93s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  94%|#########3| 2818/3000 [2:28:45<08:44,  2.88s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  94%|#########3| 2818/3000 [2:28:45<08:44,  2.88s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  94%|#########3| 2818/3000 [2:28:48<08:44,  2.88s/it, lr: 1.0e-04 loss: 5.737e-02]hash_cache_v1:  94%|#########3| 2818/3000 [2:28:48<08:44,  2.88s/it, lr: 1.0e-04 loss: 5.737e-02]hash_cache_v1:  94%|#########3| 2819/3000 [2:28:48<08:41,  2.88s/it, lr: 1.0e-04 loss: 5.737e-02]hash_cache_v1:  94%|#########3| 2819/3000 [2:28:48<08:41,  2.88s/it, lr: 1.0e-04 loss: 5.737e-02]hash_cache_v1:  94%|#########3| 2819/3000 [2:28:53<08:41,  2.88s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  94%|#########3| 2819/3000 [2:28:53<08:41,  2.88s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  94%|#########3| 2820/3000 [2:28:57<08:38,  2.88s/it, lr: 1.0e-04 loss: 1.033e-02]hash_cache_v1:  94%|#########3| 2820/3000 [2:28:57<08:38,  2.88s/it, lr: 1.0e-04 loss: 1.033e-02]hash_cache_v1:  94%|#########4| 2821/3000 [2:28:57<07:36,  2.55s/it, lr: 1.0e-04 loss: 1.033e-02]hash_cache_v1:  94%|#########4| 2821/3000 [2:28:57<07:36,  2.55s/it, lr: 1.0e-04 loss: 1.033e-02]hash_cache_v1:  94%|#########4| 2821/3000 [2:28:59<07:36,  2.55s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  94%|#########4| 2821/3000 [2:28:59<07:36,  2.55s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  94%|#########4| 2822/3000 [2:28:59<07:14,  2.44s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  94%|#########4| 2822/3000 [2:28:59<07:14,  2.44s/it, lr: 1.0e-04 loss: 1.086e-01]hash_cache_v1:  94%|#########4| 2822/3000 [2:29:04<07:14,  2.44s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  94%|#########4| 2822/3000 [2:29:04<07:14,  2.44s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  94%|#########4| 2823/3000 [2:29:04<08:47,  2.98s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  94%|#########4| 2823/3000 [2:29:04<08:47,  2.98s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  94%|#########4| 2823/3000 [2:29:07<08:47,  2.98s/it, lr: 1.0e-04 loss: 7.063e-02]hash_cache_v1:  94%|#########4| 2823/3000 [2:29:07<08:47,  2.98s/it, lr: 1.0e-04 loss: 7.063e-02]hash_cache_v1:  94%|#########4| 2824/3000 [2:29:07<08:38,  2.94s/it, lr: 1.0e-04 loss: 7.063e-02]hash_cache_v1:  94%|#########4| 2824/3000 [2:29:07<08:38,  2.94s/it, lr: 1.0e-04 loss: 7.063e-02]hash_cache_v1:  94%|#########4| 2824/3000 [2:29:09<08:38,  2.94s/it, lr: 1.0e-04 loss: 6.556e-02]hash_cache_v1:  94%|#########4| 2824/3000 [2:29:09<08:38,  2.94s/it, lr: 1.0e-04 loss: 6.556e-02]hash_cache_v1:  94%|#########4| 2825/3000 [2:29:09<07:54,  2.71s/it, lr: 1.0e-04 loss: 6.556e-02]hash_cache_v1:  94%|#########4| 2825/3000 [2:29:09<07:54,  2.71s/it, lr: 1.0e-04 loss: 6.556e-02]hash_cache_v1:  94%|#########4| 2825/3000 [2:29:12<07:54,  2.71s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  94%|#########4| 2825/3000 [2:29:12<07:54,  2.71s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  94%|#########4| 2826/3000 [2:29:12<07:59,  2.75s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  94%|#########4| 2826/3000 [2:29:12<07:59,  2.75s/it, lr: 1.0e-04 loss: 1.512e-01]hash_cache_v1:  94%|#########4| 2826/3000 [2:29:14<07:59,  2.75s/it, lr: 1.0e-04 loss: 9.954e-02]hash_cache_v1:  94%|#########4| 2826/3000 [2:29:14<07:59,  2.75s/it, lr: 1.0e-04 loss: 9.954e-02]hash_cache_v1:  94%|#########4| 2827/3000 [2:29:14<07:40,  2.66s/it, lr: 1.0e-04 loss: 9.954e-02]hash_cache_v1:  94%|#########4| 2827/3000 [2:29:14<07:40,  2.66s/it, lr: 1.0e-04 loss: 9.954e-02]hash_cache_v1:  94%|#########4| 2827/3000 [2:29:17<07:40,  2.66s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  94%|#########4| 2827/3000 [2:29:17<07:40,  2.66s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  94%|#########4| 2828/3000 [2:29:17<07:46,  2.71s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  94%|#########4| 2828/3000 [2:29:17<07:46,  2.71s/it, lr: 1.0e-04 loss: 1.409e-01]hash_cache_v1:  94%|#########4| 2828/3000 [2:29:20<07:46,  2.71s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  94%|#########4| 2828/3000 [2:29:20<07:46,  2.71s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  94%|#########4| 2829/3000 [2:29:20<07:49,  2.75s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  94%|#########4| 2829/3000 [2:29:20<07:49,  2.75s/it, lr: 1.0e-04 loss: 1.148e-01]hash_cache_v1:  94%|#########4| 2829/3000 [2:29:24<07:49,  2.75s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  94%|#########4| 2829/3000 [2:29:24<07:49,  2.75s/it, lr: 1.0e-04 loss: 1.076e-01]hash_cache_v1:  94%|#########4| 2830/3000 [2:29:26<07:47,  2.75s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  94%|#########4| 2830/3000 [2:29:26<07:47,  2.75s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  94%|#########4| 2831/3000 [2:29:26<05:45,  2.04s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  94%|#########4| 2831/3000 [2:29:26<05:45,  2.04s/it, lr: 1.0e-04 loss: 1.466e-01]hash_cache_v1:  94%|#########4| 2831/3000 [2:29:29<05:45,  2.04s/it, lr: 1.0e-04 loss: 9.017e-02]hash_cache_v1:  94%|#########4| 2831/3000 [2:29:29<05:45,  2.04s/it, lr: 1.0e-04 loss: 9.017e-02]hash_cache_v1:  94%|#########4| 2832/3000 [2:29:29<06:17,  2.25s/it, lr: 1.0e-04 loss: 9.017e-02]hash_cache_v1:  94%|#########4| 2832/3000 [2:29:29<06:17,  2.25s/it, lr: 1.0e-04 loss: 9.017e-02]hash_cache_v1:  94%|#########4| 2832/3000 [2:29:34<06:17,  2.25s/it, lr: 1.0e-04 loss: 7.379e-02]hash_cache_v1:  94%|#########4| 2832/3000 [2:29:34<06:17,  2.25s/it, lr: 1.0e-04 loss: 7.379e-02]hash_cache_v1:  94%|#########4| 2833/3000 [2:29:34<07:44,  2.78s/it, lr: 1.0e-04 loss: 7.379e-02]hash_cache_v1:  94%|#########4| 2833/3000 [2:29:34<07:44,  2.78s/it, lr: 1.0e-04 loss: 7.379e-02]hash_cache_v1:  94%|#########4| 2833/3000 [2:29:37<07:44,  2.78s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  94%|#########4| 2833/3000 [2:29:37<07:44,  2.78s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  94%|#########4| 2834/3000 [2:29:37<07:57,  2.87s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  94%|#########4| 2834/3000 [2:29:37<07:57,  2.87s/it, lr: 1.0e-04 loss: 1.232e-01]hash_cache_v1:  94%|#########4| 2834/3000 [2:29:41<07:57,  2.87s/it, lr: 1.0e-04 loss: 4.337e-02]hash_cache_v1:  94%|#########4| 2834/3000 [2:29:41<07:57,  2.87s/it, lr: 1.0e-04 loss: 4.337e-02]hash_cache_v1:  94%|#########4| 2835/3000 [2:29:41<08:56,  3.25s/it, lr: 1.0e-04 loss: 4.337e-02]hash_cache_v1:  94%|#########4| 2835/3000 [2:29:41<08:56,  3.25s/it, lr: 1.0e-04 loss: 4.337e-02]hash_cache_v1:  94%|#########4| 2835/3000 [2:29:45<08:56,  3.25s/it, lr: 1.0e-04 loss: 2.121e-02]hash_cache_v1:  94%|#########4| 2835/3000 [2:29:45<08:56,  3.25s/it, lr: 1.0e-04 loss: 2.121e-02]hash_cache_v1:  95%|#########4| 2836/3000 [2:29:45<09:41,  3.54s/it, lr: 1.0e-04 loss: 2.121e-02]hash_cache_v1:  95%|#########4| 2836/3000 [2:29:45<09:41,  3.54s/it, lr: 1.0e-04 loss: 2.121e-02]hash_cache_v1:  95%|#########4| 2836/3000 [2:29:47<09:41,  3.54s/it, lr: 1.0e-04 loss: 1.823e-01]hash_cache_v1:  95%|#########4| 2836/3000 [2:29:47<09:41,  3.54s/it, lr: 1.0e-04 loss: 1.823e-01]hash_cache_v1:  95%|#########4| 2837/3000 [2:29:47<08:29,  3.13s/it, lr: 1.0e-04 loss: 1.823e-01]hash_cache_v1:  95%|#########4| 2837/3000 [2:29:47<08:29,  3.13s/it, lr: 1.0e-04 loss: 1.823e-01]hash_cache_v1:  95%|#########4| 2837/3000 [2:29:52<08:29,  3.13s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  95%|#########4| 2837/3000 [2:29:52<08:29,  3.13s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  95%|#########4| 2838/3000 [2:29:52<09:35,  3.55s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  95%|#########4| 2838/3000 [2:29:52<09:35,  3.55s/it, lr: 1.0e-04 loss: 1.390e-01]hash_cache_v1:  95%|#########4| 2838/3000 [2:29:55<09:35,  3.55s/it, lr: 1.0e-04 loss: 8.984e-02]hash_cache_v1:  95%|#########4| 2838/3000 [2:29:55<09:35,  3.55s/it, lr: 1.0e-04 loss: 8.984e-02]hash_cache_v1:  95%|#########4| 2839/3000 [2:29:55<08:57,  3.34s/it, lr: 1.0e-04 loss: 8.984e-02]hash_cache_v1:  95%|#########4| 2839/3000 [2:29:55<08:57,  3.34s/it, lr: 1.0e-04 loss: 8.984e-02]hash_cache_v1:  95%|#########4| 2839/3000 [2:29:59<08:57,  3.34s/it, lr: 1.0e-04 loss: 5.064e-02]hash_cache_v1:  95%|#########4| 2839/3000 [2:29:59<08:57,  3.34s/it, lr: 1.0e-04 loss: 5.064e-02]hash_cache_v1:  95%|#########4| 2840/3000 [2:30:02<08:54,  3.34s/it, lr: 1.0e-04 loss: 5.914e-02]hash_cache_v1:  95%|#########4| 2840/3000 [2:30:02<08:54,  3.34s/it, lr: 1.0e-04 loss: 5.914e-02]hash_cache_v1:  95%|#########4| 2841/3000 [2:30:02<06:18,  2.38s/it, lr: 1.0e-04 loss: 5.914e-02]hash_cache_v1:  95%|#########4| 2841/3000 [2:30:02<06:18,  2.38s/it, lr: 1.0e-04 loss: 5.914e-02]hash_cache_v1:  95%|#########4| 2841/3000 [2:30:04<06:18,  2.38s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  95%|#########4| 2841/3000 [2:30:04<06:18,  2.38s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  95%|#########4| 2842/3000 [2:30:04<06:05,  2.31s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  95%|#########4| 2842/3000 [2:30:04<06:05,  2.31s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  95%|#########4| 2842/3000 [2:30:07<06:05,  2.31s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:  95%|#########4| 2842/3000 [2:30:07<06:05,  2.31s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:  95%|#########4| 2843/3000 [2:30:07<06:26,  2.46s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:  95%|#########4| 2843/3000 [2:30:07<06:26,  2.46s/it, lr: 1.0e-04 loss: 9.224e-02]hash_cache_v1:  95%|#########4| 2843/3000 [2:30:11<06:26,  2.46s/it, lr: 1.0e-04 loss: 7.405e-02]hash_cache_v1:  95%|#########4| 2843/3000 [2:30:11<06:26,  2.46s/it, lr: 1.0e-04 loss: 7.405e-02]hash_cache_v1:  95%|#########4| 2844/3000 [2:30:11<07:41,  2.96s/it, lr: 1.0e-04 loss: 7.405e-02]hash_cache_v1:  95%|#########4| 2844/3000 [2:30:11<07:41,  2.96s/it, lr: 1.0e-04 loss: 7.405e-02]hash_cache_v1:  95%|#########4| 2844/3000 [2:30:13<07:41,  2.96s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  95%|#########4| 2844/3000 [2:30:13<07:41,  2.96s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  95%|#########4| 2845/3000 [2:30:13<07:16,  2.81s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  95%|#########4| 2845/3000 [2:30:13<07:16,  2.81s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  95%|#########4| 2845/3000 [2:30:15<07:16,  2.81s/it, lr: 1.0e-04 loss: 8.002e-02]hash_cache_v1:  95%|#########4| 2845/3000 [2:30:15<07:16,  2.81s/it, lr: 1.0e-04 loss: 8.002e-02]hash_cache_v1:  95%|#########4| 2846/3000 [2:30:15<06:42,  2.61s/it, lr: 1.0e-04 loss: 8.002e-02]hash_cache_v1:  95%|#########4| 2846/3000 [2:30:15<06:42,  2.61s/it, lr: 1.0e-04 loss: 8.002e-02]hash_cache_v1:  95%|#########4| 2846/3000 [2:30:18<06:42,  2.61s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  95%|#########4| 2846/3000 [2:30:18<06:42,  2.61s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  95%|#########4| 2847/3000 [2:30:18<06:51,  2.69s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  95%|#########4| 2847/3000 [2:30:18<06:51,  2.69s/it, lr: 1.0e-04 loss: 1.613e-01]hash_cache_v1:  95%|#########4| 2847/3000 [2:30:20<06:51,  2.69s/it, lr: 1.0e-04 loss: 8.842e-02]hash_cache_v1:  95%|#########4| 2847/3000 [2:30:20<06:51,  2.69s/it, lr: 1.0e-04 loss: 8.842e-02]hash_cache_v1:  95%|#########4| 2848/3000 [2:30:20<06:22,  2.52s/it, lr: 1.0e-04 loss: 8.842e-02]hash_cache_v1:  95%|#########4| 2848/3000 [2:30:20<06:22,  2.52s/it, lr: 1.0e-04 loss: 8.842e-02]hash_cache_v1:  95%|#########4| 2848/3000 [2:30:25<06:22,  2.52s/it, lr: 1.0e-04 loss: 7.551e-02]hash_cache_v1:  95%|#########4| 2848/3000 [2:30:25<06:22,  2.52s/it, lr: 1.0e-04 loss: 7.551e-02]hash_cache_v1:  95%|#########4| 2849/3000 [2:30:25<07:52,  3.13s/it, lr: 1.0e-04 loss: 7.551e-02]hash_cache_v1:  95%|#########4| 2849/3000 [2:30:25<07:52,  3.13s/it, lr: 1.0e-04 loss: 7.551e-02]hash_cache_v1:  95%|#########4| 2849/3000 [2:30:27<07:52,  3.13s/it, lr: 1.0e-04 loss: 1.316e-01]hash_cache_v1:  95%|#########4| 2849/3000 [2:30:27<07:52,  3.13s/it, lr: 1.0e-04 loss: 1.316e-01]hash_cache_v1:  95%|#########5| 2850/3000 [2:30:30<07:48,  3.13s/it, lr: 1.0e-04 loss: 2.367e-03]hash_cache_v1:  95%|#########5| 2850/3000 [2:30:30<07:48,  3.13s/it, lr: 1.0e-04 loss: 2.367e-03]hash_cache_v1:  95%|#########5| 2851/3000 [2:30:30<05:51,  2.36s/it, lr: 1.0e-04 loss: 2.367e-03]hash_cache_v1:  95%|#########5| 2851/3000 [2:30:30<05:51,  2.36s/it, lr: 1.0e-04 loss: 2.367e-03]hash_cache_v1:  95%|#########5| 2851/3000 [2:30:33<05:51,  2.36s/it, lr: 1.0e-04 loss: 7.246e-02]hash_cache_v1:  95%|#########5| 2851/3000 [2:30:33<05:51,  2.36s/it, lr: 1.0e-04 loss: 7.246e-02]hash_cache_v1:  95%|#########5| 2852/3000 [2:30:33<06:16,  2.55s/it, lr: 1.0e-04 loss: 7.246e-02]hash_cache_v1:  95%|#########5| 2852/3000 [2:30:33<06:16,  2.55s/it, lr: 1.0e-04 loss: 7.246e-02]hash_cache_v1:  95%|#########5| 2852/3000 [2:30:36<06:16,  2.55s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  95%|#########5| 2852/3000 [2:30:36<06:16,  2.55s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  95%|#########5| 2853/3000 [2:30:36<06:26,  2.63s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  95%|#########5| 2853/3000 [2:30:36<06:26,  2.63s/it, lr: 1.0e-04 loss: 1.404e-01]hash_cache_v1:  95%|#########5| 2853/3000 [2:30:38<06:26,  2.63s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  95%|#########5| 2853/3000 [2:30:38<06:26,  2.63s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  95%|#########5| 2854/3000 [2:30:38<06:02,  2.48s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  95%|#########5| 2854/3000 [2:30:38<06:02,  2.48s/it, lr: 1.0e-04 loss: 1.188e-01]hash_cache_v1:  95%|#########5| 2854/3000 [2:30:41<06:02,  2.48s/it, lr: 1.0e-04 loss: 2.409e-02]hash_cache_v1:  95%|#########5| 2854/3000 [2:30:41<06:02,  2.48s/it, lr: 1.0e-04 loss: 2.409e-02]hash_cache_v1:  95%|#########5| 2855/3000 [2:30:41<06:15,  2.59s/it, lr: 1.0e-04 loss: 2.409e-02]hash_cache_v1:  95%|#########5| 2855/3000 [2:30:41<06:15,  2.59s/it, lr: 1.0e-04 loss: 2.409e-02]hash_cache_v1:  95%|#########5| 2855/3000 [2:30:43<06:15,  2.59s/it, lr: 1.0e-04 loss: 8.178e-02]hash_cache_v1:  95%|#########5| 2855/3000 [2:30:43<06:15,  2.59s/it, lr: 1.0e-04 loss: 8.178e-02]hash_cache_v1:  95%|#########5| 2856/3000 [2:30:43<06:05,  2.54s/it, lr: 1.0e-04 loss: 8.178e-02]hash_cache_v1:  95%|#########5| 2856/3000 [2:30:43<06:05,  2.54s/it, lr: 1.0e-04 loss: 8.178e-02]hash_cache_v1:  95%|#########5| 2856/3000 [2:30:45<06:05,  2.54s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  95%|#########5| 2856/3000 [2:30:45<06:05,  2.54s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  95%|#########5| 2857/3000 [2:30:45<05:45,  2.41s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  95%|#########5| 2857/3000 [2:30:45<05:45,  2.41s/it, lr: 1.0e-04 loss: 1.579e-01]hash_cache_v1:  95%|#########5| 2857/3000 [2:30:50<05:45,  2.41s/it, lr: 1.0e-04 loss: 1.047e-01]hash_cache_v1:  95%|#########5| 2857/3000 [2:30:50<05:45,  2.41s/it, lr: 1.0e-04 loss: 1.047e-01]hash_cache_v1:  95%|#########5| 2858/3000 [2:30:50<07:04,  2.99s/it, lr: 1.0e-04 loss: 1.047e-01]hash_cache_v1:  95%|#########5| 2858/3000 [2:30:50<07:04,  2.99s/it, lr: 1.0e-04 loss: 1.047e-01]hash_cache_v1:  95%|#########5| 2858/3000 [2:30:54<07:04,  2.99s/it, lr: 1.0e-04 loss: 4.079e-02]hash_cache_v1:  95%|#########5| 2858/3000 [2:30:54<07:04,  2.99s/it, lr: 1.0e-04 loss: 4.079e-02]hash_cache_v1:  95%|#########5| 2859/3000 [2:30:54<07:57,  3.39s/it, lr: 1.0e-04 loss: 4.079e-02]hash_cache_v1:  95%|#########5| 2859/3000 [2:30:54<07:57,  3.39s/it, lr: 1.0e-04 loss: 4.079e-02]hash_cache_v1:  95%|#########5| 2859/3000 [2:30:57<07:57,  3.39s/it, lr: 1.0e-04 loss: 2.194e-01]hash_cache_v1:  95%|#########5| 2859/3000 [2:30:57<07:57,  3.39s/it, lr: 1.0e-04 loss: 2.194e-01]hash_cache_v1:  95%|#########5| 2860/3000 [2:30:59<07:54,  3.39s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  95%|#########5| 2860/3000 [2:30:59<07:54,  3.39s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  95%|#########5| 2861/3000 [2:30:59<05:22,  2.32s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  95%|#########5| 2861/3000 [2:30:59<05:22,  2.32s/it, lr: 1.0e-04 loss: 1.256e-01]hash_cache_v1:  95%|#########5| 2861/3000 [2:31:03<05:22,  2.32s/it, lr: 1.0e-04 loss: 3.583e-02]hash_cache_v1:  95%|#########5| 2861/3000 [2:31:03<05:22,  2.32s/it, lr: 1.0e-04 loss: 3.583e-02]hash_cache_v1:  95%|#########5| 2862/3000 [2:31:03<06:26,  2.80s/it, lr: 1.0e-04 loss: 3.583e-02]hash_cache_v1:  95%|#########5| 2862/3000 [2:31:03<06:26,  2.80s/it, lr: 1.0e-04 loss: 3.583e-02]hash_cache_v1:  95%|#########5| 2862/3000 [2:31:06<06:26,  2.80s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  95%|#########5| 2862/3000 [2:31:06<06:26,  2.80s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  95%|#########5| 2863/3000 [2:31:06<06:35,  2.89s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  95%|#########5| 2863/3000 [2:31:06<06:35,  2.89s/it, lr: 1.0e-04 loss: 1.550e-01]hash_cache_v1:  95%|#########5| 2863/3000 [2:31:08<06:35,  2.89s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  95%|#########5| 2863/3000 [2:31:08<06:35,  2.89s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  95%|#########5| 2864/3000 [2:31:08<06:03,  2.67s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  95%|#########5| 2864/3000 [2:31:08<06:03,  2.67s/it, lr: 1.0e-04 loss: 1.346e-01]hash_cache_v1:  95%|#########5| 2864/3000 [2:31:12<06:03,  2.67s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  95%|#########5| 2864/3000 [2:31:12<06:03,  2.67s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  96%|#########5| 2865/3000 [2:31:12<07:02,  3.13s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  96%|#########5| 2865/3000 [2:31:12<07:02,  3.13s/it, lr: 1.0e-04 loss: 1.199e-01]hash_cache_v1:  96%|#########5| 2865/3000 [2:31:17<07:02,  3.13s/it, lr: 1.0e-04 loss: 8.531e-02]hash_cache_v1:  96%|#########5| 2865/3000 [2:31:17<07:02,  3.13s/it, lr: 1.0e-04 loss: 8.531e-02]hash_cache_v1:  96%|#########5| 2866/3000 [2:31:17<07:44,  3.46s/it, lr: 1.0e-04 loss: 8.531e-02]hash_cache_v1:  96%|#########5| 2866/3000 [2:31:17<07:44,  3.46s/it, lr: 1.0e-04 loss: 8.531e-02]hash_cache_v1:  96%|#########5| 2866/3000 [2:31:21<07:44,  3.46s/it, lr: 1.0e-04 loss: 7.021e-02]hash_cache_v1:  96%|#########5| 2866/3000 [2:31:21<07:44,  3.46s/it, lr: 1.0e-04 loss: 7.021e-02]hash_cache_v1:  96%|#########5| 2867/3000 [2:31:21<08:21,  3.77s/it, lr: 1.0e-04 loss: 7.021e-02]hash_cache_v1:  96%|#########5| 2867/3000 [2:31:21<08:21,  3.77s/it, lr: 1.0e-04 loss: 7.021e-02]hash_cache_v1:  96%|#########5| 2867/3000 [2:31:26<08:21,  3.77s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  96%|#########5| 2867/3000 [2:31:26<08:21,  3.77s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  96%|#########5| 2868/3000 [2:31:26<08:35,  3.90s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  96%|#########5| 2868/3000 [2:31:26<08:35,  3.90s/it, lr: 1.0e-04 loss: 1.004e-01]hash_cache_v1:  96%|#########5| 2868/3000 [2:31:28<08:35,  3.90s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  96%|#########5| 2868/3000 [2:31:28<08:35,  3.90s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  96%|#########5| 2869/3000 [2:31:28<07:21,  3.37s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  96%|#########5| 2869/3000 [2:31:28<07:21,  3.37s/it, lr: 1.0e-04 loss: 1.307e-01]hash_cache_v1:  96%|#########5| 2869/3000 [2:31:32<07:21,  3.37s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  96%|#########5| 2869/3000 [2:31:32<07:21,  3.37s/it, lr: 1.0e-04 loss: 1.161e-01]hash_cache_v1:  96%|#########5| 2870/3000 [2:31:36<07:17,  3.37s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  96%|#########5| 2870/3000 [2:31:36<07:17,  3.37s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  96%|#########5| 2871/3000 [2:31:36<06:02,  2.81s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  96%|#########5| 2871/3000 [2:31:36<06:02,  2.81s/it, lr: 1.0e-04 loss: 1.002e-01]hash_cache_v1:  96%|#########5| 2871/3000 [2:31:39<06:02,  2.81s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  96%|#########5| 2871/3000 [2:31:39<06:02,  2.81s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  96%|#########5| 2872/3000 [2:31:39<05:37,  2.63s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  96%|#########5| 2872/3000 [2:31:39<05:37,  2.63s/it, lr: 1.0e-04 loss: 1.537e-01]hash_cache_v1:  96%|#########5| 2872/3000 [2:31:41<05:37,  2.63s/it, lr: 1.0e-04 loss: 1.335e-01]hash_cache_v1:  96%|#########5| 2872/3000 [2:31:41<05:37,  2.63s/it, lr: 1.0e-04 loss: 1.335e-01]hash_cache_v1:  96%|#########5| 2873/3000 [2:31:41<05:16,  2.49s/it, lr: 1.0e-04 loss: 1.335e-01]hash_cache_v1:  96%|#########5| 2873/3000 [2:31:41<05:16,  2.49s/it, lr: 1.0e-04 loss: 1.335e-01]hash_cache_v1:  96%|#########5| 2873/3000 [2:31:44<05:16,  2.49s/it, lr: 1.0e-04 loss: 9.582e-02]hash_cache_v1:  96%|#########5| 2873/3000 [2:31:44<05:16,  2.49s/it, lr: 1.0e-04 loss: 9.582e-02]hash_cache_v1:  96%|#########5| 2874/3000 [2:31:44<05:33,  2.65s/it, lr: 1.0e-04 loss: 9.582e-02]hash_cache_v1:  96%|#########5| 2874/3000 [2:31:44<05:33,  2.65s/it, lr: 1.0e-04 loss: 9.582e-02]hash_cache_v1:  96%|#########5| 2874/3000 [2:31:46<05:33,  2.65s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  96%|#########5| 2874/3000 [2:31:46<05:33,  2.65s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  96%|#########5| 2875/3000 [2:31:46<05:12,  2.50s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  96%|#########5| 2875/3000 [2:31:46<05:12,  2.50s/it, lr: 1.0e-04 loss: 1.393e-01]hash_cache_v1:  96%|#########5| 2875/3000 [2:31:49<05:12,  2.50s/it, lr: 1.0e-04 loss: 7.165e-02]hash_cache_v1:  96%|#########5| 2875/3000 [2:31:49<05:12,  2.50s/it, lr: 1.0e-04 loss: 7.165e-02]hash_cache_v1:  96%|#########5| 2876/3000 [2:31:49<05:23,  2.61s/it, lr: 1.0e-04 loss: 7.165e-02]hash_cache_v1:  96%|#########5| 2876/3000 [2:31:49<05:23,  2.61s/it, lr: 1.0e-04 loss: 7.165e-02]hash_cache_v1:  96%|#########5| 2876/3000 [2:31:51<05:23,  2.61s/it, lr: 1.0e-04 loss: 6.074e-02]hash_cache_v1:  96%|#########5| 2876/3000 [2:31:51<05:23,  2.61s/it, lr: 1.0e-04 loss: 6.074e-02]hash_cache_v1:  96%|#########5| 2877/3000 [2:31:51<05:03,  2.47s/it, lr: 1.0e-04 loss: 6.074e-02]hash_cache_v1:  96%|#########5| 2877/3000 [2:31:51<05:03,  2.47s/it, lr: 1.0e-04 loss: 6.074e-02]hash_cache_v1:  96%|#########5| 2877/3000 [2:31:54<05:03,  2.47s/it, lr: 1.0e-04 loss: 1.355e-01]hash_cache_v1:  96%|#########5| 2877/3000 [2:31:54<05:03,  2.47s/it, lr: 1.0e-04 loss: 1.355e-01]hash_cache_v1:  96%|#########5| 2878/3000 [2:31:54<05:23,  2.65s/it, lr: 1.0e-04 loss: 1.355e-01]hash_cache_v1:  96%|#########5| 2878/3000 [2:31:54<05:23,  2.65s/it, lr: 1.0e-04 loss: 1.355e-01]hash_cache_v1:  96%|#########5| 2878/3000 [2:31:57<05:23,  2.65s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  96%|#########5| 2878/3000 [2:31:57<05:23,  2.65s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  96%|#########5| 2879/3000 [2:31:57<05:28,  2.71s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  96%|#########5| 2879/3000 [2:31:57<05:28,  2.71s/it, lr: 1.0e-04 loss: 1.195e-01]hash_cache_v1:  96%|#########5| 2879/3000 [2:32:01<05:28,  2.71s/it, lr: 1.0e-04 loss: 5.867e-02]hash_cache_v1:  96%|#########5| 2879/3000 [2:32:01<05:28,  2.71s/it, lr: 1.0e-04 loss: 5.867e-02]hash_cache_v1:  96%|#########6| 2880/3000 [2:32:04<05:25,  2.71s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  96%|#########6| 2880/3000 [2:32:04<05:25,  2.71s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  96%|#########6| 2881/3000 [2:32:04<04:13,  2.13s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  96%|#########6| 2881/3000 [2:32:04<04:13,  2.13s/it, lr: 1.0e-04 loss: 1.491e-01]hash_cache_v1:  96%|#########6| 2881/3000 [2:32:09<04:13,  2.13s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  96%|#########6| 2881/3000 [2:32:09<04:13,  2.13s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  96%|#########6| 2882/3000 [2:32:09<05:27,  2.77s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  96%|#########6| 2882/3000 [2:32:09<05:27,  2.77s/it, lr: 1.0e-04 loss: 1.155e-01]hash_cache_v1:  96%|#########6| 2882/3000 [2:32:12<05:27,  2.77s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  96%|#########6| 2882/3000 [2:32:12<05:27,  2.77s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  96%|#########6| 2883/3000 [2:32:12<05:26,  2.79s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  96%|#########6| 2883/3000 [2:32:12<05:26,  2.79s/it, lr: 1.0e-04 loss: 1.321e-01]hash_cache_v1:  96%|#########6| 2883/3000 [2:32:14<05:26,  2.79s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  96%|#########6| 2883/3000 [2:32:14<05:26,  2.79s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  96%|#########6| 2884/3000 [2:32:14<05:02,  2.61s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  96%|#########6| 2884/3000 [2:32:14<05:02,  2.61s/it, lr: 1.0e-04 loss: 2.952e-02]hash_cache_v1:  96%|#########6| 2884/3000 [2:32:16<05:02,  2.61s/it, lr: 1.0e-04 loss: 6.855e-02]hash_cache_v1:  96%|#########6| 2884/3000 [2:32:16<05:02,  2.61s/it, lr: 1.0e-04 loss: 6.855e-02]hash_cache_v1:  96%|#########6| 2885/3000 [2:32:16<04:54,  2.56s/it, lr: 1.0e-04 loss: 6.855e-02]hash_cache_v1:  96%|#########6| 2885/3000 [2:32:16<04:54,  2.56s/it, lr: 1.0e-04 loss: 6.855e-02]hash_cache_v1:  96%|#########6| 2885/3000 [2:32:21<04:54,  2.56s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  96%|#########6| 2885/3000 [2:32:21<04:54,  2.56s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  96%|#########6| 2886/3000 [2:32:21<05:48,  3.06s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  96%|#########6| 2886/3000 [2:32:21<05:48,  3.06s/it, lr: 1.0e-04 loss: 1.160e-01]hash_cache_v1:  96%|#########6| 2886/3000 [2:32:25<05:48,  3.06s/it, lr: 1.0e-04 loss: 7.944e-02]hash_cache_v1:  96%|#########6| 2886/3000 [2:32:25<05:48,  3.06s/it, lr: 1.0e-04 loss: 7.944e-02]hash_cache_v1:  96%|#########6| 2887/3000 [2:32:25<06:23,  3.39s/it, lr: 1.0e-04 loss: 7.944e-02]hash_cache_v1:  96%|#########6| 2887/3000 [2:32:25<06:23,  3.39s/it, lr: 1.0e-04 loss: 7.944e-02]hash_cache_v1:  96%|#########6| 2887/3000 [2:32:29<06:23,  3.39s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  96%|#########6| 2887/3000 [2:32:29<06:23,  3.39s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  96%|#########6| 2888/3000 [2:32:29<06:50,  3.66s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  96%|#########6| 2888/3000 [2:32:29<06:50,  3.66s/it, lr: 1.0e-04 loss: 1.257e-01]hash_cache_v1:  96%|#########6| 2888/3000 [2:32:32<06:50,  3.66s/it, lr: 1.0e-04 loss: 7.714e-02]hash_cache_v1:  96%|#########6| 2888/3000 [2:32:32<06:50,  3.66s/it, lr: 1.0e-04 loss: 7.714e-02]hash_cache_v1:  96%|#########6| 2889/3000 [2:32:32<06:05,  3.29s/it, lr: 1.0e-04 loss: 7.714e-02]hash_cache_v1:  96%|#########6| 2889/3000 [2:32:32<06:05,  3.29s/it, lr: 1.0e-04 loss: 7.714e-02]hash_cache_v1:  96%|#########6| 2889/3000 [2:32:34<06:05,  3.29s/it, lr: 1.0e-04 loss: 2.045e-02]hash_cache_v1:  96%|#########6| 2889/3000 [2:32:34<06:05,  3.29s/it, lr: 1.0e-04 loss: 2.045e-02]hash_cache_v1:  96%|#########6| 2890/3000 [2:32:38<06:02,  3.29s/it, lr: 1.0e-04 loss: 9.999e-02]hash_cache_v1:  96%|#########6| 2890/3000 [2:32:38<06:02,  3.29s/it, lr: 1.0e-04 loss: 9.999e-02]hash_cache_v1:  96%|#########6| 2891/3000 [2:32:38<05:01,  2.77s/it, lr: 1.0e-04 loss: 9.999e-02]hash_cache_v1:  96%|#########6| 2891/3000 [2:32:38<05:01,  2.77s/it, lr: 1.0e-04 loss: 9.999e-02]hash_cache_v1:  96%|#########6| 2891/3000 [2:32:41<05:01,  2.77s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  96%|#########6| 2891/3000 [2:32:41<05:01,  2.77s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  96%|#########6| 2892/3000 [2:32:41<05:05,  2.83s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  96%|#########6| 2892/3000 [2:32:41<05:05,  2.83s/it, lr: 1.0e-04 loss: 1.169e-01]hash_cache_v1:  96%|#########6| 2892/3000 [2:32:45<05:05,  2.83s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  96%|#########6| 2892/3000 [2:32:45<05:05,  2.83s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  96%|#########6| 2893/3000 [2:32:45<05:44,  3.22s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  96%|#########6| 2893/3000 [2:32:45<05:44,  3.22s/it, lr: 1.0e-04 loss: 1.363e-01]hash_cache_v1:  96%|#########6| 2893/3000 [2:32:50<05:44,  3.22s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  96%|#########6| 2893/3000 [2:32:50<05:44,  3.22s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  96%|#########6| 2894/3000 [2:32:50<06:12,  3.52s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  96%|#########6| 2894/3000 [2:32:50<06:12,  3.52s/it, lr: 1.0e-04 loss: 1.103e-01]hash_cache_v1:  96%|#########6| 2894/3000 [2:32:52<06:12,  3.52s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  96%|#########6| 2894/3000 [2:32:52<06:12,  3.52s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  96%|#########6| 2895/3000 [2:32:52<05:28,  3.12s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  96%|#########6| 2895/3000 [2:32:52<05:28,  3.12s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  96%|#########6| 2895/3000 [2:32:55<05:28,  3.12s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  96%|#########6| 2895/3000 [2:32:55<05:28,  3.12s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  97%|#########6| 2896/3000 [2:32:55<05:24,  3.12s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  97%|#########6| 2896/3000 [2:32:55<05:24,  3.12s/it, lr: 1.0e-04 loss: 1.280e-01]hash_cache_v1:  97%|#########6| 2896/3000 [2:32:59<05:24,  3.12s/it, lr: 1.0e-04 loss: 1.076e-02]hash_cache_v1:  97%|#########6| 2896/3000 [2:32:59<05:24,  3.12s/it, lr: 1.0e-04 loss: 1.076e-02]hash_cache_v1:  97%|#########6| 2897/3000 [2:32:59<05:56,  3.46s/it, lr: 1.0e-04 loss: 1.076e-02]hash_cache_v1:  97%|#########6| 2897/3000 [2:32:59<05:56,  3.46s/it, lr: 1.0e-04 loss: 1.076e-02]hash_cache_v1:  97%|#########6| 2897/3000 [2:33:02<05:56,  3.46s/it, lr: 1.0e-04 loss: 8.618e-02]hash_cache_v1:  97%|#########6| 2897/3000 [2:33:02<05:56,  3.46s/it, lr: 1.0e-04 loss: 8.618e-02]hash_cache_v1:  97%|#########6| 2898/3000 [2:33:02<05:35,  3.29s/it, lr: 1.0e-04 loss: 8.618e-02]hash_cache_v1:  97%|#########6| 2898/3000 [2:33:02<05:35,  3.29s/it, lr: 1.0e-04 loss: 8.618e-02]hash_cache_v1:  97%|#########6| 2898/3000 [2:33:04<05:35,  3.29s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  97%|#########6| 2898/3000 [2:33:04<05:35,  3.29s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  97%|#########6| 2899/3000 [2:33:04<04:57,  2.94s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  97%|#########6| 2899/3000 [2:33:04<04:57,  2.94s/it, lr: 1.0e-04 loss: 1.323e-01]hash_cache_v1:  97%|#########6| 2899/3000 [2:33:07<04:57,  2.94s/it, lr: 1.0e-04 loss: 1.228e-01]hash_cache_v1:  97%|#########6| 2899/3000 [2:33:07<04:57,  2.94s/it, lr: 1.0e-04 loss: 1.228e-01]hash_cache_v1:  97%|#########6| 2900/3000 [2:33:10<04:54,  2.94s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  97%|#########6| 2900/3000 [2:33:10<04:54,  2.94s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  97%|#########6| 2901/3000 [2:33:10<03:43,  2.26s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  97%|#########6| 2901/3000 [2:33:10<03:43,  2.26s/it, lr: 1.0e-04 loss: 1.294e-01]hash_cache_v1:  97%|#########6| 2901/3000 [2:33:12<03:43,  2.26s/it, lr: 1.0e-04 loss: 3.348e-02]hash_cache_v1:  97%|#########6| 2901/3000 [2:33:12<03:43,  2.26s/it, lr: 1.0e-04 loss: 3.348e-02]hash_cache_v1:  97%|#########6| 2902/3000 [2:33:12<03:37,  2.22s/it, lr: 1.0e-04 loss: 3.348e-02]hash_cache_v1:  97%|#########6| 2902/3000 [2:33:12<03:37,  2.22s/it, lr: 1.0e-04 loss: 3.348e-02]hash_cache_v1:  97%|#########6| 2902/3000 [2:33:17<03:37,  2.22s/it, lr: 1.0e-04 loss: 4.457e-02]hash_cache_v1:  97%|#########6| 2902/3000 [2:33:17<03:37,  2.22s/it, lr: 1.0e-04 loss: 4.457e-02]hash_cache_v1:  97%|#########6| 2903/3000 [2:33:17<04:33,  2.82s/it, lr: 1.0e-04 loss: 4.457e-02]hash_cache_v1:  97%|#########6| 2903/3000 [2:33:17<04:33,  2.82s/it, lr: 1.0e-04 loss: 4.457e-02]hash_cache_v1:  97%|#########6| 2903/3000 [2:33:19<04:33,  2.82s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  97%|#########6| 2903/3000 [2:33:19<04:33,  2.82s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  97%|#########6| 2904/3000 [2:33:19<04:12,  2.63s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  97%|#########6| 2904/3000 [2:33:19<04:12,  2.63s/it, lr: 1.0e-04 loss: 1.118e-01]hash_cache_v1:  97%|#########6| 2904/3000 [2:33:21<04:12,  2.63s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  97%|#########6| 2904/3000 [2:33:21<04:12,  2.63s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  97%|#########6| 2905/3000 [2:33:21<03:56,  2.49s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  97%|#########6| 2905/3000 [2:33:21<03:56,  2.49s/it, lr: 1.0e-04 loss: 1.178e-01]hash_cache_v1:  97%|#########6| 2905/3000 [2:33:25<03:56,  2.49s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  97%|#########6| 2905/3000 [2:33:25<03:56,  2.49s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  97%|#########6| 2906/3000 [2:33:25<04:43,  3.02s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  97%|#########6| 2906/3000 [2:33:25<04:43,  3.02s/it, lr: 1.0e-04 loss: 1.349e-01]hash_cache_v1:  97%|#########6| 2906/3000 [2:33:30<04:43,  3.02s/it, lr: 1.0e-04 loss: 5.983e-02]hash_cache_v1:  97%|#########6| 2906/3000 [2:33:30<04:43,  3.02s/it, lr: 1.0e-04 loss: 5.983e-02]hash_cache_v1:  97%|#########6| 2907/3000 [2:33:30<05:21,  3.46s/it, lr: 1.0e-04 loss: 5.983e-02]hash_cache_v1:  97%|#########6| 2907/3000 [2:33:30<05:21,  3.46s/it, lr: 1.0e-04 loss: 5.983e-02]hash_cache_v1:  97%|#########6| 2907/3000 [2:33:34<05:21,  3.46s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  97%|#########6| 2907/3000 [2:33:34<05:21,  3.46s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  97%|#########6| 2908/3000 [2:33:34<05:40,  3.70s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  97%|#########6| 2908/3000 [2:33:34<05:40,  3.70s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  97%|#########6| 2908/3000 [2:33:36<05:40,  3.70s/it, lr: 1.0e-04 loss: 1.564e-01]hash_cache_v1:  97%|#########6| 2908/3000 [2:33:36<05:40,  3.70s/it, lr: 1.0e-04 loss: 1.564e-01]hash_cache_v1:  97%|#########6| 2909/3000 [2:33:36<04:54,  3.23s/it, lr: 1.0e-04 loss: 1.564e-01]hash_cache_v1:  97%|#########6| 2909/3000 [2:33:36<04:54,  3.23s/it, lr: 1.0e-04 loss: 1.564e-01]hash_cache_v1:  97%|#########6| 2909/3000 [2:33:39<04:54,  3.23s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  97%|#########6| 2909/3000 [2:33:39<04:54,  3.23s/it, lr: 1.0e-04 loss: 1.304e-01]hash_cache_v1:  97%|#########7| 2910/3000 [2:33:42<04:50,  3.23s/it, lr: 1.0e-04 loss: 8.883e-02]hash_cache_v1:  97%|#########7| 2910/3000 [2:33:42<04:50,  3.23s/it, lr: 1.0e-04 loss: 8.883e-02]hash_cache_v1:  97%|#########7| 2911/3000 [2:33:42<03:39,  2.46s/it, lr: 1.0e-04 loss: 8.883e-02]hash_cache_v1:  97%|#########7| 2911/3000 [2:33:42<03:39,  2.46s/it, lr: 1.0e-04 loss: 8.883e-02]hash_cache_v1:  97%|#########7| 2911/3000 [2:33:45<03:39,  2.46s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  97%|#########7| 2911/3000 [2:33:45<03:39,  2.46s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  97%|#########7| 2912/3000 [2:33:45<03:45,  2.56s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  97%|#########7| 2912/3000 [2:33:45<03:45,  2.56s/it, lr: 1.0e-04 loss: 1.481e-01]hash_cache_v1:  97%|#########7| 2912/3000 [2:33:48<03:45,  2.56s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  97%|#########7| 2912/3000 [2:33:48<03:45,  2.56s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  97%|#########7| 2913/3000 [2:33:48<03:48,  2.63s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  97%|#########7| 2913/3000 [2:33:48<03:48,  2.63s/it, lr: 1.0e-04 loss: 1.315e-01]hash_cache_v1:  97%|#########7| 2913/3000 [2:33:51<03:48,  2.63s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  97%|#########7| 2913/3000 [2:33:51<03:48,  2.63s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  97%|#########7| 2914/3000 [2:33:51<03:56,  2.75s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  97%|#########7| 2914/3000 [2:33:51<03:56,  2.75s/it, lr: 1.0e-04 loss: 1.114e-01]hash_cache_v1:  97%|#########7| 2914/3000 [2:33:53<03:56,  2.75s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  97%|#########7| 2914/3000 [2:33:53<03:56,  2.75s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  97%|#########7| 2915/3000 [2:33:53<03:38,  2.57s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  97%|#########7| 2915/3000 [2:33:53<03:38,  2.57s/it, lr: 1.0e-04 loss: 1.700e-01]hash_cache_v1:  97%|#########7| 2915/3000 [2:33:57<03:38,  2.57s/it, lr: 1.0e-04 loss: 5.545e-02]hash_cache_v1:  97%|#########7| 2915/3000 [2:33:57<03:38,  2.57s/it, lr: 1.0e-04 loss: 5.545e-02]hash_cache_v1:  97%|#########7| 2916/3000 [2:33:57<04:17,  3.07s/it, lr: 1.0e-04 loss: 5.545e-02]hash_cache_v1:  97%|#########7| 2916/3000 [2:33:57<04:17,  3.07s/it, lr: 1.0e-04 loss: 5.545e-02]hash_cache_v1:  97%|#########7| 2916/3000 [2:34:02<04:17,  3.07s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  97%|#########7| 2916/3000 [2:34:02<04:17,  3.07s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  97%|#########7| 2917/3000 [2:34:02<04:43,  3.42s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  97%|#########7| 2917/3000 [2:34:02<04:43,  3.42s/it, lr: 1.0e-04 loss: 1.324e-01]hash_cache_v1:  97%|#########7| 2917/3000 [2:34:04<04:43,  3.42s/it, lr: 1.0e-04 loss: 1.411e-01]hash_cache_v1:  97%|#########7| 2917/3000 [2:34:04<04:43,  3.42s/it, lr: 1.0e-04 loss: 1.411e-01]hash_cache_v1:  97%|#########7| 2918/3000 [2:34:04<04:16,  3.13s/it, lr: 1.0e-04 loss: 1.411e-01]hash_cache_v1:  97%|#########7| 2918/3000 [2:34:04<04:16,  3.13s/it, lr: 1.0e-04 loss: 1.411e-01]hash_cache_v1:  97%|#########7| 2918/3000 [2:34:08<04:16,  3.13s/it, lr: 1.0e-04 loss: 1.340e-01]hash_cache_v1:  97%|#########7| 2918/3000 [2:34:08<04:16,  3.13s/it, lr: 1.0e-04 loss: 1.340e-01]hash_cache_v1:  97%|#########7| 2919/3000 [2:34:08<04:41,  3.47s/it, lr: 1.0e-04 loss: 1.340e-01]hash_cache_v1:  97%|#########7| 2919/3000 [2:34:08<04:41,  3.47s/it, lr: 1.0e-04 loss: 1.340e-01]hash_cache_v1:  97%|#########7| 2919/3000 [2:34:11<04:41,  3.47s/it, lr: 1.0e-04 loss: 8.652e-02]hash_cache_v1:  97%|#########7| 2919/3000 [2:34:11<04:41,  3.47s/it, lr: 1.0e-04 loss: 8.652e-02]hash_cache_v1:  97%|#########7| 2920/3000 [2:34:16<04:37,  3.47s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  97%|#########7| 2920/3000 [2:34:16<04:37,  3.47s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  97%|#########7| 2921/3000 [2:34:16<03:46,  2.87s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  97%|#########7| 2921/3000 [2:34:16<03:46,  2.87s/it, lr: 1.0e-04 loss: 1.364e-01]hash_cache_v1:  97%|#########7| 2921/3000 [2:34:18<03:46,  2.87s/it, lr: 1.0e-04 loss: 3.432e-02]hash_cache_v1:  97%|#########7| 2921/3000 [2:34:18<03:46,  2.87s/it, lr: 1.0e-04 loss: 3.432e-02]hash_cache_v1:  97%|#########7| 2922/3000 [2:34:18<03:34,  2.75s/it, lr: 1.0e-04 loss: 3.432e-02]hash_cache_v1:  97%|#########7| 2922/3000 [2:34:18<03:34,  2.75s/it, lr: 1.0e-04 loss: 3.432e-02]hash_cache_v1:  97%|#########7| 2922/3000 [2:34:21<03:34,  2.75s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  97%|#########7| 2922/3000 [2:34:21<03:34,  2.75s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  97%|#########7| 2923/3000 [2:34:21<03:34,  2.79s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  97%|#########7| 2923/3000 [2:34:21<03:34,  2.79s/it, lr: 1.0e-04 loss: 1.238e-01]hash_cache_v1:  97%|#########7| 2923/3000 [2:34:25<03:34,  2.79s/it, lr: 1.0e-04 loss: 4.523e-02]hash_cache_v1:  97%|#########7| 2923/3000 [2:34:25<03:34,  2.79s/it, lr: 1.0e-04 loss: 4.523e-02]hash_cache_v1:  97%|#########7| 2924/3000 [2:34:25<04:03,  3.20s/it, lr: 1.0e-04 loss: 4.523e-02]hash_cache_v1:  97%|#########7| 2924/3000 [2:34:25<04:03,  3.20s/it, lr: 1.0e-04 loss: 4.523e-02]hash_cache_v1:  97%|#########7| 2924/3000 [2:34:28<04:03,  3.20s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  97%|#########7| 2924/3000 [2:34:28<04:03,  3.20s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  98%|#########7| 2925/3000 [2:34:28<03:43,  2.98s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  98%|#########7| 2925/3000 [2:34:28<03:43,  2.98s/it, lr: 1.0e-04 loss: 1.593e-01]hash_cache_v1:  98%|#########7| 2925/3000 [2:34:30<03:43,  2.98s/it, lr: 1.0e-04 loss: 1.352e-02]hash_cache_v1:  98%|#########7| 2925/3000 [2:34:30<03:43,  2.98s/it, lr: 1.0e-04 loss: 1.352e-02]hash_cache_v1:  98%|#########7| 2926/3000 [2:34:30<03:22,  2.73s/it, lr: 1.0e-04 loss: 1.352e-02]hash_cache_v1:  98%|#########7| 2926/3000 [2:34:30<03:22,  2.73s/it, lr: 1.0e-04 loss: 1.352e-02]hash_cache_v1:  98%|#########7| 2926/3000 [2:34:32<03:22,  2.73s/it, lr: 1.0e-04 loss: 1.711e-01]hash_cache_v1:  98%|#########7| 2926/3000 [2:34:32<03:22,  2.73s/it, lr: 1.0e-04 loss: 1.711e-01]hash_cache_v1:  98%|#########7| 2927/3000 [2:34:32<03:06,  2.55s/it, lr: 1.0e-04 loss: 1.711e-01]hash_cache_v1:  98%|#########7| 2927/3000 [2:34:32<03:06,  2.55s/it, lr: 1.0e-04 loss: 1.711e-01]hash_cache_v1:  98%|#########7| 2927/3000 [2:34:35<03:06,  2.55s/it, lr: 1.0e-04 loss: 7.591e-02]hash_cache_v1:  98%|#########7| 2927/3000 [2:34:35<03:06,  2.55s/it, lr: 1.0e-04 loss: 7.591e-02]hash_cache_v1:  98%|#########7| 2928/3000 [2:34:35<03:10,  2.64s/it, lr: 1.0e-04 loss: 7.591e-02]hash_cache_v1:  98%|#########7| 2928/3000 [2:34:35<03:10,  2.64s/it, lr: 1.0e-04 loss: 7.591e-02]hash_cache_v1:  98%|#########7| 2928/3000 [2:34:39<03:10,  2.64s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  98%|#########7| 2928/3000 [2:34:39<03:10,  2.64s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  98%|#########7| 2929/3000 [2:34:39<03:46,  3.19s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  98%|#########7| 2929/3000 [2:34:39<03:46,  3.19s/it, lr: 1.0e-04 loss: 1.251e-01]hash_cache_v1:  98%|#########7| 2929/3000 [2:34:44<03:46,  3.19s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  98%|#########7| 2929/3000 [2:34:44<03:46,  3.19s/it, lr: 1.0e-04 loss: 1.271e-01]hash_cache_v1:  98%|#########7| 2930/3000 [2:34:46<03:43,  3.19s/it, lr: 1.0e-04 loss: 9.166e-02]hash_cache_v1:  98%|#########7| 2930/3000 [2:34:46<03:43,  3.19s/it, lr: 1.0e-04 loss: 9.166e-02]hash_cache_v1:  98%|#########7| 2931/3000 [2:34:46<02:44,  2.39s/it, lr: 1.0e-04 loss: 9.166e-02]hash_cache_v1:  98%|#########7| 2931/3000 [2:34:46<02:44,  2.39s/it, lr: 1.0e-04 loss: 9.166e-02]hash_cache_v1:  98%|#########7| 2931/3000 [2:34:49<02:44,  2.39s/it, lr: 1.0e-04 loss: 2.590e-02]hash_cache_v1:  98%|#########7| 2931/3000 [2:34:49<02:44,  2.39s/it, lr: 1.0e-04 loss: 2.590e-02]hash_cache_v1:  98%|#########7| 2932/3000 [2:34:49<02:49,  2.50s/it, lr: 1.0e-04 loss: 2.590e-02]hash_cache_v1:  98%|#########7| 2932/3000 [2:34:49<02:49,  2.50s/it, lr: 1.0e-04 loss: 2.590e-02]hash_cache_v1:  98%|#########7| 2932/3000 [2:34:54<02:49,  2.50s/it, lr: 1.0e-04 loss: 5.524e-03]hash_cache_v1:  98%|#########7| 2932/3000 [2:34:54<02:49,  2.50s/it, lr: 1.0e-04 loss: 5.524e-03]hash_cache_v1:  98%|#########7| 2933/3000 [2:34:54<03:21,  3.01s/it, lr: 1.0e-04 loss: 5.524e-03]hash_cache_v1:  98%|#########7| 2933/3000 [2:34:54<03:21,  3.01s/it, lr: 1.0e-04 loss: 5.524e-03]hash_cache_v1:  98%|#########7| 2933/3000 [2:34:56<03:21,  3.01s/it, lr: 1.0e-04 loss: 1.056e-01]hash_cache_v1:  98%|#########7| 2933/3000 [2:34:56<03:21,  3.01s/it, lr: 1.0e-04 loss: 1.056e-01]hash_cache_v1:  98%|#########7| 2934/3000 [2:34:56<03:02,  2.76s/it, lr: 1.0e-04 loss: 1.056e-01]hash_cache_v1:  98%|#########7| 2934/3000 [2:34:56<03:02,  2.76s/it, lr: 1.0e-04 loss: 1.056e-01]hash_cache_v1:  98%|#########7| 2934/3000 [2:34:59<03:02,  2.76s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  98%|#########7| 2934/3000 [2:34:59<03:02,  2.76s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  98%|#########7| 2935/3000 [2:34:59<03:01,  2.79s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  98%|#########7| 2935/3000 [2:34:59<03:01,  2.79s/it, lr: 1.0e-04 loss: 1.206e-01]hash_cache_v1:  98%|#########7| 2935/3000 [2:35:02<03:01,  2.79s/it, lr: 1.0e-04 loss: 8.876e-02]hash_cache_v1:  98%|#########7| 2935/3000 [2:35:02<03:01,  2.79s/it, lr: 1.0e-04 loss: 8.876e-02]hash_cache_v1:  98%|#########7| 2936/3000 [2:35:02<03:04,  2.88s/it, lr: 1.0e-04 loss: 8.876e-02]hash_cache_v1:  98%|#########7| 2936/3000 [2:35:02<03:04,  2.88s/it, lr: 1.0e-04 loss: 8.876e-02]hash_cache_v1:  98%|#########7| 2936/3000 [2:35:06<03:04,  2.88s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  98%|#########7| 2936/3000 [2:35:06<03:04,  2.88s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  98%|#########7| 2937/3000 [2:35:06<03:28,  3.30s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  98%|#########7| 2937/3000 [2:35:06<03:28,  3.30s/it, lr: 1.0e-04 loss: 1.032e-01]hash_cache_v1:  98%|#########7| 2937/3000 [2:35:10<03:28,  3.30s/it, lr: 1.0e-04 loss: 9.509e-02]hash_cache_v1:  98%|#########7| 2937/3000 [2:35:10<03:28,  3.30s/it, lr: 1.0e-04 loss: 9.509e-02]hash_cache_v1:  98%|#########7| 2938/3000 [2:35:10<03:43,  3.60s/it, lr: 1.0e-04 loss: 9.509e-02]hash_cache_v1:  98%|#########7| 2938/3000 [2:35:10<03:43,  3.60s/it, lr: 1.0e-04 loss: 9.509e-02]hash_cache_v1:  98%|#########7| 2938/3000 [2:35:15<03:43,  3.60s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  98%|#########7| 2938/3000 [2:35:15<03:43,  3.60s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  98%|#########7| 2939/3000 [2:35:15<03:52,  3.81s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  98%|#########7| 2939/3000 [2:35:15<03:52,  3.81s/it, lr: 1.0e-04 loss: 1.227e-01]hash_cache_v1:  98%|#########7| 2939/3000 [2:35:17<03:52,  3.81s/it, lr: 1.0e-04 loss: 1.221e-01]hash_cache_v1:  98%|#########7| 2939/3000 [2:35:17<03:52,  3.81s/it, lr: 1.0e-04 loss: 1.221e-01]hash_cache_v1:  98%|#########8| 2940/3000 [2:35:22<03:48,  3.81s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  98%|#########8| 2940/3000 [2:35:22<03:48,  3.81s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  98%|#########8| 2941/3000 [2:35:22<03:00,  3.06s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  98%|#########8| 2941/3000 [2:35:22<03:00,  3.06s/it, lr: 1.0e-04 loss: 1.440e-01]hash_cache_v1:  98%|#########8| 2941/3000 [2:35:24<03:00,  3.06s/it, lr: 1.0e-04 loss: 8.864e-02]hash_cache_v1:  98%|#########8| 2941/3000 [2:35:24<03:00,  3.06s/it, lr: 1.0e-04 loss: 8.864e-02]hash_cache_v1:  98%|#########8| 2942/3000 [2:35:24<02:43,  2.82s/it, lr: 1.0e-04 loss: 8.864e-02]hash_cache_v1:  98%|#########8| 2942/3000 [2:35:24<02:43,  2.82s/it, lr: 1.0e-04 loss: 8.864e-02]hash_cache_v1:  98%|#########8| 2942/3000 [2:35:27<02:43,  2.82s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  98%|#########8| 2942/3000 [2:35:27<02:43,  2.82s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  98%|#########8| 2943/3000 [2:35:27<02:45,  2.91s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  98%|#########8| 2943/3000 [2:35:27<02:45,  2.91s/it, lr: 1.0e-04 loss: 1.319e-01]hash_cache_v1:  98%|#########8| 2943/3000 [2:35:31<02:45,  2.91s/it, lr: 1.0e-04 loss: 2.480e-02]hash_cache_v1:  98%|#########8| 2943/3000 [2:35:31<02:45,  2.91s/it, lr: 1.0e-04 loss: 2.480e-02]hash_cache_v1:  98%|#########8| 2944/3000 [2:35:31<03:04,  3.29s/it, lr: 1.0e-04 loss: 2.480e-02]hash_cache_v1:  98%|#########8| 2944/3000 [2:35:31<03:04,  3.29s/it, lr: 1.0e-04 loss: 2.480e-02]hash_cache_v1:  98%|#########8| 2944/3000 [2:35:34<03:04,  3.29s/it, lr: 1.0e-04 loss: 3.105e-02]hash_cache_v1:  98%|#########8| 2944/3000 [2:35:34<03:04,  3.29s/it, lr: 1.0e-04 loss: 3.105e-02]hash_cache_v1:  98%|#########8| 2945/3000 [2:35:34<02:54,  3.17s/it, lr: 1.0e-04 loss: 3.105e-02]hash_cache_v1:  98%|#########8| 2945/3000 [2:35:34<02:54,  3.17s/it, lr: 1.0e-04 loss: 3.105e-02]hash_cache_v1:  98%|#########8| 2945/3000 [2:35:37<02:54,  3.17s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  98%|#########8| 2945/3000 [2:35:37<02:54,  3.17s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  98%|#########8| 2946/3000 [2:35:37<02:46,  3.08s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  98%|#########8| 2946/3000 [2:35:37<02:46,  3.08s/it, lr: 1.0e-04 loss: 1.389e-01]hash_cache_v1:  98%|#########8| 2946/3000 [2:35:39<02:46,  3.08s/it, lr: 1.0e-04 loss: 7.481e-03]hash_cache_v1:  98%|#########8| 2946/3000 [2:35:39<02:46,  3.08s/it, lr: 1.0e-04 loss: 7.481e-03]hash_cache_v1:  98%|#########8| 2947/3000 [2:35:39<02:33,  2.89s/it, lr: 1.0e-04 loss: 7.481e-03]hash_cache_v1:  98%|#########8| 2947/3000 [2:35:39<02:33,  2.89s/it, lr: 1.0e-04 loss: 7.481e-03]hash_cache_v1:  98%|#########8| 2947/3000 [2:35:41<02:33,  2.89s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  98%|#########8| 2947/3000 [2:35:41<02:33,  2.89s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  98%|#########8| 2948/3000 [2:35:41<02:18,  2.66s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  98%|#########8| 2948/3000 [2:35:41<02:18,  2.66s/it, lr: 1.0e-04 loss: 1.236e-01]hash_cache_v1:  98%|#########8| 2948/3000 [2:35:43<02:18,  2.66s/it, lr: 1.0e-04 loss: 8.497e-02]hash_cache_v1:  98%|#########8| 2948/3000 [2:35:43<02:18,  2.66s/it, lr: 1.0e-04 loss: 8.497e-02]hash_cache_v1:  98%|#########8| 2949/3000 [2:35:43<02:07,  2.49s/it, lr: 1.0e-04 loss: 8.497e-02]hash_cache_v1:  98%|#########8| 2949/3000 [2:35:43<02:07,  2.49s/it, lr: 1.0e-04 loss: 8.497e-02]hash_cache_v1:  98%|#########8| 2949/3000 [2:35:46<02:07,  2.49s/it, lr: 1.0e-04 loss: 5.166e-02]hash_cache_v1:  98%|#########8| 2949/3000 [2:35:46<02:07,  2.49s/it, lr: 1.0e-04 loss: 5.166e-02]hash_cache_v1:  98%|#########8| 2950/3000 [2:35:49<02:04,  2.49s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  98%|#########8| 2950/3000 [2:35:49<02:04,  2.49s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  98%|#########8| 2951/3000 [2:35:49<01:41,  2.07s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  98%|#########8| 2951/3000 [2:35:49<01:41,  2.07s/it, lr: 1.0e-04 loss: 2.019e-01]hash_cache_v1:  98%|#########8| 2951/3000 [2:35:52<01:41,  2.07s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  98%|#########8| 2951/3000 [2:35:52<01:41,  2.07s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  98%|#########8| 2952/3000 [2:35:52<01:39,  2.08s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  98%|#########8| 2952/3000 [2:35:52<01:39,  2.08s/it, lr: 1.0e-04 loss: 1.311e-01]hash_cache_v1:  98%|#########8| 2952/3000 [2:35:54<01:39,  2.08s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  98%|#########8| 2952/3000 [2:35:54<01:39,  2.08s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  98%|#########8| 2953/3000 [2:35:54<01:38,  2.09s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  98%|#########8| 2953/3000 [2:35:54<01:38,  2.09s/it, lr: 1.0e-04 loss: 1.400e-01]hash_cache_v1:  98%|#########8| 2953/3000 [2:35:57<01:38,  2.09s/it, lr: 1.0e-04 loss: 8.038e-02]hash_cache_v1:  98%|#########8| 2953/3000 [2:35:57<01:38,  2.09s/it, lr: 1.0e-04 loss: 8.038e-02]hash_cache_v1:  98%|#########8| 2954/3000 [2:35:57<01:48,  2.36s/it, lr: 1.0e-04 loss: 8.038e-02]hash_cache_v1:  98%|#########8| 2954/3000 [2:35:57<01:48,  2.36s/it, lr: 1.0e-04 loss: 8.038e-02]hash_cache_v1:  98%|#########8| 2954/3000 [2:36:01<01:48,  2.36s/it, lr: 1.0e-04 loss: 7.137e-02]hash_cache_v1:  98%|#########8| 2954/3000 [2:36:01<01:48,  2.36s/it, lr: 1.0e-04 loss: 7.137e-02]hash_cache_v1:  98%|#########8| 2955/3000 [2:36:01<02:10,  2.90s/it, lr: 1.0e-04 loss: 7.137e-02]hash_cache_v1:  98%|#########8| 2955/3000 [2:36:01<02:10,  2.90s/it, lr: 1.0e-04 loss: 7.137e-02]hash_cache_v1:  98%|#########8| 2955/3000 [2:36:05<02:10,  2.90s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  98%|#########8| 2955/3000 [2:36:05<02:10,  2.90s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  99%|#########8| 2956/3000 [2:36:05<02:25,  3.30s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  99%|#########8| 2956/3000 [2:36:05<02:25,  3.30s/it, lr: 1.0e-04 loss: 1.345e-01]hash_cache_v1:  99%|#########8| 2956/3000 [2:36:10<02:25,  3.30s/it, lr: 1.0e-04 loss: 7.332e-02]hash_cache_v1:  99%|#########8| 2956/3000 [2:36:10<02:25,  3.30s/it, lr: 1.0e-04 loss: 7.332e-02]hash_cache_v1:  99%|#########8| 2957/3000 [2:36:10<02:34,  3.59s/it, lr: 1.0e-04 loss: 7.332e-02]hash_cache_v1:  99%|#########8| 2957/3000 [2:36:10<02:34,  3.59s/it, lr: 1.0e-04 loss: 7.332e-02]hash_cache_v1:  99%|#########8| 2957/3000 [2:36:13<02:34,  3.59s/it, lr: 1.0e-04 loss: 1.547e-02]hash_cache_v1:  99%|#########8| 2957/3000 [2:36:13<02:34,  3.59s/it, lr: 1.0e-04 loss: 1.547e-02]hash_cache_v1:  99%|#########8| 2958/3000 [2:36:13<02:24,  3.45s/it, lr: 1.0e-04 loss: 1.547e-02]hash_cache_v1:  99%|#########8| 2958/3000 [2:36:13<02:24,  3.45s/it, lr: 1.0e-04 loss: 1.547e-02]hash_cache_v1:  99%|#########8| 2958/3000 [2:36:15<02:24,  3.45s/it, lr: 1.0e-04 loss: 1.465e-01]hash_cache_v1:  99%|#########8| 2958/3000 [2:36:15<02:24,  3.45s/it, lr: 1.0e-04 loss: 1.465e-01]hash_cache_v1:  99%|#########8| 2959/3000 [2:36:15<02:05,  3.05s/it, lr: 1.0e-04 loss: 1.465e-01]hash_cache_v1:  99%|#########8| 2959/3000 [2:36:15<02:05,  3.05s/it, lr: 1.0e-04 loss: 1.465e-01]hash_cache_v1:  99%|#########8| 2959/3000 [2:36:17<02:05,  3.05s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  99%|#########8| 2959/3000 [2:36:17<02:05,  3.05s/it, lr: 1.0e-04 loss: 1.379e-01]hash_cache_v1:  99%|#########8| 2960/3000 [2:36:19<02:02,  3.05s/it, lr: 1.0e-04 loss: 2.365e-01]hash_cache_v1:  99%|#########8| 2960/3000 [2:36:19<02:02,  3.05s/it, lr: 1.0e-04 loss: 2.365e-01]hash_cache_v1:  99%|#########8| 2961/3000 [2:36:19<01:23,  2.14s/it, lr: 1.0e-04 loss: 2.365e-01]hash_cache_v1:  99%|#########8| 2961/3000 [2:36:19<01:23,  2.14s/it, lr: 1.0e-04 loss: 2.365e-01]hash_cache_v1:  99%|#########8| 2961/3000 [2:36:22<01:23,  2.14s/it, lr: 1.0e-04 loss: 4.329e-02]hash_cache_v1:  99%|#########8| 2961/3000 [2:36:22<01:23,  2.14s/it, lr: 1.0e-04 loss: 4.329e-02]hash_cache_v1:  99%|#########8| 2962/3000 [2:36:22<01:30,  2.38s/it, lr: 1.0e-04 loss: 4.329e-02]hash_cache_v1:  99%|#########8| 2962/3000 [2:36:22<01:30,  2.38s/it, lr: 1.0e-04 loss: 4.329e-02]hash_cache_v1:  99%|#########8| 2962/3000 [2:36:25<01:30,  2.38s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  99%|#########8| 2962/3000 [2:36:25<01:30,  2.38s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  99%|#########8| 2963/3000 [2:36:25<01:32,  2.51s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  99%|#########8| 2963/3000 [2:36:25<01:32,  2.51s/it, lr: 1.0e-04 loss: 1.337e-01]hash_cache_v1:  99%|#########8| 2963/3000 [2:36:27<01:32,  2.51s/it, lr: 1.0e-04 loss: 1.824e-01]hash_cache_v1:  99%|#########8| 2963/3000 [2:36:27<01:32,  2.51s/it, lr: 1.0e-04 loss: 1.824e-01]hash_cache_v1:  99%|#########8| 2964/3000 [2:36:27<01:26,  2.40s/it, lr: 1.0e-04 loss: 1.824e-01]hash_cache_v1:  99%|#########8| 2964/3000 [2:36:27<01:26,  2.40s/it, lr: 1.0e-04 loss: 1.824e-01]hash_cache_v1:  99%|#########8| 2964/3000 [2:36:30<01:26,  2.40s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  99%|#########8| 2964/3000 [2:36:30<01:26,  2.40s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  99%|#########8| 2965/3000 [2:36:30<01:24,  2.41s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  99%|#########8| 2965/3000 [2:36:30<01:24,  2.41s/it, lr: 1.0e-04 loss: 1.678e-01]hash_cache_v1:  99%|#########8| 2965/3000 [2:36:32<01:24,  2.41s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:  99%|#########8| 2965/3000 [2:36:32<01:24,  2.41s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:  99%|#########8| 2966/3000 [2:36:32<01:18,  2.32s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:  99%|#########8| 2966/3000 [2:36:32<01:18,  2.32s/it, lr: 1.0e-04 loss: 1.589e-01]hash_cache_v1:  99%|#########8| 2966/3000 [2:36:35<01:18,  2.32s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  99%|#########8| 2966/3000 [2:36:35<01:18,  2.32s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  99%|#########8| 2967/3000 [2:36:35<01:21,  2.48s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  99%|#########8| 2967/3000 [2:36:35<01:21,  2.48s/it, lr: 1.0e-04 loss: 1.059e-01]hash_cache_v1:  99%|#########8| 2967/3000 [2:36:39<01:21,  2.48s/it, lr: 1.0e-04 loss: 7.060e-02]hash_cache_v1:  99%|#########8| 2967/3000 [2:36:39<01:21,  2.48s/it, lr: 1.0e-04 loss: 7.060e-02]hash_cache_v1:  99%|#########8| 2968/3000 [2:36:39<01:36,  3.02s/it, lr: 1.0e-04 loss: 7.060e-02]hash_cache_v1:  99%|#########8| 2968/3000 [2:36:39<01:36,  3.02s/it, lr: 1.0e-04 loss: 7.060e-02]hash_cache_v1:  99%|#########8| 2968/3000 [2:36:42<01:36,  3.02s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  99%|#########8| 2968/3000 [2:36:42<01:36,  3.02s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  99%|#########8| 2969/3000 [2:36:42<01:34,  3.05s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  99%|#########8| 2969/3000 [2:36:42<01:34,  3.05s/it, lr: 1.0e-04 loss: 1.167e-01]hash_cache_v1:  99%|#########8| 2969/3000 [2:36:47<01:34,  3.05s/it, lr: 1.0e-04 loss: 5.759e-02]hash_cache_v1:  99%|#########8| 2969/3000 [2:36:47<01:34,  3.05s/it, lr: 1.0e-04 loss: 5.759e-02]hash_cache_v1:  99%|#########9| 2970/3000 [2:36:50<01:31,  3.05s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  99%|#########9| 2970/3000 [2:36:50<01:31,  3.05s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  99%|#########9| 2971/3000 [2:36:50<01:07,  2.32s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  99%|#########9| 2971/3000 [2:36:50<01:07,  2.32s/it, lr: 1.0e-04 loss: 1.267e-01]hash_cache_v1:  99%|#########9| 2971/3000 [2:36:53<01:07,  2.32s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  99%|#########9| 2971/3000 [2:36:53<01:07,  2.32s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  99%|#########9| 2972/3000 [2:36:53<01:11,  2.54s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  99%|#########9| 2972/3000 [2:36:53<01:11,  2.54s/it, lr: 1.0e-04 loss: 1.436e-01]hash_cache_v1:  99%|#########9| 2972/3000 [2:36:57<01:11,  2.54s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  99%|#########9| 2972/3000 [2:36:57<01:11,  2.54s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  99%|#########9| 2973/3000 [2:36:57<01:20,  3.00s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  99%|#########9| 2973/3000 [2:36:57<01:20,  3.00s/it, lr: 1.0e-04 loss: 1.285e-01]hash_cache_v1:  99%|#########9| 2973/3000 [2:36:59<01:20,  3.00s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  99%|#########9| 2973/3000 [2:36:59<01:20,  3.00s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  99%|#########9| 2974/3000 [2:36:59<01:11,  2.76s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  99%|#########9| 2974/3000 [2:36:59<01:11,  2.76s/it, lr: 1.0e-04 loss: 1.513e-01]hash_cache_v1:  99%|#########9| 2974/3000 [2:37:02<01:11,  2.76s/it, lr: 1.0e-04 loss: 6.747e-02]hash_cache_v1:  99%|#########9| 2974/3000 [2:37:02<01:11,  2.76s/it, lr: 1.0e-04 loss: 6.747e-02]hash_cache_v1:  99%|#########9| 2975/3000 [2:37:02<01:09,  2.78s/it, lr: 1.0e-04 loss: 6.747e-02]hash_cache_v1:  99%|#########9| 2975/3000 [2:37:02<01:09,  2.78s/it, lr: 1.0e-04 loss: 6.747e-02]hash_cache_v1:  99%|#########9| 2975/3000 [2:37:07<01:09,  2.78s/it, lr: 1.0e-04 loss: 8.827e-02]hash_cache_v1:  99%|#########9| 2975/3000 [2:37:07<01:09,  2.78s/it, lr: 1.0e-04 loss: 8.827e-02]hash_cache_v1:  99%|#########9| 2976/3000 [2:37:07<01:18,  3.28s/it, lr: 1.0e-04 loss: 8.827e-02]hash_cache_v1:  99%|#########9| 2976/3000 [2:37:07<01:18,  3.28s/it, lr: 1.0e-04 loss: 8.827e-02]hash_cache_v1:  99%|#########9| 2976/3000 [2:37:11<01:18,  3.28s/it, lr: 1.0e-04 loss: 1.282e-01]hash_cache_v1:  99%|#########9| 2976/3000 [2:37:11<01:18,  3.28s/it, lr: 1.0e-04 loss: 1.282e-01]hash_cache_v1:  99%|#########9| 2977/3000 [2:37:11<01:22,  3.58s/it, lr: 1.0e-04 loss: 1.282e-01]hash_cache_v1:  99%|#########9| 2977/3000 [2:37:11<01:22,  3.58s/it, lr: 1.0e-04 loss: 1.282e-01]hash_cache_v1:  99%|#########9| 2977/3000 [2:37:13<01:22,  3.58s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  99%|#########9| 2977/3000 [2:37:13<01:22,  3.58s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  99%|#########9| 2978/3000 [2:37:13<01:09,  3.14s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  99%|#########9| 2978/3000 [2:37:13<01:09,  3.14s/it, lr: 1.0e-04 loss: 8.024e-02]hash_cache_v1:  99%|#########9| 2978/3000 [2:37:16<01:09,  3.14s/it, lr: 1.0e-04 loss: 3.885e-02]hash_cache_v1:  99%|#########9| 2978/3000 [2:37:16<01:09,  3.14s/it, lr: 1.0e-04 loss: 3.885e-02]hash_cache_v1:  99%|#########9| 2979/3000 [2:37:16<01:04,  3.05s/it, lr: 1.0e-04 loss: 3.885e-02]hash_cache_v1:  99%|#########9| 2979/3000 [2:37:16<01:04,  3.05s/it, lr: 1.0e-04 loss: 3.885e-02]hash_cache_v1:  99%|#########9| 2979/3000 [2:37:19<01:04,  3.05s/it, lr: 1.0e-04 loss: 7.789e-02]hash_cache_v1:  99%|#########9| 2979/3000 [2:37:19<01:04,  3.05s/it, lr: 1.0e-04 loss: 7.789e-02]hash_cache_v1:  99%|#########9| 2980/3000 [2:37:21<01:00,  3.05s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  99%|#########9| 2980/3000 [2:37:21<01:00,  3.05s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  99%|#########9| 2981/3000 [2:37:21<00:40,  2.13s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  99%|#########9| 2981/3000 [2:37:21<00:40,  2.13s/it, lr: 1.0e-04 loss: 1.374e-01]hash_cache_v1:  99%|#########9| 2981/3000 [2:37:24<00:40,  2.13s/it, lr: 1.0e-04 loss: 6.157e-02]hash_cache_v1:  99%|#########9| 2981/3000 [2:37:24<00:40,  2.13s/it, lr: 1.0e-04 loss: 6.157e-02]hash_cache_v1:  99%|#########9| 2982/3000 [2:37:24<00:41,  2.28s/it, lr: 1.0e-04 loss: 6.157e-02]hash_cache_v1:  99%|#########9| 2982/3000 [2:37:24<00:41,  2.28s/it, lr: 1.0e-04 loss: 6.157e-02]hash_cache_v1:  99%|#########9| 2982/3000 [2:37:27<00:41,  2.28s/it, lr: 1.0e-04 loss: 1.375e-01]hash_cache_v1:  99%|#########9| 2982/3000 [2:37:27<00:41,  2.28s/it, lr: 1.0e-04 loss: 1.375e-01]hash_cache_v1:  99%|#########9| 2983/3000 [2:37:27<00:41,  2.43s/it, lr: 1.0e-04 loss: 1.375e-01]hash_cache_v1:  99%|#########9| 2983/3000 [2:37:27<00:41,  2.43s/it, lr: 1.0e-04 loss: 1.375e-01]hash_cache_v1:  99%|#########9| 2983/3000 [2:37:31<00:41,  2.43s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  99%|#########9| 2983/3000 [2:37:31<00:41,  2.43s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  99%|#########9| 2984/3000 [2:37:31<00:48,  3.01s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  99%|#########9| 2984/3000 [2:37:31<00:48,  3.01s/it, lr: 1.0e-04 loss: 1.278e-01]hash_cache_v1:  99%|#########9| 2984/3000 [2:37:35<00:48,  3.01s/it, lr: 1.0e-04 loss: 3.712e-02]hash_cache_v1:  99%|#########9| 2984/3000 [2:37:35<00:48,  3.01s/it, lr: 1.0e-04 loss: 3.712e-02]hash_cache_v1: 100%|#########9| 2985/3000 [2:37:35<00:50,  3.38s/it, lr: 1.0e-04 loss: 3.712e-02]hash_cache_v1: 100%|#########9| 2985/3000 [2:37:35<00:50,  3.38s/it, lr: 1.0e-04 loss: 3.712e-02]hash_cache_v1: 100%|#########9| 2985/3000 [2:37:38<00:50,  3.38s/it, lr: 1.0e-04 loss: 9.177e-02]hash_cache_v1: 100%|#########9| 2985/3000 [2:37:38<00:50,  3.38s/it, lr: 1.0e-04 loss: 9.177e-02]hash_cache_v1: 100%|#########9| 2986/3000 [2:37:38<00:45,  3.22s/it, lr: 1.0e-04 loss: 9.177e-02]hash_cache_v1: 100%|#########9| 2986/3000 [2:37:38<00:45,  3.22s/it, lr: 1.0e-04 loss: 9.177e-02]hash_cache_v1: 100%|#########9| 2986/3000 [2:37:41<00:45,  3.22s/it, lr: 1.0e-04 loss: 8.330e-02]hash_cache_v1: 100%|#########9| 2986/3000 [2:37:41<00:45,  3.22s/it, lr: 1.0e-04 loss: 8.330e-02]hash_cache_v1: 100%|#########9| 2987/3000 [2:37:41<00:41,  3.15s/it, lr: 1.0e-04 loss: 8.330e-02]hash_cache_v1: 100%|#########9| 2987/3000 [2:37:41<00:41,  3.15s/it, lr: 1.0e-04 loss: 8.330e-02]hash_cache_v1: 100%|#########9| 2987/3000 [2:37:44<00:41,  3.15s/it, lr: 1.0e-04 loss: 9.374e-02]hash_cache_v1: 100%|#########9| 2987/3000 [2:37:44<00:41,  3.15s/it, lr: 1.0e-04 loss: 9.374e-02]hash_cache_v1: 100%|#########9| 2988/3000 [2:37:44<00:36,  3.06s/it, lr: 1.0e-04 loss: 9.374e-02]hash_cache_v1: 100%|#########9| 2988/3000 [2:37:44<00:36,  3.06s/it, lr: 1.0e-04 loss: 9.374e-02]hash_cache_v1: 100%|#########9| 2988/3000 [2:37:48<00:36,  3.06s/it, lr: 1.0e-04 loss: 1.006e-01]hash_cache_v1: 100%|#########9| 2988/3000 [2:37:48<00:36,  3.06s/it, lr: 1.0e-04 loss: 1.006e-01]hash_cache_v1: 100%|#########9| 2989/3000 [2:37:48<00:37,  3.44s/it, lr: 1.0e-04 loss: 1.006e-01]hash_cache_v1: 100%|#########9| 2989/3000 [2:37:48<00:37,  3.44s/it, lr: 1.0e-04 loss: 1.006e-01]hash_cache_v1: 100%|#########9| 2989/3000 [2:37:50<00:37,  3.44s/it, lr: 1.0e-04 loss: 1.234e-01]hash_cache_v1: 100%|#########9| 2989/3000 [2:37:50<00:37,  3.44s/it, lr: 1.0e-04 loss: 1.234e-01]hash_cache_v1: 100%|#########9| 2990/3000 [2:37:53<00:34,  3.44s/it, lr: 1.0e-04 loss: 5.567e-02]hash_cache_v1: 100%|#########9| 2990/3000 [2:37:53<00:34,  3.44s/it, lr: 1.0e-04 loss: 5.567e-02]hash_cache_v1: 100%|#########9| 2991/3000 [2:37:53<00:21,  2.42s/it, lr: 1.0e-04 loss: 5.567e-02]hash_cache_v1: 100%|#########9| 2991/3000 [2:37:53<00:21,  2.42s/it, lr: 1.0e-04 loss: 5.567e-02]hash_cache_v1: 100%|#########9| 2991/3000 [2:37:56<00:21,  2.42s/it, lr: 1.0e-04 loss: 1.025e-02]hash_cache_v1: 100%|#########9| 2991/3000 [2:37:56<00:21,  2.42s/it, lr: 1.0e-04 loss: 1.025e-02]hash_cache_v1: 100%|#########9| 2992/3000 [2:37:56<00:20,  2.52s/it, lr: 1.0e-04 loss: 1.025e-02]hash_cache_v1: 100%|#########9| 2992/3000 [2:37:56<00:20,  2.52s/it, lr: 1.0e-04 loss: 1.025e-02]hash_cache_v1: 100%|#########9| 2992/3000 [2:37:59<00:20,  2.52s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1: 100%|#########9| 2992/3000 [2:37:59<00:20,  2.52s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1: 100%|#########9| 2993/3000 [2:37:59<00:18,  2.62s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1: 100%|#########9| 2993/3000 [2:37:59<00:18,  2.62s/it, lr: 1.0e-04 loss: 1.561e-01]hash_cache_v1: 100%|#########9| 2993/3000 [2:38:01<00:18,  2.62s/it, lr: 1.0e-04 loss: 4.597e-02]hash_cache_v1: 100%|#########9| 2993/3000 [2:38:01<00:18,  2.62s/it, lr: 1.0e-04 loss: 4.597e-02]hash_cache_v1: 100%|#########9| 2994/3000 [2:38:01<00:15,  2.57s/it, lr: 1.0e-04 loss: 4.597e-02]hash_cache_v1: 100%|#########9| 2994/3000 [2:38:01<00:15,  2.57s/it, lr: 1.0e-04 loss: 4.597e-02]hash_cache_v1: 100%|#########9| 2994/3000 [2:38:03<00:15,  2.57s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1: 100%|#########9| 2994/3000 [2:38:03<00:15,  2.57s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1: 100%|#########9| 2995/3000 [2:38:03<00:12,  2.44s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1: 100%|#########9| 2995/3000 [2:38:03<00:12,  2.44s/it, lr: 1.0e-04 loss: 1.034e-01]hash_cache_v1: 100%|#########9| 2995/3000 [2:38:06<00:12,  2.44s/it, lr: 1.0e-04 loss: 6.377e-02]hash_cache_v1: 100%|#########9| 2995/3000 [2:38:06<00:12,  2.44s/it, lr: 1.0e-04 loss: 6.377e-02]hash_cache_v1: 100%|#########9| 2996/3000 [2:38:06<00:10,  2.57s/it, lr: 1.0e-04 loss: 6.377e-02]hash_cache_v1: 100%|#########9| 2996/3000 [2:38:06<00:10,  2.57s/it, lr: 1.0e-04 loss: 6.377e-02]hash_cache_v1: 100%|#########9| 2996/3000 [2:38:09<00:10,  2.57s/it, lr: 1.0e-04 loss: 1.832e-01]hash_cache_v1: 100%|#########9| 2996/3000 [2:38:09<00:10,  2.57s/it, lr: 1.0e-04 loss: 1.832e-01]hash_cache_v1: 100%|#########9| 2997/3000 [2:38:09<00:07,  2.66s/it, lr: 1.0e-04 loss: 1.832e-01]hash_cache_v1: 100%|#########9| 2997/3000 [2:38:09<00:07,  2.66s/it, lr: 1.0e-04 loss: 1.832e-01]hash_cache_v1: 100%|#########9| 2997/3000 [2:38:11<00:07,  2.66s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1: 100%|#########9| 2997/3000 [2:38:11<00:07,  2.66s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1: 100%|#########9| 2998/3000 [2:38:11<00:05,  2.59s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1: 100%|#########9| 2998/3000 [2:38:11<00:05,  2.59s/it, lr: 1.0e-04 loss: 1.156e-01]hash_cache_v1: 100%|#########9| 2998/3000 [2:38:16<00:05,  2.59s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1: 100%|#########9| 2998/3000 [2:38:16<00:05,  2.59s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1: 100%|#########9| 2999/3000 [2:38:16<00:03,  3.08s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1: 100%|#########9| 2999/3000 [2:38:16<00:03,  3.08s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1: 100%|#########9| 2999/3000 [2:38:16<00:03,  3.17s/it, lr: 1.0e-04 loss: 1.314e-01]hash_cache_v1: 100%|#########9| 2999/3000 [2:38:16<00:03,  3.17s/it, lr: 1.0e-04 loss: 1.314e-01]
+
+Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:   0%|          | 0/4 [00:00<?, ?it/s]Generating Images:  25%|##5       | 1/4 [01:13<03:40, 73.36s/it]Generating Images:  25%|##5       | 1/4 [01:13<03:40, 73.36s/it]Generating Images:  50%|#####     | 2/4 [02:26<02:27, 73.51s/it]Generating Images:  50%|#####     | 2/4 [02:26<02:27, 73.51s/it]Generating Images:  75%|#######5  | 3/4 [03:40<01:13, 73.38s/it]Generating Images:  75%|#######5  | 3/4 [03:40<01:13, 73.38s/it]Generating Images: 100%|##########| 4/4 [04:53<00:00, 73.42s/it]Generating Images: 100%|##########| 4/4 [04:53<00:00, 73.42s/it]                                                                                                                                
+Saved checkpoint to /app/ai-toolkit/output/hash_cache_v1/hash_cache_v1.safetensors
+Saved optimizer to /app/ai-toolkit/output/hash_cache_v1/optimizer.pt
diff --git a/optimizer.pt b/optimizer.pt
new file mode 100644
index 0000000000000000000000000000000000000000..7c7eb9719a7299190077ff930f5dfd0e3013f934
--- /dev/null
+++ b/optimizer.pt
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:fee356929b2770853d09f29520173ebbd992d7526f690e6db892525045550ed0
+size 598613389
diff --git a/pid.txt b/pid.txt
new file mode 100644
index 0000000000000000000000000000000000000000..f64b48379f00dff32d5bcccd67c0d82c2249eb86
--- /dev/null
+++ b/pid.txt
@@ -0,0 +1 @@
+343
\ No newline at end of file
diff --git a/samples/1763244777125__000000000_0.jpg b/samples/1763244777125__000000000_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..6e5fcf164a6e1a9546e991d2acb300955e04d69f
Binary files /dev/null and b/samples/1763244777125__000000000_0.jpg differ
diff --git a/samples/1763244847638__000000000_1.jpg b/samples/1763244847638__000000000_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..19933031bb3bf10d1547c612b20d2a1dd2a462d6
Binary files /dev/null and b/samples/1763244847638__000000000_1.jpg differ
diff --git a/samples/1763244918161__000000000_2.jpg b/samples/1763244918161__000000000_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..522974451e7d3c6f8dfd133e70c00b8919db3fc4
Binary files /dev/null and b/samples/1763244918161__000000000_2.jpg differ
diff --git a/samples/1763244989127__000000000_3.jpg b/samples/1763244989127__000000000_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..a63a72bf6ebd879661d7ad2c8ed812e5cd27063a
Binary files /dev/null and b/samples/1763244989127__000000000_3.jpg differ
diff --git a/samples/1763245869172__000000250_0.jpg b/samples/1763245869172__000000250_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..c896de844eebfdf3c79cb38346f71d81e148e89b
Binary files /dev/null and b/samples/1763245869172__000000250_0.jpg differ
diff --git a/samples/1763245941492__000000250_1.jpg b/samples/1763245941492__000000250_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..fa5ddbcd710d940ffe8aa4c24d662e76994c112e
Binary files /dev/null and b/samples/1763245941492__000000250_1.jpg differ
diff --git a/samples/1763246013882__000000250_2.jpg b/samples/1763246013882__000000250_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..aa36838b4e7240820550ff51ab7d333803c5649b
Binary files /dev/null and b/samples/1763246013882__000000250_2.jpg differ
diff --git a/samples/1763246086279__000000250_3.jpg b/samples/1763246086279__000000250_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..3b8880f4a292d63fa25d3f9a1d5af07f130e0f9f
Binary files /dev/null and b/samples/1763246086279__000000250_3.jpg differ
diff --git a/samples/1763246958297__000000500_0.jpg b/samples/1763246958297__000000500_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..d3e232ca1c4e0d350cdfb09de1cbc147934ccbf3
Binary files /dev/null and b/samples/1763246958297__000000500_0.jpg differ
diff --git a/samples/1763247030518__000000500_1.jpg b/samples/1763247030518__000000500_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..b4b91710cd853a6946ddb699d39f30bc4c65a935
Binary files /dev/null and b/samples/1763247030518__000000500_1.jpg differ
diff --git a/samples/1763247102833__000000500_2.jpg b/samples/1763247102833__000000500_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..c930443c9ec65f9a47981a470e805015c584f563
Binary files /dev/null and b/samples/1763247102833__000000500_2.jpg differ
diff --git a/samples/1763247175174__000000500_3.jpg b/samples/1763247175174__000000500_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..1b72399e5657464745eeaee762381ca32c489218
Binary files /dev/null and b/samples/1763247175174__000000500_3.jpg differ
diff --git a/samples/1763248036622__000000750_0.jpg b/samples/1763248036622__000000750_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..85098884d403ee09fa47099d3a6d9b4b4ad136c4
Binary files /dev/null and b/samples/1763248036622__000000750_0.jpg differ
diff --git a/samples/1763248108868__000000750_1.jpg b/samples/1763248108868__000000750_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..bce14fdd3a53679fdda08147cb14930fa9c99535
Binary files /dev/null and b/samples/1763248108868__000000750_1.jpg differ
diff --git a/samples/1763248181412__000000750_2.jpg b/samples/1763248181412__000000750_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..474658fdfbccf2ff37197554999e70c5951ad635
Binary files /dev/null and b/samples/1763248181412__000000750_2.jpg differ
diff --git a/samples/1763248253941__000000750_3.jpg b/samples/1763248253941__000000750_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..627d2cec701e4f8d354b1d2ab311faa28c96d173
Binary files /dev/null and b/samples/1763248253941__000000750_3.jpg differ
diff --git a/samples/1763249132486__000001000_0.jpg b/samples/1763249132486__000001000_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..51d7b73faed9471690caaaaab5beb8a73714c510
Binary files /dev/null and b/samples/1763249132486__000001000_0.jpg differ
diff --git a/samples/1763249204958__000001000_1.jpg b/samples/1763249204958__000001000_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..7ddbef884c6b6c32deef796e77e8641eaf52377a
Binary files /dev/null and b/samples/1763249204958__000001000_1.jpg differ
diff --git a/samples/1763249277546__000001000_2.jpg b/samples/1763249277546__000001000_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..ad2ead1b7607012cc655a553b04c2d367be71038
Binary files /dev/null and b/samples/1763249277546__000001000_2.jpg differ
diff --git a/samples/1763249349926__000001000_3.jpg b/samples/1763249349926__000001000_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..ff561c8c518d9b77acb31317b91ab27f7238cfb9
Binary files /dev/null and b/samples/1763249349926__000001000_3.jpg differ
diff --git a/samples/1763250220760__000001250_0.jpg b/samples/1763250220760__000001250_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..ab4a4249134445c76b81711fb808cfe7afff3433
Binary files /dev/null and b/samples/1763250220760__000001250_0.jpg differ
diff --git a/samples/1763250293230__000001250_1.jpg b/samples/1763250293230__000001250_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..719c6a015cf614b5bfe3fc5eb89c97c47878e189
Binary files /dev/null and b/samples/1763250293230__000001250_1.jpg differ
diff --git a/samples/1763250365742__000001250_2.jpg b/samples/1763250365742__000001250_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..1b75d9086cfae7ac4163949ce873f7f1acf7e810
Binary files /dev/null and b/samples/1763250365742__000001250_2.jpg differ
diff --git a/samples/1763250438055__000001250_3.jpg b/samples/1763250438055__000001250_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..c9bed4cb83d1a5bd5f5227bf99aa0da2c3c9dc63
Binary files /dev/null and b/samples/1763250438055__000001250_3.jpg differ
diff --git a/samples/1763251300994__000001500_0.jpg b/samples/1763251300994__000001500_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..d17d53db29b676874e0d615a8d3af30dc33ddcf9
Binary files /dev/null and b/samples/1763251300994__000001500_0.jpg differ
diff --git a/samples/1763251373348__000001500_1.jpg b/samples/1763251373348__000001500_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..5c3259dbcd9bed86508001e5e2258a3dbafef970
Binary files /dev/null and b/samples/1763251373348__000001500_1.jpg differ
diff --git a/samples/1763251445767__000001500_2.jpg b/samples/1763251445767__000001500_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..984786ef63eca803c8884acb266a559459cb28f8
Binary files /dev/null and b/samples/1763251445767__000001500_2.jpg differ
diff --git a/samples/1763251518184__000001500_3.jpg b/samples/1763251518184__000001500_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..756c444e4eea0642f640eabe8a01944902569783
Binary files /dev/null and b/samples/1763251518184__000001500_3.jpg differ
diff --git a/samples/1763252388902__000001750_0.jpg b/samples/1763252388902__000001750_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..bbba1f3a4c17d6910ac966879f45d46f9a34958a
Binary files /dev/null and b/samples/1763252388902__000001750_0.jpg differ
diff --git a/samples/1763252461313__000001750_1.jpg b/samples/1763252461313__000001750_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..34f51c91c44860f88b1e3477c2c3a701f7311598
Binary files /dev/null and b/samples/1763252461313__000001750_1.jpg differ
diff --git a/samples/1763252533715__000001750_2.jpg b/samples/1763252533715__000001750_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..6e0013fb3ad3ecb0b3b1b6b0e9bf5320120475a5
Binary files /dev/null and b/samples/1763252533715__000001750_2.jpg differ
diff --git a/samples/1763252606026__000001750_3.jpg b/samples/1763252606026__000001750_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..395165c5f9eb09786f8788a95cedd0025ec9a5b6
Binary files /dev/null and b/samples/1763252606026__000001750_3.jpg differ
diff --git a/samples/1763253487029__000002000_0.jpg b/samples/1763253487029__000002000_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..8b9863521ec8cc00f0c6d6cb3bbd15feee0d5d73
Binary files /dev/null and b/samples/1763253487029__000002000_0.jpg differ
diff --git a/samples/1763253559402__000002000_1.jpg b/samples/1763253559402__000002000_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..7fd6c22e015e20848c46484576744eb04af99572
Binary files /dev/null and b/samples/1763253559402__000002000_1.jpg differ
diff --git a/samples/1763253631997__000002000_2.jpg b/samples/1763253631997__000002000_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..877f55f923ffc9abd5fbb226f0ace2e110ef506b
Binary files /dev/null and b/samples/1763253631997__000002000_2.jpg differ
diff --git a/samples/1763253704491__000002000_3.jpg b/samples/1763253704491__000002000_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..b61aa8a8a8b9690b47e65041600f75eac1a25fcc
Binary files /dev/null and b/samples/1763253704491__000002000_3.jpg differ
diff --git a/samples/1763254572411__000002250_0.jpg b/samples/1763254572411__000002250_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..45f91e91a1019e418eb76029ebf79ab1f5e12fa2
Binary files /dev/null and b/samples/1763254572411__000002250_0.jpg differ
diff --git a/samples/1763254644904__000002250_1.jpg b/samples/1763254644904__000002250_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..435db7f40960c7139840df96d51a16b45046667f
Binary files /dev/null and b/samples/1763254644904__000002250_1.jpg differ
diff --git a/samples/1763254717481__000002250_2.jpg b/samples/1763254717481__000002250_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..861933bddc6a7f394d5eafd7bc366cb9fc6442ee
--- /dev/null
+++ b/samples/1763254717481__000002250_2.jpg
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:6eb246e107006452e04065303f3d32a1e0cd3ab010512fc269e7ccae0884cd29
+size 103701
diff --git a/samples/1763254789936__000002250_3.jpg b/samples/1763254789936__000002250_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..ee761735f1a99f9a697742e289e73aff76e368ea
Binary files /dev/null and b/samples/1763254789936__000002250_3.jpg differ
diff --git a/samples/1763255653397__000002500_0.jpg b/samples/1763255653397__000002500_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..2cf6ffcffec74e3c44d2c51bb1fd806db1018cc4
Binary files /dev/null and b/samples/1763255653397__000002500_0.jpg differ
diff --git a/samples/1763255725905__000002500_1.jpg b/samples/1763255725905__000002500_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..30587e04f576689d55c45db6c3e2ba43cc19620a
Binary files /dev/null and b/samples/1763255725905__000002500_1.jpg differ
diff --git a/samples/1763255798300__000002500_2.jpg b/samples/1763255798300__000002500_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..bcb69cd16b7bdd97b19361e75751c65e1788d8af
--- /dev/null
+++ b/samples/1763255798300__000002500_2.jpg
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:dbe970986ca3365629bff0b24cd0838635e646e66a57fdac240f79edd492fa92
+size 100109
diff --git a/samples/1763255871299__000002500_3.jpg b/samples/1763255871299__000002500_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..7bdcc2800761d33ae1d0e310535aee6e7cf561f8
Binary files /dev/null and b/samples/1763255871299__000002500_3.jpg differ
diff --git a/samples/1763256773323__000002750_0.jpg b/samples/1763256773323__000002750_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..1fa69a01818936812d3627444d3d239d5178e8de
Binary files /dev/null and b/samples/1763256773323__000002750_0.jpg differ
diff --git a/samples/1763256848169__000002750_1.jpg b/samples/1763256848169__000002750_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..987e5d620c80d336979621d387c8ef1e8e174c56
Binary files /dev/null and b/samples/1763256848169__000002750_1.jpg differ
diff --git a/samples/1763256921963__000002750_2.jpg b/samples/1763256921963__000002750_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..614357756e6bc990d0b50e4ebe4d7c4760b4ca95
--- /dev/null
+++ b/samples/1763256921963__000002750_2.jpg
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:3d78c03b146d570fb5ae9cef4df009fc4dce67588cdd8c0e374ca21bda2490af
+size 102745
diff --git a/samples/1763256995329__000002750_3.jpg b/samples/1763256995329__000002750_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..c76375171897f395bb1daa9db6fe088743c0df91
Binary files /dev/null and b/samples/1763256995329__000002750_3.jpg differ
diff --git a/samples/1763257859340__000003000_0.jpg b/samples/1763257859340__000003000_0.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..6b006982f290dbd471ab77d8587609b1bd8bcbcc
Binary files /dev/null and b/samples/1763257859340__000003000_0.jpg differ
diff --git a/samples/1763257932910__000003000_1.jpg b/samples/1763257932910__000003000_1.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..0a671ed8f660f06ec21dcabfe9cc931b5f475711
Binary files /dev/null and b/samples/1763257932910__000003000_1.jpg differ
diff --git a/samples/1763258006174__000003000_2.jpg b/samples/1763258006174__000003000_2.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..d37fc5552d1629fd9d8500c540f1cddd9d3313dd
--- /dev/null
+++ b/samples/1763258006174__000003000_2.jpg
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:ccd247e747e72d299e83f0a646a069254429c3016f653738aa29ccad2ae47f85
+size 101750
diff --git a/samples/1763258079623__000003000_3.jpg b/samples/1763258079623__000003000_3.jpg
new file mode 100644
index 0000000000000000000000000000000000000000..2fee1b3ffb48c949f6461457529aa00128c809f7
Binary files /dev/null and b/samples/1763258079623__000003000_3.jpg differ