Upload 2 files

Browse files

Files changed (2) hide show

quiet-thunder-789--checkpoint:v0/config.yaml +79 -0
quiet-thunder-789--checkpoint:v0/state.msgpack +3 -0

quiet-thunder-789--checkpoint:v0/config.yaml ADDED Viewed

	@@ -0,0 +1,79 @@

+eval:
+  eval_datasets: null
+  json_datasets: null
+  test_datasets:
+  - name: generator_mean
+    length: 96
+    generator: PATTERN
+    num_pairs: 4
+    batch_size: 96
+    num_tasks_to_show: 32
+    task_generator_kwargs:
+      num_cols: 4
+      num_rows: 4
+      pattern_size: 2
+  - name: generator_gradient_ascent_5
+    length: 96
+    generator: PATTERN
+    num_pairs: 4
+    batch_size: 96
+    inference_mode: gradient_ascent
+    inference_kwargs:
+      lr: 0.1
+      num_steps: 10
+    num_tasks_to_show: 32
+    task_generator_kwargs:
+      num_cols: 4
+      num_rows: 4
+      pattern_size: 2
+training:
+  seed: 0
+  use_hf: true
+  kl_coeff: 0.001
+  batch_size: 128
+  learning_rate: 0.0004
+  inference_mode: mean
+  task_generator:
+    class: PATTERN
+    num_cols: 4
+    num_rows: 4
+    num_pairs: 4
+    num_workers: 16
+    pattern_size: 2
+  train_datasets: null
+  mixed_precision: false
+  total_num_steps: 200000
+  inference_kwargs: null
+  eval_every_n_logs: 20
+  log_every_n_steps: 1000
+  resume_from_checkpoint: null
+  online_data_augmentation: false
+  gradient_accumulation_steps: 1
+  save_checkpoint_every_n_logs: 200
+decoder_transformer:
+  _target_: src_v2.models.utils.DecoderTransformerConfig
+  max_cols: 4
+  max_rows: 4
+  num_layers: 2
+  transformer_layer:
+    _target_: src_v2.models.utils.TransformerLayerConfig
+    num_heads: 6
+    dropout_rate: 0.0
+    mlp_dim_factor: 4.0
+    emb_dim_per_head: 12
+    attention_dropout_rate: 0.0
+encoder_transformer:
+  _target_: src_v2.models.utils.EncoderTransformerConfig
+  max_cols: 4
+  max_rows: 4
+  latent_dim: 2
+  num_layers: 2
+  variational: true
+  transformer_layer:
+    _target_: src_v2.models.utils.TransformerLayerConfig
+    num_heads: 6
+    dropout_rate: 0.0
+    mlp_dim_factor: 4.0
+    emb_dim_per_head: 12
+    attention_dropout_rate: 0.0
+  latent_projection_bias: false

quiet-thunder-789--checkpoint:v0/state.msgpack ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:60b3368d8a3c6232867a43b252597f16dbec5de0264bf23168d938a461256a3d
+size 4082621