icl-182
/

joint-training-r5.0

Model card Files Files and versions

connorchenn commited on May 5, 2025

Commit

60bf39e

·

verified ·

1 Parent(s): 3f099e2

Upload folder using huggingface_hub

Files changed (3) hide show

config.yaml +43 -0
model_2970.pt +3 -0
state.pt +3 -0

config.yaml ADDED Viewed

	@@ -0,0 +1,43 @@

+config: /root/in-context-learning-GLM/src/glm_configs/joint_training.yaml
+model:
+  family: gpt2
+  n_dims: 10
+  n_embd: 256
+  n_head: 8
+  n_layer: 12
+  n_positions: 40
+out_dir: gs://glm_weights/a648a15d-4896-4e95-8a8b-7150ff5ac620
+test_run: false
+training:
+  batch_size: 256
+  curriculum:
+    dims:
+      end: 10
+      inc: 2
+      interval: 2000
+      start: 10
+    points:
+      end: 40
+      inc: 8
+      interval: 2000
+      start: 40
+  data: gaussian
+  keep_every_steps: 10
+  learning_rate: 0.00025
+  num_tasks: 10000
+  num_training_examples: 10000
+  resume_id: null
+  save_every_steps: 10
+  task: GLM
+  task_kwargs:
+    function_type:
+    - neg_binomial
+    - poisson
+    scaling: 0.32
+  train_steps: 20000
+wandb:
+  entity: in-context
+  log_every_steps: 10
+  name: null
+  notes: ''
+  project: in-context-training

model_2970.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b81ab8be1abe0cee8d9c03af0c2d364b670585f6d7ba1b71ca7fd1ae35a87416
+size 10878976

state.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:633907fbfca586d12a6830aec8278d1316cc46ac383fbadd9a2ff360f43af0b6
+size 165713513