alegendaryfish commited on Apr 8

Commit

950b7bd

verified ·

1 Parent(s): 1dbb59f

Add files using upload-large-folder tool

Browse files

Files changed (50) hide show

training_checkpoints/checkpoint-10000/scheduler.pt +3 -0
training_checkpoints/checkpoint-10000/trainer_config.json +17 -0
training_checkpoints/checkpoint-10000/trainer_state.json +4 -0
training_checkpoints/checkpoint-10000/vocab.json +78 -0
training_checkpoints/checkpoint-15000/scheduler.pt +3 -0
training_checkpoints/checkpoint-15000/trainer_config.json +17 -0
training_checkpoints/checkpoint-15000/trainer_state.json +4 -0
training_checkpoints/checkpoint-15000/vocab.json +78 -0
training_checkpoints/checkpoint-20000/scheduler.pt +3 -0
training_checkpoints/checkpoint-20000/trainer_config.json +17 -0
training_checkpoints/checkpoint-20000/trainer_state.json +4 -0
training_checkpoints/checkpoint-20000/vocab.json +78 -0
training_checkpoints/checkpoint-25000/scheduler.pt +3 -0
training_checkpoints/checkpoint-25000/trainer_config.json +17 -0
training_checkpoints/checkpoint-25000/trainer_state.json +4 -0
training_checkpoints/checkpoint-25000/vocab.json +78 -0
training_checkpoints/checkpoint-30000/trainer_config.json +17 -0
training_checkpoints/checkpoint-30000/trainer_state.json +4 -0
training_checkpoints/checkpoint-30000/vocab.json +78 -0
training_checkpoints/checkpoint-35000/trainer_config.json +17 -0
training_checkpoints/checkpoint-35000/trainer_state.json +4 -0
training_checkpoints/checkpoint-35000/vocab.json +78 -0
training_checkpoints/checkpoint-40000/trainer_config.json +17 -0
training_checkpoints/checkpoint-40000/trainer_state.json +4 -0
training_checkpoints/checkpoint-40000/vocab.json +78 -0
training_checkpoints/checkpoint-45000/trainer_config.json +17 -0
training_checkpoints/checkpoint-45000/trainer_state.json +4 -0
training_checkpoints/checkpoint-45000/vocab.json +78 -0
training_checkpoints/checkpoint-5000/trainer_config.json +17 -0
training_checkpoints/checkpoint-5000/trainer_state.json +4 -0
training_checkpoints/checkpoint-5000/vocab.json +78 -0
training_checkpoints/checkpoint-50000/optimizer.pt +3 -0
training_checkpoints/checkpoint-50000/trainer_config.json +17 -0
training_checkpoints/checkpoint-50000/trainer_state.json +4 -0
training_checkpoints/checkpoint-50000/vocab.json +78 -0
training_checkpoints/checkpoint-55000/trainer_config.json +17 -0
training_checkpoints/checkpoint-55000/trainer_state.json +4 -0
training_checkpoints/checkpoint-55000/vocab.json +78 -0
training_checkpoints/checkpoint-60000/optimizer.pt +3 -0
training_checkpoints/checkpoint-60000/trainer_config.json +17 -0
training_checkpoints/checkpoint-60000/trainer_state.json +4 -0
training_checkpoints/checkpoint-60000/vocab.json +78 -0
training_checkpoints/checkpoint-65000/optimizer.pt +3 -0
training_checkpoints/checkpoint-65000/trainer_config.json +17 -0
training_checkpoints/checkpoint-65000/trainer_state.json +4 -0
training_checkpoints/checkpoint-65000/vocab.json +78 -0
training_checkpoints/checkpoint-70000/optimizer.pt +3 -0
training_checkpoints/checkpoint-70000/trainer_config.json +17 -0
training_checkpoints/checkpoint-70000/trainer_state.json +4 -0
training_checkpoints/checkpoint-70000/vocab.json +78 -0

training_checkpoints/checkpoint-10000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5823671ed3b2bc675facedd77f22ad8483ff92e91fd3c718219687507cdf4c0
+size 1465

training_checkpoints/checkpoint-10000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-10000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 0,
+  "global_step": 10000
+}

training_checkpoints/checkpoint-10000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-15000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0de62c70093d4935c1964c4ad211b0aebc926c8bd2f29cc09e917906ecba7f53
+size 1465

training_checkpoints/checkpoint-15000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-15000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 0,
+  "global_step": 15000
+}

training_checkpoints/checkpoint-15000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-20000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:477c0b4b118e155de3b3e6948133bdde7b504978d0ea45ddea8c8b2bd9db684c
+size 1465

training_checkpoints/checkpoint-20000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-20000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 0,
+  "global_step": 20000
+}

training_checkpoints/checkpoint-20000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-25000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b72fbb8e4f4f60881f28c8afc2275790fe5cc94af4898d509e453957929b4cce
+size 1465

training_checkpoints/checkpoint-25000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-25000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 1,
+  "global_step": 25000
+}

training_checkpoints/checkpoint-25000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-30000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-30000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 1,
+  "global_step": 30000
+}

training_checkpoints/checkpoint-30000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-35000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-35000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 1,
+  "global_step": 35000
+}

training_checkpoints/checkpoint-35000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-40000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-40000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 1,
+  "global_step": 40000
+}

training_checkpoints/checkpoint-40000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-45000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-45000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 1,
+  "global_step": 45000
+}

training_checkpoints/checkpoint-45000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-5000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-5000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 0,
+  "global_step": 5000
+}

training_checkpoints/checkpoint-5000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-50000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4713f6f2b96b5c1835d83677851797d82a59fe15b7654bd70b106e73c105e3bb
+size 1237115851

training_checkpoints/checkpoint-50000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-50000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 2,
+  "global_step": 50000
+}

training_checkpoints/checkpoint-50000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-55000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-55000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 2,
+  "global_step": 55000
+}

training_checkpoints/checkpoint-55000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-60000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:255c4293630a42d81f4921a32d3c042ba93b1f54afa52b942acfe9f988c8ff1c
+size 1237115851

training_checkpoints/checkpoint-60000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-60000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 2,
+  "global_step": 60000
+}

training_checkpoints/checkpoint-60000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-65000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2049a6b4d0270b1d72cce3973bd6940697cc3e95ef3e0dc922eeaae2e36cbcc
+size 1237115851

training_checkpoints/checkpoint-65000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-65000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 2,
+  "global_step": 65000
+}

training_checkpoints/checkpoint-65000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}

training_checkpoints/checkpoint-70000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0c4d54ea41cabec318a0452f21880c6e655b814aaccaa5fd7d4a5e756012c71
+size 1237115851

training_checkpoints/checkpoint-70000/trainer_config.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+  "max_length": 2048,
+  "max_species_prefix": 0,
+  "max_protein_prefix": 1024,
+  "hidden_size": 750,
+  "num_hidden_layers": 20,
+  "num_attention_heads": 15,
+  "mlp_ratio": 3.2,
+  "prepend_species": true,
+  "prepend_protein": true,
+  "species_embedding_dim": 1024,
+  "esm_model_name": "esmc_300m",
+  "esm_device": "cuda:0",
+  "esm_dtype": "bf16",
+  "attn_impl": "mha",
+  "num_kv_groups": 5
+}

training_checkpoints/checkpoint-70000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "epoch": 2,
+  "global_step": 70000
+}

training_checkpoints/checkpoint-70000/vocab.json ADDED Viewed

	@@ -0,0 +1,78 @@

+{
+  "special_token_str": {
+    "bos": "<bos>",
+    "eos": "<stop>",
+    "pad": "<pad>",
+    "unk": "<unk>"
+  },
+  "vocab": {
+    "<bos>": 2,
+    "<pad>": 0,
+    "<stop>": 3,
+    "<unk>": 1,
+    "AAA": 4,
+    "AAC": 5,
+    "AAG": 6,
+    "AAT": 7,
+    "ACA": 8,
+    "ACC": 9,
+    "ACG": 10,
+    "ACT": 11,
+    "AGA": 12,
+    "AGC": 13,
+    "AGG": 14,
+    "AGT": 15,
+    "ATA": 16,
+    "ATC": 17,
+    "ATG": 18,
+    "ATT": 19,
+    "CAA": 20,
+    "CAC": 21,
+    "CAG": 22,
+    "CAT": 23,
+    "CCA": 24,
+    "CCC": 25,
+    "CCG": 26,
+    "CCT": 27,
+    "CGA": 28,
+    "CGC": 29,
+    "CGG": 30,
+    "CGT": 31,
+    "CTA": 32,
+    "CTC": 33,
+    "CTG": 34,
+    "CTT": 35,
+    "GAA": 36,
+    "GAC": 37,
+    "GAG": 38,
+    "GAT": 39,
+    "GCA": 40,
+    "GCC": 41,
+    "GCG": 42,
+    "GCT": 43,
+    "GGA": 44,
+    "GGC": 45,
+    "GGG": 46,
+    "GGT": 47,
+    "GTA": 48,
+    "GTC": 49,
+    "GTG": 50,
+    "GTT": 51,
+    "TAA": 52,
+    "TAC": 53,
+    "TAG": 54,
+    "TAT": 55,
+    "TCA": 56,
+    "TCC": 57,
+    "TCG": 58,
+    "TCT": 59,
+    "TGA": 60,
+    "TGC": 61,
+    "TGG": 62,
+    "TGT": 63,
+    "TTA": 64,
+    "TTC": 65,
+    "TTG": 66,
+    "TTT": 67
+  }
+}