yifan-Eva commited on May 12, 2025

Commit

f6f67f7

verified ·

1 Parent(s): c995102

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/README.md +10 -0
modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/adapter_config.json +23 -0
modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/adapter_model.bin +3 -0
modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/special_tokens_map.json +24 -0
modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/tokenizer.json +0 -0
modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/tokenizer.model +3 -0
modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/tokenizer_config.json +39 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/README.md +10 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/adapter_config.json +23 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/adapter_model.bin +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/optimizer.pt +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_0.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_1.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_2.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_3.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/scheduler.pt +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/special_tokens_map.json +24 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/tokenizer.json +0 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/tokenizer.model +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/tokenizer_config.json +39 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/trainer_state.json +0 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/training_args.bin +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/README.md +10 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/adapter_config.json +23 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/adapter_model.bin +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/optimizer.pt +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_0.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_1.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_2.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_3.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/scheduler.pt +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/special_tokens_map.json +24 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/tokenizer.json +0 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/tokenizer.model +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/tokenizer_config.json +39 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/trainer_state.json +0 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/training_args.bin +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/README.md +10 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/adapter_config.json +23 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/adapter_model.bin +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/optimizer.pt +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_0.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_1.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_2.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_3.pth +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/scheduler.pt +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/special_tokens_map.json +24 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/tokenizer.json +0 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/tokenizer.model +3 -0
modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/tokenizer_config.json +39 -0

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fc5b7ab04df31362e7f302517937bd743edf818e25c08918e31aa43312b88a7
+size 268528394

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.5helpful_0.5harmless/best_checkpoint/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fc5b7ab04df31362e7f302517937bd743edf818e25c08918e31aa43312b88a7
+size 268528394

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24c8af7e4d0f6f25c258d031819f09bef5225b30cd130a31a2e1885210ee8bd2
+size 537086714

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e812528c12db18ea461d9e3bd3cc22ea90b0101393312170b1e2fc74c940bd81
+size 14960

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:37194a6d48612e1a46a2d5d317ead97c70d9fc4569b0118fcd5f84c3dc9daa5a
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17c179483659a784aa1ace2427daff48c556a6bcc3c330e6f3274e4dc95e4b49
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b56857c9b117629f35af2c3d64f522d33a9d8aa94faa81ec6956380a895118c4
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cbed1d512c580bc3b1b5698c62fe6764e95e636085f70208357c5bdfe1fb3007
+size 1064

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-12000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57a736e0c844803a29aa7b0154d1456168357c89757b27478f38bdb70d0921c8
+size 4600

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55f3432da6ac27bb56b1c36d242bd96341b47e56e12f038ed1008798f09cef9f
+size 268528394

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5896c0f12d577a738a4be00c1faefe8c0d722ea3372a94ef3a0e4666d1330f9
+size 537086714

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b0f69b5414e85c17b526e8c65193f06ef8d6195a8c8383efe1d2f9d044824583
+size 14960

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49d1438e98cc9c53a6852464635ce62e9788e61eb3646b73e33813f487c4b6ae
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4388add9cec90932f8ff0100d27a0574d98e1bad52ff89d44e31967d2b4fbfde
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a705d6dfaae4f2c1b4b2be6b25a6eb521ffae6fcba21cc1531e97b60037ed079
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5456ef20d8707787136301aa23039ee4cf82a6cae6197cab80f2a73d53d2163a
+size 1064

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-6000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:57a736e0c844803a29aa7b0154d1456168357c89757b27478f38bdb70d0921c8
+size 4600

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/README.md ADDED Viewed

	@@ -0,0 +1,10 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0
+- PEFT 0.5.0

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/adapter_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "/shared/nas/data/m1/xuejunz2/model_weights/Llama-2-7b-hf",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.0,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "k_proj",
+    "v_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:193a9e6cc8762cd885f0c548f6543068ce28ff85b3b32cd9b958a5497fe981aa
+size 268528394

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e08274a60c84f0390ff483f25b177bcdcc9a6c4c5b51d2498c5e05bc9293107e
+size 537086714

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:331df8a1fce70deea17ec1af86cf0dc22ecc098b0c4860cf6b22d89e76c71a14
+size 14960

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e07ace389d24bc1307b74f42a1e7b8f0117b0db853e2df64ff3f15cb92916a2
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da6a990f346d7014dffb28fa2bc7d3b890bd3c53712503fce3656da48d3d6e50
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e95f356ca38179b05993f55daece0223e96fa10b9a1b9ea2102a739211333f63
+size 15024

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:99b2347f69fca9ef2a9593be88870533f267e2835330293340da3b589c9a7b97
+size 1064

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723

modpo/use_reward/0.5helpful_0.5harmless/checkpoint-9000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "right",
+  "sp_model_kwargs": {},
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": true
+}