halu1003 commited on
Commit
ebc60ee
Β·
1 Parent(s): 28cf8a5

Training in progress, step 100

Browse files
adapter_config.json CHANGED
@@ -1,7 +1,7 @@
1
  {
2
  "alpha_pattern": {},
3
  "auto_mapping": null,
4
- "base_model_name_or_path": "TheBloke/Llama-2-7B-fp16",
5
  "bias": "none",
6
  "fan_in_fan_out": false,
7
  "inference_mode": true,
@@ -19,8 +19,8 @@
19
  "rank_pattern": {},
20
  "revision": null,
21
  "target_modules": [
22
- "v_proj",
23
- "q_proj"
24
  ],
25
  "task_type": "CAUSAL_LM",
26
  "use_rslora": false
 
1
  {
2
  "alpha_pattern": {},
3
  "auto_mapping": null,
4
+ "base_model_name_or_path": "meta-llama/Llama-2-7b-chat-hf",
5
  "bias": "none",
6
  "fan_in_fan_out": false,
7
  "inference_mode": true,
 
19
  "rank_pattern": {},
20
  "revision": null,
21
  "target_modules": [
22
+ "q_proj",
23
+ "v_proj"
24
  ],
25
  "task_type": "CAUSAL_LM",
26
  "use_rslora": false
adapter_model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:0c57a3981a1d85340aa53b276b5044ca6c66e687353b20c09d0f7b976e49907f
3
  size 16794200
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:74d9a39132bf72c76103b3379fa92065285e96773193162e78a7a56aba3616bf
3
  size 16794200
runs/Dec23_08-05-51_85d5b809d3dc/events.out.tfevents.1703318787.85d5b809d3dc.34377.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9347613e761606c8970d63c28ab98c8c15c9d416e386f46fabca68d04ffe3556
3
+ size 6671
special_tokens_map.json CHANGED
@@ -2,14 +2,14 @@
2
  "bos_token": {
3
  "content": "<s>",
4
  "lstrip": false,
5
- "normalized": true,
6
  "rstrip": false,
7
  "single_word": false
8
  },
9
  "eos_token": {
10
  "content": "</s>",
11
  "lstrip": false,
12
- "normalized": true,
13
  "rstrip": false,
14
  "single_word": false
15
  },
@@ -17,7 +17,7 @@
17
  "unk_token": {
18
  "content": "<unk>",
19
  "lstrip": false,
20
- "normalized": true,
21
  "rstrip": false,
22
  "single_word": false
23
  }
 
2
  "bos_token": {
3
  "content": "<s>",
4
  "lstrip": false,
5
+ "normalized": false,
6
  "rstrip": false,
7
  "single_word": false
8
  },
9
  "eos_token": {
10
  "content": "</s>",
11
  "lstrip": false,
12
+ "normalized": false,
13
  "rstrip": false,
14
  "single_word": false
15
  },
 
17
  "unk_token": {
18
  "content": "<unk>",
19
  "lstrip": false,
20
+ "normalized": false,
21
  "rstrip": false,
22
  "single_word": false
23
  }
tokenizer.json CHANGED
@@ -14,7 +14,7 @@
14
  "single_word": false,
15
  "lstrip": false,
16
  "rstrip": false,
17
- "normalized": true,
18
  "special": true
19
  },
20
  {
@@ -23,7 +23,7 @@
23
  "single_word": false,
24
  "lstrip": false,
25
  "rstrip": false,
26
- "normalized": true,
27
  "special": true
28
  },
29
  {
@@ -32,7 +32,7 @@
32
  "single_word": false,
33
  "lstrip": false,
34
  "rstrip": false,
35
- "normalized": true,
36
  "special": true
37
  }
38
  ],
@@ -93271,126 +93271,126 @@
93271
  "▁livre s",
93272
  "lu b",
93273
  "l ub",
 
93274
  "▁▁ ▁▁",
93275
- "▁▁ ▁▁▁▁",
93276
- "▁▁ ▁▁▁▁▁▁▁▁",
93277
- "▁▁ ▁▁▁▁▁",
93278
  "▁▁ ▁▁▁▁▁▁",
93279
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93280
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93281
- "▁▁ ▁▁▁▁▁▁▁▁▁▁",
93282
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93283
- "▁▁ ▁▁▁",
93284
- "▁▁ ▁▁▁▁▁▁▁▁▁",
93285
- "▁▁ ▁▁▁▁▁▁▁",
93286
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93287
- "▁▁ ▁",
93288
- "▁▁▁▁ ▁▁",
93289
  "▁▁▁▁ ▁▁▁▁",
93290
- "▁▁▁▁ ▁▁▁▁▁▁▁▁",
93291
- "▁▁▁▁ ▁▁▁▁▁",
93292
- "▁▁▁▁ ▁▁▁▁▁▁",
93293
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93294
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93295
- "▁▁▁▁ ▁▁▁",
93296
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93297
- "▁▁▁▁ ▁▁▁▁▁▁▁",
93298
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93299
  "▁▁▁▁ ▁",
93300
- "▁▁▁▁▁▁▁▁ ▁▁",
93301
- "▁▁▁▁▁▁▁▁ ▁▁▁▁",
 
 
93302
  "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93303
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93304
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93305
- "▁▁▁▁▁▁▁▁ ▁▁▁",
93306
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93307
- "▁▁▁▁▁▁▁▁ ▁",
93308
- "▁▁▁▁▁ ▁▁",
93309
- "▁▁▁▁▁ ▁▁▁▁",
93310
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93311
- "▁▁▁▁▁ ▁▁▁▁▁",
93312
- "▁▁▁▁▁ ▁▁▁▁▁▁",
93313
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93314
- "▁▁▁▁▁ ▁▁▁",
93315
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93316
- "▁▁▁▁▁ ▁▁▁▁▁▁▁",
93317
  "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93318
- "▁▁▁▁▁ ▁",
93319
- "▁▁▁▁▁▁ ▁▁",
93320
- "▁▁▁▁▁▁ ▁▁▁▁",
93321
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93322
- "▁▁▁▁▁▁ ▁▁▁▁▁",
93323
- "▁▁▁▁▁▁ ▁▁▁▁▁▁",
93324
  "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93325
- "▁▁▁▁▁▁ ▁▁▁",
93326
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93327
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93328
- "▁▁▁▁▁▁ ▁",
93329
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93330
  "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93331
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93332
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93333
- "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93334
  "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93335
- "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93336
- "▁▁▁▁▁▁▁▁▁▁ ▁▁",
93337
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93338
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93339
  "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93340
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93341
- "▁▁▁▁▁▁▁▁▁▁ ▁",
93342
  "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93343
- "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93344
- "▁▁▁ ▁▁",
93345
- "▁▁▁ ▁▁▁▁",
93346
- "▁▁▁ ▁▁▁▁▁▁▁▁",
93347
- "▁▁▁ ▁▁▁▁▁",
93348
- "▁▁▁ ▁▁▁▁▁▁",
93349
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93350
  "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93351
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93352
  "▁▁▁ ▁▁▁",
 
 
 
 
 
 
 
93353
  "▁▁▁ ▁▁▁▁▁▁▁▁▁",
93354
- "▁▁▁ ▁▁▁▁▁▁▁",
93355
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93356
- "▁▁▁ ▁",
93357
- "▁▁▁▁▁▁▁▁▁ ▁▁",
93358
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93359
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93360
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93361
  "▁▁▁▁▁▁▁▁▁ ▁▁▁",
93362
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93363
- "▁▁▁▁▁▁▁▁▁ ▁",
93364
- "▁▁▁▁▁▁▁ ▁▁",
93365
- "▁▁▁▁▁▁▁ ▁▁▁▁",
93366
- "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93367
  "▁▁▁▁▁▁▁ ▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
 
93368
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
93369
  "▁▁▁▁▁▁▁ ▁▁▁",
93370
- "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
93371
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93372
- "▁▁▁▁▁▁▁ ▁",
93373
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93374
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93375
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93376
  "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93377
- "▁▁▁▁▁▁▁▁▁▁▁ ▁",
93378
- "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93379
  "▁ ▁▁",
93380
- "▁ ▁▁▁▁",
 
 
 
 
 
 
93381
  "▁ ▁▁▁▁▁▁▁▁",
93382
- "▁ ▁▁▁▁▁",
 
 
 
 
93383
  "▁ ▁▁▁▁▁▁",
93384
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93385
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93386
  "▁ ▁▁▁▁▁▁▁▁▁▁",
93387
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93388
- "▁ ▁▁▁",
93389
- "▁ ▁▁▁▁▁▁▁▁▁",
93390
- "▁ ▁▁▁▁▁▁▁",
93391
- "▁ ▁▁▁▁▁▁▁▁▁▁▁",
93392
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93393
- "▁ ▁"
 
 
 
 
 
 
 
93394
  ]
93395
  }
93396
  }
 
14
  "single_word": false,
15
  "lstrip": false,
16
  "rstrip": false,
17
+ "normalized": false,
18
  "special": true
19
  },
20
  {
 
23
  "single_word": false,
24
  "lstrip": false,
25
  "rstrip": false,
26
+ "normalized": false,
27
  "special": true
28
  },
29
  {
 
32
  "single_word": false,
33
  "lstrip": false,
34
  "rstrip": false,
35
+ "normalized": false,
36
  "special": true
37
  }
38
  ],
 
93271
  "▁livre s",
93272
  "lu b",
93273
  "l ub",
93274
+ "▁ ▁",
93275
  "▁▁ ▁▁",
93276
+ "▁▁▁ ▁",
93277
+ "▁ ▁▁▁",
 
93278
  "▁▁ ▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
93279
  "▁▁▁▁ ▁▁▁▁",
93280
+ "▁▁▁▁▁ ▁▁▁",
93281
+ "▁▁▁▁▁▁ ▁▁",
93282
+ "▁▁▁ ▁▁▁▁▁",
93283
+ "▁▁▁▁▁▁▁ ▁",
93284
+ "▁ ▁▁▁▁▁▁▁",
93285
+ "▁▁ ▁▁▁",
 
 
 
93286
  "▁▁▁▁ ▁",
93287
+ "▁▁▁ ▁▁",
93288
+ "▁ ▁▁▁▁",
93289
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93290
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93291
  "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
93292
  "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
93293
  "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
93294
  "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
 
 
 
93295
  "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
 
 
 
 
93296
  "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
 
 
93297
  "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
 
 
 
 
 
 
 
93298
  "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93299
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93300
+ "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93301
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93302
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93303
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93304
+ "▁▁ ▁▁▁▁",
93305
+ "▁▁▁▁ ▁▁",
93306
+ "▁▁▁▁▁ ▁",
93307
  "▁▁▁ ▁▁▁",
93308
+ "▁ ▁▁▁▁▁",
93309
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁",
93310
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁",
93311
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁",
93312
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁",
93313
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁",
93314
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁",
93315
  "▁▁▁ ▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93316
  "▁▁▁▁▁▁▁▁▁ ▁▁▁",
 
 
 
 
 
93317
  "▁▁▁▁▁▁▁ ▁▁▁▁▁",
93318
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁",
93319
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁",
93320
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93321
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93322
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93323
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93324
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93325
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93326
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93327
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93328
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93329
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93330
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93331
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93332
+ "▁▁ ▁▁▁▁▁▁▁▁",
93333
+ "▁▁▁▁ ▁▁▁▁▁▁",
93334
+ "▁▁▁▁▁▁▁▁ ▁▁",
93335
+ "▁▁▁▁▁ ▁▁▁▁▁",
93336
+ "▁▁▁▁▁▁ ▁▁▁▁",
93337
+ "▁▁▁ ▁▁▁▁▁▁▁",
93338
+ "▁▁▁▁▁▁▁▁▁ ▁",
93339
  "▁▁▁▁▁▁▁ ▁▁▁",
93340
+ "▁ ▁▁▁▁▁▁▁▁▁",
93341
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93342
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93343
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93344
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93345
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93346
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93347
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93348
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93349
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93350
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93351
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
 
 
 
 
93352
  "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93353
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93354
+ "▁▁ ▁",
93355
  "▁ ▁▁",
93356
+ "▁▁ ▁▁▁▁▁▁▁",
93357
+ "▁▁▁▁ ▁▁▁▁▁",
93358
+ "▁▁▁▁▁▁▁▁ ▁",
93359
+ "▁▁▁▁▁ ▁▁▁▁",
93360
+ "▁▁▁▁▁▁ ▁▁▁",
93361
+ "▁▁▁ ▁▁▁▁▁▁",
93362
+ "▁▁▁▁▁▁▁ ▁▁",
93363
  "▁ ▁▁▁▁▁▁▁▁",
93364
+ "▁▁ ▁▁▁▁▁",
93365
+ "▁▁▁▁ ▁▁▁",
93366
+ "▁▁▁▁▁ ▁▁",
93367
+ "▁▁▁▁▁▁ ▁",
93368
+ "▁▁▁ ▁▁▁▁",
93369
  "▁ ▁▁▁▁▁▁",
93370
+ "▁▁ ▁▁▁▁▁▁▁▁▁",
93371
+ "▁▁▁▁ ▁▁▁▁▁▁▁",
93372
+ "▁▁▁▁▁▁▁▁ ▁▁▁",
93373
+ "▁▁▁▁▁ ▁▁▁▁▁▁",
93374
+ "▁▁▁▁▁▁ ▁▁▁▁▁",
93375
+ "▁▁▁▁▁▁▁▁▁▁ ▁",
93376
+ "▁▁▁ ▁▁▁▁▁▁▁▁",
93377
+ "▁▁▁▁▁▁▁▁▁ ▁▁",
93378
+ "▁▁▁▁▁▁▁ ▁▁▁▁",
93379
  "▁ ▁▁▁▁▁▁▁▁▁▁",
93380
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93381
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93382
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93383
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93384
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93385
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93386
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93387
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93388
+ "▁▁▁���▁▁▁▁▁▁▁▁▁▁ ▁",
93389
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93390
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93391
+ "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93392
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93393
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁"
93394
  ]
93395
  }
93396
  }
tokenizer_config.json CHANGED
@@ -5,7 +5,7 @@
5
  "0": {
6
  "content": "<unk>",
7
  "lstrip": false,
8
- "normalized": true,
9
  "rstrip": false,
10
  "single_word": false,
11
  "special": true
@@ -13,7 +13,7 @@
13
  "1": {
14
  "content": "<s>",
15
  "lstrip": false,
16
- "normalized": true,
17
  "rstrip": false,
18
  "single_word": false,
19
  "special": true
@@ -21,18 +21,21 @@
21
  "2": {
22
  "content": "</s>",
23
  "lstrip": false,
24
- "normalized": true,
25
  "rstrip": false,
26
  "single_word": false,
27
  "special": true
28
  }
29
  },
30
  "bos_token": "<s>",
 
31
  "clean_up_tokenization_spaces": false,
32
  "eos_token": "</s>",
 
33
  "model_max_length": 1000000000000000019884624838656,
34
  "pad_token": "</s>",
35
  "padding": true,
 
36
  "sp_model_kwargs": {},
37
  "tokenizer_class": "LlamaTokenizer",
38
  "unk_token": "<unk>",
 
5
  "0": {
6
  "content": "<unk>",
7
  "lstrip": false,
8
+ "normalized": false,
9
  "rstrip": false,
10
  "single_word": false,
11
  "special": true
 
13
  "1": {
14
  "content": "<s>",
15
  "lstrip": false,
16
+ "normalized": false,
17
  "rstrip": false,
18
  "single_word": false,
19
  "special": true
 
21
  "2": {
22
  "content": "</s>",
23
  "lstrip": false,
24
+ "normalized": false,
25
  "rstrip": false,
26
  "single_word": false,
27
  "special": true
28
  }
29
  },
30
  "bos_token": "<s>",
31
+ "chat_template": "{% if messages[0]['role'] == 'system' %}{% set loop_messages = messages[1:] %}{% set system_message = messages[0]['content'] %}{% else %}{% set loop_messages = messages %}{% set system_message = false %}{% endif %}{% for message in loop_messages %}{% if (message['role'] == 'user') != (loop.index0 % 2 == 0) %}{{ raise_exception('Conversation roles must alternate user/assistant/user/assistant/...') }}{% endif %}{% if loop.index0 == 0 and system_message != false %}{% set content = '<<SYS>>\\n' + system_message + '\\n<</SYS>>\\n\\n' + message['content'] %}{% else %}{% set content = message['content'] %}{% endif %}{% if message['role'] == 'user' %}{{ bos_token + '[INST] ' + content.strip() + ' [/INST]' }}{% elif message['role'] == 'assistant' %}{{ ' ' + content.strip() + ' ' + eos_token }}{% endif %}{% endfor %}",
32
  "clean_up_tokenization_spaces": false,
33
  "eos_token": "</s>",
34
+ "legacy": false,
35
  "model_max_length": 1000000000000000019884624838656,
36
  "pad_token": "</s>",
37
  "padding": true,
38
+ "padding_side": "right",
39
  "sp_model_kwargs": {},
40
  "tokenizer_class": "LlamaTokenizer",
41
  "unk_token": "<unk>",
training_args.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:f02e3a0c43b750293239c60d6786dcbc618d979461b070ccf987547dd42c1802
3
  size 4728
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b7fc5a6e041093eb9a4f1b2440d028a0c271552fcb064da1168f340f47b6cab9
3
  size 4728