TinyPixel commited on
Commit
322041c
Β·
1 Parent(s): 35c0c3f

Upload folder using huggingface_hub

Browse files
Files changed (3) hide show
  1. special_tokens_map.json +3 -3
  2. tokenizer.json +102 -102
  3. tokenizer_config.json +6 -7
special_tokens_map.json CHANGED
@@ -2,14 +2,14 @@
2
  "bos_token": {
3
  "content": "<s>",
4
  "lstrip": false,
5
- "normalized": false,
6
  "rstrip": false,
7
  "single_word": false
8
  },
9
  "eos_token": {
10
  "content": "</s>",
11
  "lstrip": false,
12
- "normalized": false,
13
  "rstrip": false,
14
  "single_word": false
15
  },
@@ -17,7 +17,7 @@
17
  "unk_token": {
18
  "content": "<unk>",
19
  "lstrip": false,
20
- "normalized": false,
21
  "rstrip": false,
22
  "single_word": false
23
  }
 
2
  "bos_token": {
3
  "content": "<s>",
4
  "lstrip": false,
5
+ "normalized": true,
6
  "rstrip": false,
7
  "single_word": false
8
  },
9
  "eos_token": {
10
  "content": "</s>",
11
  "lstrip": false,
12
+ "normalized": true,
13
  "rstrip": false,
14
  "single_word": false
15
  },
 
17
  "unk_token": {
18
  "content": "<unk>",
19
  "lstrip": false,
20
+ "normalized": true,
21
  "rstrip": false,
22
  "single_word": false
23
  }
tokenizer.json CHANGED
@@ -2,15 +2,15 @@
2
  "version": "1.0",
3
  "truncation": {
4
  "direction": "Right",
5
- "max_length": 512,
6
  "strategy": "LongestFirst",
7
  "stride": 0
8
  },
9
  "padding": {
10
  "strategy": {
11
- "Fixed": 512
12
  },
13
- "direction": "Right",
14
  "pad_to_multiple_of": null,
15
  "pad_id": 2,
16
  "pad_type_id": 0,
@@ -23,7 +23,7 @@
23
  "single_word": false,
24
  "lstrip": false,
25
  "rstrip": false,
26
- "normalized": false,
27
  "special": true
28
  },
29
  {
@@ -32,7 +32,7 @@
32
  "single_word": false,
33
  "lstrip": false,
34
  "rstrip": false,
35
- "normalized": false,
36
  "special": true
37
  },
38
  {
@@ -41,7 +41,7 @@
41
  "single_word": false,
42
  "lstrip": false,
43
  "rstrip": false,
44
- "normalized": false,
45
  "special": true
46
  }
47
  ],
@@ -93280,126 +93280,126 @@
93280
  "▁livre s",
93281
  "lu b",
93282
  "l ub",
93283
- "▁ ▁",
93284
  "▁▁ ▁▁",
93285
- "▁▁▁ ▁",
93286
- "▁ ▁▁▁",
 
93287
  "▁▁ ▁▁▁▁▁▁",
93288
- "▁▁▁▁ ▁▁▁▁",
93289
- "▁▁▁▁▁ ▁▁▁",
93290
- "▁▁▁▁▁▁ ▁▁",
93291
- "▁▁▁ ▁▁▁▁▁",
93292
- "▁▁▁▁▁▁▁ ▁",
93293
- "▁ ▁▁▁▁▁▁▁",
93294
- "▁▁ ▁▁▁",
93295
- "▁▁▁▁ ▁",
93296
- "▁▁▁ ▁▁",
93297
- "▁ ▁▁▁▁",
93298
  "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
93299
  "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
93300
  "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
93301
  "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
93302
  "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
93303
  "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
 
 
 
93304
  "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
 
 
 
 
93305
  "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
 
 
93306
  "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
 
 
 
 
 
 
 
93307
  "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93308
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93309
- "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93310
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93311
- "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93312
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93313
- "▁▁ ▁▁▁▁",
93314
- "▁▁▁▁ ▁▁",
93315
- "▁▁▁▁▁ ▁",
93316
  "▁▁▁ ▁▁▁",
93317
- "▁ ▁▁▁▁▁",
93318
- "▁▁ ▁▁▁▁▁▁▁▁▁▁",
93319
- "▁▁▁▁ ▁▁▁▁▁▁▁▁",
93320
- "▁▁▁▁▁▁▁▁ ▁▁▁▁",
93321
- "▁▁▁▁▁ ▁▁▁▁▁▁▁",
93322
- "▁▁▁▁▁▁ ▁▁▁▁▁▁",
93323
- "▁▁▁▁▁▁▁▁▁▁ ▁▁",
93324
  "▁▁▁ ▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93325
  "▁▁▁▁▁▁▁▁▁ ▁▁▁",
 
 
 
 
 
93326
  "▁▁▁▁▁▁▁ ▁▁▁▁▁",
93327
- "▁▁▁▁▁▁▁▁▁▁▁ ▁",
93328
- "▁ ▁▁▁▁▁▁▁▁▁▁▁",
93329
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93330
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93331
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93332
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93333
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93334
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93335
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93336
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93337
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93338
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93339
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93340
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93341
- "▁▁ ▁▁▁▁▁▁▁▁",
93342
- "▁▁▁▁ ▁▁▁▁▁▁",
93343
- "▁▁▁▁▁▁▁▁ ▁▁",
93344
- "▁▁▁▁▁ ▁▁▁▁▁",
93345
- "▁▁▁▁▁▁ ▁▁▁▁",
93346
- "▁▁▁ ▁▁▁▁▁▁▁",
93347
- "▁▁▁▁▁▁▁▁▁ ▁",
93348
  "▁▁▁▁▁▁▁ ▁▁▁",
93349
- "▁ ▁▁▁▁▁▁▁▁▁",
93350
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93351
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93352
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93353
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93354
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93355
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93356
- "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93357
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93358
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93359
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93360
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
 
 
 
 
93361
  "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93362
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93363
- "▁▁ ▁",
93364
  "▁ ▁▁",
93365
- "▁▁ ▁▁▁▁▁▁▁",
93366
- "▁▁▁▁ ▁▁▁▁▁",
93367
- "▁▁▁▁▁▁▁▁ ▁",
93368
- "▁▁▁▁▁ ▁▁▁▁",
93369
- "▁▁▁▁▁▁ ▁▁▁",
93370
- "▁▁▁ ▁▁▁▁▁▁",
93371
- "▁▁▁▁▁▁▁ ▁▁",
93372
  "▁ ▁▁▁▁▁▁▁▁",
93373
- "▁▁ ▁▁▁▁▁",
93374
- "▁▁▁▁ ▁▁▁",
93375
- "▁▁▁▁▁ ▁▁",
93376
- "▁▁▁▁▁▁ ▁",
93377
- "▁▁▁ ▁▁▁▁",
93378
  "▁ ▁▁▁▁▁▁",
93379
- "▁▁ ▁▁▁▁▁▁▁▁▁",
93380
- "▁▁▁▁ ▁▁▁▁▁▁▁",
93381
- "▁▁▁▁▁▁▁▁ ▁▁▁",
93382
- "▁▁▁▁▁ ▁▁▁▁▁▁",
93383
- "▁▁▁▁▁▁ ▁▁▁▁▁",
93384
- "▁▁▁▁▁▁▁▁▁▁ ▁",
93385
- "▁▁▁ ▁▁▁▁▁▁▁▁",
93386
- "▁▁▁▁▁▁▁▁▁ ▁▁",
93387
- "▁▁▁▁▁▁▁ ▁▁▁▁",
93388
  "▁ ▁▁▁▁▁▁▁▁▁▁",
93389
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93390
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93391
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93392
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93393
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93394
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93395
- "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93396
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93397
- "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93398
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93399
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93400
- "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93401
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93402
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁"
93403
  ]
93404
  }
93405
  }
 
2
  "version": "1.0",
3
  "truncation": {
4
  "direction": "Right",
5
+ "max_length": 128,
6
  "strategy": "LongestFirst",
7
  "stride": 0
8
  },
9
  "padding": {
10
  "strategy": {
11
+ "Fixed": 128
12
  },
13
+ "direction": "Left",
14
  "pad_to_multiple_of": null,
15
  "pad_id": 2,
16
  "pad_type_id": 0,
 
23
  "single_word": false,
24
  "lstrip": false,
25
  "rstrip": false,
26
+ "normalized": true,
27
  "special": true
28
  },
29
  {
 
32
  "single_word": false,
33
  "lstrip": false,
34
  "rstrip": false,
35
+ "normalized": true,
36
  "special": true
37
  },
38
  {
 
41
  "single_word": false,
42
  "lstrip": false,
43
  "rstrip": false,
44
+ "normalized": true,
45
  "special": true
46
  }
47
  ],
 
93280
  "▁livre s",
93281
  "lu b",
93282
  "l ub",
 
93283
  "▁▁ ▁▁",
93284
+ "▁▁ ▁▁▁▁",
93285
+ "▁▁ ▁▁▁▁▁▁▁▁",
93286
+ "▁▁ ▁▁▁▁▁",
93287
  "▁▁ ▁▁▁▁▁▁",
93288
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93289
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93290
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93291
  "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93292
+ "▁▁ ▁▁▁",
93293
+ "▁▁ ▁▁▁▁▁▁▁▁▁",
93294
+ "▁▁ ▁▁▁▁▁▁▁",
93295
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93296
+ "▁▁ ▁",
93297
+ "▁▁▁▁ ▁▁",
93298
+ "▁▁▁▁ ▁▁▁▁",
93299
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁",
93300
+ "▁▁▁▁ ▁▁▁▁▁",
93301
+ "▁▁▁▁ ▁▁▁▁▁▁",
93302
  "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93303
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93304
+ "▁▁▁▁ ▁▁▁",
93305
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93306
+ "▁▁▁▁ ▁▁▁▁▁▁▁",
93307
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93308
+ "▁▁▁▁ ▁",
93309
+ "▁▁▁▁▁▁▁▁ ▁▁",
93310
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁",
93311
  "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93312
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93313
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93314
+ "▁▁▁▁▁▁▁▁ ▁▁▁",
93315
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93316
+ "▁▁▁▁▁▁▁▁ ▁",
93317
+ "▁▁▁▁▁ ▁▁",
93318
+ "▁▁▁▁▁ ▁▁▁▁",
93319
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93320
+ "▁▁▁▁▁ ▁▁▁▁▁",
93321
+ "▁▁▁▁▁ ▁▁▁▁▁▁",
93322
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93323
+ "▁▁▁▁▁ ▁▁▁",
93324
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93325
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁",
93326
  "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93327
+ "▁▁▁▁▁ ▁",
93328
+ "▁▁▁▁▁▁ ▁▁",
93329
+ "▁▁▁▁▁▁ ▁▁▁▁",
93330
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93331
+ "▁▁▁▁▁▁ ▁▁▁▁▁",
93332
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁",
93333
  "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
93334
+ "▁▁▁▁▁▁ ▁▁▁",
93335
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
93336
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93337
+ "▁▁▁▁▁▁ ▁",
93338
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93339
  "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93340
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93341
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93342
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93343
  "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93344
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93345
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁",
93346
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93347
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93348
  "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93349
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93350
+ "▁▁▁▁▁▁▁▁▁▁ ▁",
93351
  "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93352
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93353
+ "▁▁▁ ▁▁",
93354
+ "▁▁▁ ▁▁▁▁",
93355
+ "▁▁▁ ▁▁▁▁▁▁▁▁",
93356
+ "▁▁▁ ▁▁▁▁▁",
93357
+ "▁▁▁ ▁▁▁▁▁▁",
93358
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93359
  "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
93360
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93361
  "▁▁▁ ▁▁▁",
 
 
 
 
 
 
 
93362
  "▁▁▁ ▁▁▁▁▁▁▁▁▁",
93363
+ "▁▁▁ ▁▁▁▁▁▁▁",
93364
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
93365
+ "▁▁▁ ▁",
93366
+ "▁▁▁▁▁▁▁▁▁ ▁▁",
93367
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93368
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93369
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
93370
  "▁▁▁▁▁▁▁▁▁ ▁▁▁",
93371
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93372
+ "▁▁▁▁▁▁▁▁▁ ▁",
93373
+ "▁▁▁▁▁▁▁ ▁▁",
93374
+ "▁▁▁▁▁▁▁ ▁▁▁▁",
93375
+ "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
93376
  "▁▁▁▁▁▁▁ ▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
 
93377
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
93378
  "▁▁▁▁▁▁▁ ▁▁▁",
93379
+ "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
93380
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
93381
+ "▁▁▁▁▁▁▁ ▁",
93382
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
93383
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
93384
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
93385
  "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
93386
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁",
93387
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
93388
  "▁ ▁▁",
93389
+ "▁ ▁▁▁▁",
 
 
 
 
 
 
93390
  "▁ ▁▁▁▁▁▁▁▁",
93391
+ "▁ ▁▁▁▁▁",
 
 
 
 
93392
  "▁ ▁▁▁▁▁▁",
93393
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
93394
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
93395
  "▁ ▁▁▁▁▁▁▁▁▁▁",
93396
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93397
+ "▁ ▁▁▁",
93398
+ "▁ ▁▁▁▁▁▁▁▁▁",
93399
+ "▁ ▁▁▁▁▁▁▁",
93400
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁",
93401
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
93402
+ "▁ ▁"
 
 
 
 
 
 
 
93403
  ]
93404
  }
93405
  }
tokenizer_config.json CHANGED
@@ -3,7 +3,7 @@
3
  "0": {
4
  "content": "<unk>",
5
  "lstrip": false,
6
- "normalized": false,
7
  "rstrip": false,
8
  "single_word": false,
9
  "special": true
@@ -11,7 +11,7 @@
11
  "1": {
12
  "content": "<s>",
13
  "lstrip": false,
14
- "normalized": false,
15
  "rstrip": false,
16
  "single_word": false,
17
  "special": true
@@ -19,21 +19,20 @@
19
  "2": {
20
  "content": "</s>",
21
  "lstrip": false,
22
- "normalized": false,
23
  "rstrip": false,
24
  "single_word": false,
25
  "special": true
26
  }
27
  },
 
28
  "bos_token": "<s>",
29
  "clean_up_tokenization_spaces": false,
30
  "eos_token": "</s>",
31
- "legacy": false,
32
- "model_max_length": 1000000000000000019884624838656,
33
  "pad_token": "</s>",
34
- "padding_side": "right",
35
  "sp_model_kwargs": {},
36
  "tokenizer_class": "LlamaTokenizer",
37
  "unk_token": "<unk>",
38
- "use_default_system_prompt": false
39
  }
 
3
  "0": {
4
  "content": "<unk>",
5
  "lstrip": false,
6
+ "normalized": true,
7
  "rstrip": false,
8
  "single_word": false,
9
  "special": true
 
11
  "1": {
12
  "content": "<s>",
13
  "lstrip": false,
14
+ "normalized": true,
15
  "rstrip": false,
16
  "single_word": false,
17
  "special": true
 
19
  "2": {
20
  "content": "</s>",
21
  "lstrip": false,
22
+ "normalized": true,
23
  "rstrip": false,
24
  "single_word": false,
25
  "special": true
26
  }
27
  },
28
+ "additional_special_tokens": [],
29
  "bos_token": "<s>",
30
  "clean_up_tokenization_spaces": false,
31
  "eos_token": "</s>",
32
+ "model_max_length": 2048,
 
33
  "pad_token": "</s>",
 
34
  "sp_model_kwargs": {},
35
  "tokenizer_class": "LlamaTokenizer",
36
  "unk_token": "<unk>",
37
+ "use_default_system_prompt": true
38
  }