Ignaciohhhhggfgjfrffd commited on
Commit
3b8fad5
·
verified ·
1 Parent(s): f027209

Modelo fusionado (PEFT y base) en safetensors

Browse files
config.json ADDED
@@ -0,0 +1,408 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "LlamaForCausalLM"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": 1,
8
+ "dataset_parameters": [
9
+ {
10
+ "config": "ff",
11
+ "metadata": {
12
+ "columns": {
13
+ "ff": {
14
+ "__all__": [
15
+ "text",
16
+ "id",
17
+ "wikiname",
18
+ "page_id",
19
+ "title",
20
+ "url",
21
+ "date_modified",
22
+ "in_language",
23
+ "wikidata_id",
24
+ "bytes_html",
25
+ "wikitext",
26
+ "version",
27
+ "infoboxes",
28
+ "has_math"
29
+ ]
30
+ }
31
+ },
32
+ "configs": [
33
+ "ab",
34
+ "ace",
35
+ "ady",
36
+ "af",
37
+ "als",
38
+ "alt",
39
+ "ami",
40
+ "am",
41
+ "ang",
42
+ "anp",
43
+ "an",
44
+ "arc",
45
+ "ar",
46
+ "ary",
47
+ "arz",
48
+ "ast",
49
+ "as",
50
+ "atj",
51
+ "avk",
52
+ "av",
53
+ "awa",
54
+ "ay",
55
+ "azb",
56
+ "az",
57
+ "ban",
58
+ "bar",
59
+ "bat_smg",
60
+ "ba",
61
+ "bbc",
62
+ "bcl",
63
+ "be",
64
+ "bg",
65
+ "bh",
66
+ "bi",
67
+ "bjn",
68
+ "blk",
69
+ "bm",
70
+ "bn",
71
+ "bo",
72
+ "bpy",
73
+ "br",
74
+ "bs",
75
+ "bug",
76
+ "bxr",
77
+ "ca",
78
+ "cbk_zam",
79
+ "cdo",
80
+ "ceb",
81
+ "ce",
82
+ "chr",
83
+ "ch",
84
+ "chy",
85
+ "ckb",
86
+ "co",
87
+ "crh",
88
+ "cr",
89
+ "csb",
90
+ "cs",
91
+ "cu",
92
+ "cv",
93
+ "cy",
94
+ "dag",
95
+ "da",
96
+ "de",
97
+ "dga",
98
+ "din",
99
+ "diq",
100
+ "dsb",
101
+ "dty",
102
+ "dv",
103
+ "dz",
104
+ "ee",
105
+ "el",
106
+ "eml",
107
+ "en",
108
+ "eo",
109
+ "es",
110
+ "et",
111
+ "eu",
112
+ "ext",
113
+ "fat",
114
+ "fa",
115
+ "ff",
116
+ "fiu_vro",
117
+ "fi",
118
+ "fj",
119
+ "fon",
120
+ "fo",
121
+ "frp",
122
+ "frr",
123
+ "fr",
124
+ "fur",
125
+ "fy",
126
+ "gag",
127
+ "gan",
128
+ "ga",
129
+ "gcr",
130
+ "gd",
131
+ "glk",
132
+ "gl",
133
+ "gn",
134
+ "gom",
135
+ "gor",
136
+ "got",
137
+ "gpe",
138
+ "guc",
139
+ "gur",
140
+ "gu",
141
+ "guw",
142
+ "gv",
143
+ "hak",
144
+ "ha",
145
+ "haw",
146
+ "he",
147
+ "hif",
148
+ "hi",
149
+ "hr",
150
+ "hsb",
151
+ "ht",
152
+ "hu",
153
+ "hy",
154
+ "hyw",
155
+ "ia",
156
+ "id",
157
+ "ie",
158
+ "ig",
159
+ "ik",
160
+ "ilo",
161
+ "inh",
162
+ "io",
163
+ "is",
164
+ "it",
165
+ "iu",
166
+ "jam",
167
+ "ja",
168
+ "jbo",
169
+ "jv",
170
+ "kaa",
171
+ "kab",
172
+ "ka",
173
+ "kbd",
174
+ "kbp",
175
+ "kcg",
176
+ "kg",
177
+ "ki",
178
+ "kk",
179
+ "kl",
180
+ "km",
181
+ "kn",
182
+ "koi",
183
+ "ko",
184
+ "krc",
185
+ "ksh",
186
+ "ks",
187
+ "ku",
188
+ "kv",
189
+ "kw",
190
+ "ky",
191
+ "lad",
192
+ "la",
193
+ "lbe",
194
+ "lb",
195
+ "lez",
196
+ "lfn",
197
+ "lg",
198
+ "lij",
199
+ "li",
200
+ "lld",
201
+ "lmo",
202
+ "ln",
203
+ "lo",
204
+ "ltg",
205
+ "lt",
206
+ "lv",
207
+ "mad",
208
+ "mai",
209
+ "map_bms",
210
+ "mdf",
211
+ "mg",
212
+ "mhr",
213
+ "min",
214
+ "mi",
215
+ "mk",
216
+ "ml",
217
+ "mni",
218
+ "mn",
219
+ "mnw",
220
+ "mrj",
221
+ "mr",
222
+ "ms",
223
+ "mt",
224
+ "mwl",
225
+ "myv",
226
+ "my",
227
+ "mzn",
228
+ "nah",
229
+ "nap",
230
+ "nds_nl",
231
+ "nds",
232
+ "ne",
233
+ "new",
234
+ "nia",
235
+ "nl",
236
+ "nn",
237
+ "nov",
238
+ "no",
239
+ "nqo",
240
+ "nrm",
241
+ "nso",
242
+ "nv",
243
+ "ny",
244
+ "oc",
245
+ "olo",
246
+ "om",
247
+ "or",
248
+ "os",
249
+ "pag",
250
+ "pam",
251
+ "pap",
252
+ "pa",
253
+ "pcd",
254
+ "pcm",
255
+ "pdc",
256
+ "pfl",
257
+ "pih",
258
+ "pi",
259
+ "pl",
260
+ "pms",
261
+ "pnb",
262
+ "pnt",
263
+ "ps",
264
+ "pt",
265
+ "pwn",
266
+ "qu",
267
+ "rm",
268
+ "rmy",
269
+ "rn",
270
+ "roa_rup",
271
+ "roa_tara",
272
+ "ro",
273
+ "rue",
274
+ "ru",
275
+ "rw",
276
+ "sah",
277
+ "sat",
278
+ "sa",
279
+ "scn",
280
+ "sco",
281
+ "sc",
282
+ "sd",
283
+ "se",
284
+ "sg",
285
+ "shi",
286
+ "shn",
287
+ "sh",
288
+ "simple",
289
+ "si",
290
+ "skr",
291
+ "sk",
292
+ "sl",
293
+ "smn",
294
+ "sm",
295
+ "sn",
296
+ "so",
297
+ "sq",
298
+ "srn",
299
+ "sr",
300
+ "ss",
301
+ "stq",
302
+ "st",
303
+ "su",
304
+ "sv",
305
+ "sw",
306
+ "szl",
307
+ "szy",
308
+ "ta",
309
+ "tay",
310
+ "tcy",
311
+ "tet",
312
+ "te",
313
+ "tg",
314
+ "th",
315
+ "ti",
316
+ "tk",
317
+ "tl",
318
+ "tly",
319
+ "tn",
320
+ "to",
321
+ "tpi",
322
+ "trv",
323
+ "tr",
324
+ "ts",
325
+ "tt",
326
+ "tum",
327
+ "tw",
328
+ "tyv",
329
+ "ty",
330
+ "udm",
331
+ "ug",
332
+ "uk",
333
+ "ur",
334
+ "uz",
335
+ "vec",
336
+ "vep",
337
+ "ve",
338
+ "vi",
339
+ "vls",
340
+ "vo",
341
+ "war",
342
+ "wa",
343
+ "wo",
344
+ "wuu",
345
+ "xal",
346
+ "xh",
347
+ "xmf",
348
+ "yi",
349
+ "yo",
350
+ "za",
351
+ "zea",
352
+ "zgh",
353
+ "zh_classical",
354
+ "zh_min_nan",
355
+ "zh_yue",
356
+ "zh",
357
+ "zu"
358
+ ],
359
+ "errors": {},
360
+ "splits": {
361
+ "ff": [
362
+ "train"
363
+ ]
364
+ }
365
+ },
366
+ "name": "HuggingFaceFW/finewiki",
367
+ "recorded_at": "2025-10-30T18:40:56.351085Z",
368
+ "sources": [
369
+ {
370
+ "config": "ff",
371
+ "name": "HuggingFaceFW/finewiki",
372
+ "origin": "streaming",
373
+ "resolved_config": "ff",
374
+ "streaming": true
375
+ }
376
+ ],
377
+ "splits": {
378
+ "train": "train",
379
+ "validation": "validation"
380
+ },
381
+ "streaming": true,
382
+ "subset": null
383
+ }
384
+ ],
385
+ "dataset_parameters_last_update": "2025-10-30T18:40:56.351085Z",
386
+ "dtype": "bfloat16",
387
+ "eos_token_id": 2,
388
+ "head_dim": 32,
389
+ "hidden_act": "silu",
390
+ "hidden_size": 128,
391
+ "initializer_range": 0.02,
392
+ "intermediate_size": 512,
393
+ "max_position_embeddings": 256,
394
+ "mlp_bias": false,
395
+ "model_type": "llama",
396
+ "num_attention_heads": 4,
397
+ "num_hidden_layers": 1,
398
+ "num_key_value_heads": 4,
399
+ "pad_token_id": 3,
400
+ "pretraining_tp": 1,
401
+ "rms_norm_eps": 1e-05,
402
+ "rope_scaling": null,
403
+ "rope_theta": 10000.0,
404
+ "tie_word_embeddings": false,
405
+ "transformers_version": "4.57.1",
406
+ "use_cache": false,
407
+ "vocab_size": 104
408
+ }
generation_config.json ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "bos_token_id": 1,
4
+ "eos_token_id": 2,
5
+ "pad_token_id": 3,
6
+ "transformers_version": "4.57.1",
7
+ "use_cache": false
8
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:98c34ba7c11ef27782917ee46e3c4384cfe7782bbe1554834ae87f863398bdaa
3
+ size 579544
tokenizer_config.json CHANGED
@@ -1,6 +1,6 @@
1
  {
2
  "add_bos_token": true,
3
- "add_eos_token": false,
4
  "add_prefix_space": true,
5
  "added_tokens_decoder": {
6
  "0": {
@@ -117,6 +117,7 @@
117
  "legacy": true,
118
  "model_max_length": 1000000000000000019884624838656,
119
  "pad_token": "<pad>",
 
120
  "sp_model_kwargs": {},
121
  "spaces_between_special_tokens": false,
122
  "tokenizer_class": "LlamaTokenizer",
 
1
  {
2
  "add_bos_token": true,
3
+ "add_eos_token": true,
4
  "add_prefix_space": true,
5
  "added_tokens_decoder": {
6
  "0": {
 
117
  "legacy": true,
118
  "model_max_length": 1000000000000000019884624838656,
119
  "pad_token": "<pad>",
120
+ "padding_side": "left",
121
  "sp_model_kwargs": {},
122
  "spaces_between_special_tokens": false,
123
  "tokenizer_class": "LlamaTokenizer",