JonusNattapong commited on
Commit
f9c4ccf
·
verified ·
1 Parent(s): b71c326

Upload folder using huggingface_hub

Browse files
Files changed (4) hide show
  1. README.md +21 -0
  2. config.json +32 -0
  3. pytorch_model.bin +3 -0
  4. tokenizer.json +1022 -0
README.md ADDED
@@ -0,0 +1,21 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # wilai-2.5 (draft)
2
+
3
+ This folder contains prepared artifacts for the `wilai-2.5` release (development draft).
4
+
5
+ Contents:
6
+ - `config.json` (copied from v2.0, may be adjusted)
7
+ - `tokenizer.json` (canonical tokenizer copied from v2.0)
8
+ - `pytorch_model.bin` (converted or to-be-converted checkpoint for v2.5)
9
+
10
+ Notes:
11
+ - The v2 model uses a new modular layer `SecretLayer` and a SwiGLU MLP (see `wilai_transformers/modeling_wilai_v2.py`).
12
+ - This implementation is experimental and intended for testing. Do not publish publicly without review if you intend the `SecretLayer` to remain private.
13
+
14
+ How to test locally:
15
+
16
+ ```powershell
17
+ $env:PYTHONPATH='D:\GitHub\Ai-Thai-wilai'
18
+ python -c "from wilai_transformers.modeling_wilai_v2 import WilaiForCausalLMV2; print('import ok')"
19
+ ```
20
+
21
+ When you're ready, I can upload this folder to Hugging Face as `JonusNattapong/wilai-2.5` and include the converted checkpoint. If you want me to upload now, confirm and I'll push the prepared files to the new repo.
config.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "JonusNattapong/wilai-2.0",
3
+ "model_type": "wilai",
4
+ "vocab_size": 1000,
5
+ "hidden_size": 512,
6
+ "num_hidden_layers": 6,
7
+ "num_attention_heads": 8,
8
+ "max_position_embeddings": 128,
9
+ "initializer_range": 0.02,
10
+ "layer_norm_epsilon": 1e-5,
11
+ "embd_pdrop": 0.1,
12
+ "attn_pdrop": 0.1,
13
+ "resid_pdrop": 0.1,
14
+ "activation_function": "gelu",
15
+ "n_inner": null,
16
+ "use_cache": true,
17
+ "bos_token_id": 1,
18
+ "eos_token_id": 2,
19
+ "pad_token_id": 0,
20
+ "tie_word_embeddings": false,
21
+ "use_gradient_checkpointing": true,
22
+ "use_mixed_precision": false,
23
+ "gradient_clip_norm": 1.0,
24
+ "model_name": "wilai-2.0",
25
+ "model_version": "1.0.0",
26
+ "description": "Thai-specific GPT-like language model",
27
+ "created_at": "2025-10-27T11:44:35.229069",
28
+ "training_completed": true,
29
+ "total_steps": 16600,
30
+ "best_val_loss": 2.707622994680773,
31
+ "training_time": 58012.46856427193
32
+ }
pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:854f68930029c898337c6dd9720c26cb17a4da95020db03f2819b4a11eb1e8bb
3
+ size 80046702
tokenizer.json ADDED
@@ -0,0 +1,1022 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": null,
4
+ "padding": null,
5
+ "added_tokens": [],
6
+ "normalizer": null,
7
+ "pre_tokenizer": {
8
+ "type": "Whitespace"
9
+ },
10
+ "post_processor": null,
11
+ "decoder": {
12
+ "type": "WordPiece",
13
+ "prefix": "",
14
+ "cleanup": true
15
+ },
16
+ "model": {
17
+ "type": "WordLevel",
18
+ "vocab": {
19
+ "<unk>": 0,
20
+ "<s>": 1,
21
+ "</s>": 2,
22
+ "[UNK]": 3,
23
+ "[CLS]": 4,
24
+ "[SEP]": 5,
25
+ "[PAD]": 6,
26
+ "[MASK]": 7,
27
+ "▁เ": 8,
28
+ "▁ก": 9,
29
+ "▁แ": 10,
30
+ "▁ส": 11,
31
+ "▁ท": 12,
32
+ "าร": 13,
33
+ "▁อ": 14,
34
+ "อง": 15,
35
+ "▁ใ": 16,
36
+ "▁ม": 17,
37
+ "ี่": 18,
38
+ "ระ": 19,
39
+ "▁ค": 20,
40
+ "ํา": 21,
41
+ "▁ไ": 22,
42
+ "▁ข": 23,
43
+ "▁ป": 24,
44
+ "่า": 25,
45
+ "▁จ": 26,
46
+ "▁ห": 27,
47
+ "▁ต": 28,
48
+ "▁พ": 29,
49
+ "▁ร": 30,
50
+ "▁โ": 31,
51
+ "ัน": 32,
52
+ "▁ที่": 33,
53
+ "▁น": 34,
54
+ "▁ใน": 35,
55
+ "ละ": 36,
56
+ "▁การ": 37,
57
+ "ีย": 38,
58
+ "▁ว": 39,
59
+ "็น": 40,
60
+ "▁เป": 41,
61
+ "้า": 42,
62
+ "่ง": 43,
63
+ "▁และ": 44,
64
+ "าม": 45,
65
+ "าก": 46,
66
+ "▁เป็น": 47,
67
+ "ับ": 48,
68
+ "่อ": 49,
69
+ "▁ของ": 50,
70
+ "▁ด": 51,
71
+ "าย": 52,
72
+ "ือ": 53,
73
+ "้น": 54,
74
+ "ร์": 55,
75
+ "▁มี": 56,
76
+ "ัง": 57,
77
+ "▁ช": 58,
78
+ "▁บ": 59,
79
+ "าน": 60,
80
+ "ัก": 61,
81
+ "▁ประ": 62,
82
+ "าง": 63,
83
+ "▁ล": 64,
84
+ "ด้": 65,
85
+ "ภา": 66,
86
+ "ู่": 67,
87
+ "▁ย": 68,
88
+ "่น": 69,
89
+ "ิน": 70,
90
+ "รร": 71,
91
+ "▁ได้": 72,
92
+ "ื่อ": 73,
93
+ "าว": 74,
94
+ "ริ": 75,
95
+ "่ว": 76,
96
+ "▁ซ": 77,
97
+ "ทย": 78,
98
+ "หม": 79,
99
+ "้ง": 80,
100
+ "อก": 81,
101
+ "คร": 82,
102
+ "้อ": 83,
103
+ "การ": 84,
104
+ "ติ": 85,
105
+ "่าง": 86,
106
+ "ั้ง": 87,
107
+ "ัด": 88,
108
+ "าส": 89,
109
+ "▁ผ": 90,
110
+ "an": 91,
111
+ "▁หม": 92,
112
+ "วาม": 93,
113
+ "เท": 94,
114
+ "▁ภา": 95,
115
+ "▁โด": 96,
116
+ "ษา": 97,
117
+ "าช": 98,
118
+ "▁โดย": 99,
119
+ "er": 100,
120
+ "ึ่ง": 101,
121
+ "ตร": 102,
122
+ "on": 103,
123
+ "▁เก": 104,
124
+ "ัย": 105,
125
+ "▁เพ": 106,
126
+ "▁ความ": 107,
127
+ "in": 108,
128
+ "ศาส": 109,
129
+ "ิด": 110,
130
+ "อร์": 111,
131
+ "นา": 112,
132
+ "▁เม": 113,
133
+ "่ม": 114,
134
+ "าล": 115,
135
+ "▁ถ": 116,
136
+ "วด": 117,
137
+ "▁วิ": 118,
138
+ "▁ระ": 119,
139
+ "ที่": 120,
140
+ "ัว": 121,
141
+ "▁อย": 122,
142
+ "▁เข": 123,
143
+ "ตร์": 124,
144
+ "หล": 125,
145
+ "่อง": 126,
146
+ "▁ไม": 127,
147
+ "เทศ": 128,
148
+ "ี้": 129,
149
+ "▁กล": 130,
150
+ "ู้": 131,
151
+ "หน": 132,
152
+ "▁เร": 133,
153
+ "ึง": 134,
154
+ "▁พระ": 135,
155
+ "or": 136,
156
+ "ประ": 137,
157
+ "ห้": 138,
158
+ "▁หมวด": 139,
159
+ "บบ": 140,
160
+ "at": 141,
161
+ "en": 142,
162
+ "หมู่": 143,
163
+ "ศาสตร์": 144,
164
+ "▁จาก": 145,
165
+ "้ว": 146,
166
+ "▁หมวดหมู่": 147,
167
+ "ช้": 148,
168
+ "▁เช": 149,
169
+ "ั้น": 150,
170
+ "ุด": 151,
171
+ "ิต": 152,
172
+ "▁S": 153,
173
+ "อน": 154,
174
+ "al": 155,
175
+ "้าง": 156,
176
+ "es": 157,
177
+ "▁ว่า": 158,
178
+ "ิง": 159,
179
+ "▁ทาง": 160,
180
+ "รือ": 161,
181
+ "▁จะ": 162,
182
+ "ar": 163,
183
+ "หว": 164,
184
+ "ียง": 165,
185
+ "▁ภาษา": 166,
186
+ "▁หน": 167,
187
+ "▁ใช้": 168,
188
+ "รรม": 169,
189
+ "▁ปี": 170,
190
+ "▁อา": 171,
191
+ "ื่อง": 172,
192
+ "▁มา": 173,
193
+ "มา": 174,
194
+ "▁A": 175,
195
+ "ียน": 176,
196
+ "▁เท": 177,
197
+ "ัฐ": 178,
198
+ "▁หล": 179,
199
+ "▁หรือ": 180,
200
+ "▁พศ": 181,
201
+ "อบ": 182,
202
+ "▁ซึ่ง": 183,
203
+ "▁กับ": 184,
204
+ "เล": 185,
205
+ "ัญ": 186,
206
+ "ําน": 187,
207
+ "้าน": 188,
208
+ "าะ": 189,
209
+ "▁เด": 190,
210
+ "▁C": 191,
211
+ "▁เส": 192,
212
+ "เม": 193,
213
+ "▁ไม่": 194,
214
+ "ย์": 195,
215
+ "ําเ": 196,
216
+ "th": 197,
217
+ "ี่ย": 198,
218
+ "วน": 199,
219
+ "ต่": 200,
220
+ "รับ": 201,
221
+ "้อง": 202,
222
+ "▁ศ": 203,
223
+ "▁คือ": 204,
224
+ "่วน": 205,
225
+ "คม": 206,
226
+ "▁T": 207,
227
+ "▁สม": 208,
228
+ "▁ผู้": 209,
229
+ "ึก": 210,
230
+ "▁เล": 211,
231
+ "รี": 212,
232
+ "ูล": 213,
233
+ "ือง": 214,
234
+ "▁ให้": 215,
235
+ "▁ฟ": 216,
236
+ "กร": 217,
237
+ "ic": 218,
238
+ "▁ภ": 219,
239
+ "ต์": 220,
240
+ "รง": 221,
241
+ "is": 222,
242
+ "งาน": 223,
243
+ "ธิ": 224,
244
+ "เด": 225,
245
+ "วง": 226,
246
+ "▁ประเทศ": 227,
247
+ "กล": 228,
248
+ "▁ทํา": 229,
249
+ "▁ๆ": 230,
250
+ "ดับ": 231,
251
+ "▁ไป": 232,
252
+ "จาก": 233,
253
+ "▁M": 234,
254
+ "it": 235,
255
+ "ิก": 236,
256
+ "ูก": 237,
257
+ "ion": 238,
258
+ "▁เอ": 239,
259
+ "ุ่ม": 240,
260
+ "มพ": 241,
261
+ "▁อยู่": 242,
262
+ "้อม": 243,
263
+ "▁P": 244,
264
+ "ชา": 245,
265
+ "ลา": 246,
266
+ "ึ้น": 247,
267
+ "ัต": 248,
268
+ "อย": 249,
269
+ "▁เว": 250,
270
+ "เร": 251,
271
+ "▁ตัว": 252,
272
+ "ณะ": 253,
273
+ "▁o": 254,
274
+ "▁มห": 255,
275
+ "ิทย": 256,
276
+ "▁สถ": 257,
277
+ "ณ์": 258,
278
+ "วก": 259,
279
+ "ื่น": 260,
280
+ "▁ส่วน": 261,
281
+ "▁แต่": 262,
282
+ "โล": 263,
283
+ "่าน": 264,
284
+ "▁สาม": 265,
285
+ "▁นิ": 266,
286
+ "ักษ": 267,
287
+ "้ํา": 268,
288
+ "ห่ง": 269,
289
+ "▁ออก": 270,
290
+ "▁วิทย": 271,
291
+ "▁เน": 272,
292
+ "▁of": 273,
293
+ "▁นัก": 274,
294
+ "▁วัน": 275,
295
+ "้วย": 276,
296
+ "เข": 277,
297
+ "าลัย": 278,
298
+ "▁เมื่อ": 279,
299
+ "หญ": 280,
300
+ "▁ธ": 281,
301
+ "▁ทั้ง": 282,
302
+ "▁มาก": 283,
303
+ "▁I": 284,
304
+ "รก": 285,
305
+ "▁อย่าง": 286,
306
+ "▁รัฐ": 287,
307
+ "เต": 288,
308
+ "▁คศ": 289,
309
+ "าศ": 290,
310
+ "▁ต่อ": 291,
311
+ "▁ยัง": 292,
312
+ "ัติ": 293,
313
+ "เก": 294,
314
+ "▁ไทย": 295,
315
+ "ูป": 296,
316
+ "ว่า": 297,
317
+ "▁ด้วย": 298,
318
+ "ุม": 299,
319
+ "▁B": 300,
320
+ "▁พื": 301,
321
+ "ันธ": 302,
322
+ "ุก": 303,
323
+ "ภาพ": 304,
324
+ "▁เพื่อ": 305,
325
+ "le": 306,
326
+ "มิ": 307,
327
+ "ทร": 308,
328
+ "ค์": 309,
329
+ "▁คํา": 310,
330
+ "้อมูล": 311,
331
+ "ํานวน": 312,
332
+ "ิจ": 313,
333
+ "ึกษา": 314,
334
+ "เป": 315,
335
+ "▁คน": 316,
336
+ "▁กลุ่ม": 317,
337
+ "▁แห่ง": 318,
338
+ "▁ดาว": 319,
339
+ "าบ": 320,
340
+ "เว": 321,
341
+ "▁จํานวน": 322,
342
+ "ารถ": 323,
343
+ "ro": 324,
344
+ "หวัด": 325,
345
+ "หญ่": 326,
346
+ "▁จัด": 327,
347
+ "▁เช่น": 328,
348
+ "▁p": 329,
349
+ "ต้": 330,
350
+ "คล": 331,
351
+ "▁นี้": 332,
352
+ "▁N": 333,
353
+ "ังหวัด": 334,
354
+ "ราช": 335,
355
+ "ัส": 336,
356
+ "▁อื่น": 337,
357
+ "and": 338,
358
+ "าร์": 339,
359
+ "▁ตาม": 340,
360
+ "▁กร": 341,
361
+ "วัน": 342,
362
+ "ol": 343,
363
+ "▁th": 344,
364
+ "ไป": 345,
365
+ "▁คร": 346,
366
+ "▁ราช": 347,
367
+ "▁รูป": 348,
368
+ "▁H": 349,
369
+ "หาร": 350,
370
+ "เซ": 351,
371
+ "▁บริ": 352,
372
+ "▁D": 353,
373
+ "วม": 354,
374
+ "ดี": 355,
375
+ "กัน": 356,
376
+ "▁โล": 357,
377
+ "re": 358,
378
+ "▁F": 359,
379
+ "▁ก็": 360,
380
+ "▁กระ": 361,
381
+ "ฤษ": 362,
382
+ "▁R": 363,
383
+ "▁ฝ": 364,
384
+ "ถึง": 365,
385
+ "สุด": 366,
386
+ "ั่ง": 367,
387
+ "▁L": 368,
388
+ "▁ฮ": 369,
389
+ "▁แบบ": 370,
390
+ "▁ยุ": 371,
391
+ "▁ผล": 372,
392
+ "ส์": 373,
393
+ "▁สุ": 374,
394
+ "▁แล": 375,
395
+ "▁ขึ้น": 376,
396
+ "▁f": 377,
397
+ "จ้า": 378,
398
+ "ิล": 379,
399
+ "ิว": 380,
400
+ "น์": 381,
401
+ "ูมิ": 382,
402
+ "▁สามารถ": 383,
403
+ "▁G": 384,
404
+ "▁สํา": 385,
405
+ "▁จังหวัด": 386,
406
+ "▁s": 387,
407
+ "้อย": 388,
408
+ "▁แม": 389,
409
+ "ีน": 390,
410
+ "▁ต่าง": 391,
411
+ "เส": 392,
412
+ "▁อี": 393,
413
+ "ภอ": 394,
414
+ "▁ถูก": 395,
415
+ "ําเภอ": 396,
416
+ "อล": 397,
417
+ "▁อุ": 398,
418
+ "ะวัน": 399,
419
+ "ฐาน": 400,
420
+ "ีว": 401,
421
+ "as": 402,
422
+ "▁อําเภอ": 403,
423
+ "▁ชาว": 404,
424
+ "▁E": 405,
425
+ "ลง": 406,
426
+ "อด": 407,
427
+ "▁สิ": 408,
428
+ "▁เคร": 409,
429
+ "่าย": 410,
430
+ "▁ตั้ง": 411,
431
+ "▁c": 412,
432
+ "ญา": 413,
433
+ "รม": 414,
434
+ "▁เข้า": 415,
435
+ "ิส": 416,
436
+ "▁เซ": 417,
437
+ "us": 418,
438
+ "he": 419,
439
+ "ังก": 420,
440
+ "▁ระบบ": 421,
441
+ "็ก": 422,
442
+ "ให้": 423,
443
+ "ิทยาลัย": 424,
444
+ "ประเทศ": 425,
445
+ "นุ": 426,
446
+ "▁มหาว": 427,
447
+ "▁มหาวิทยาลัย": 428,
448
+ "สม": 429,
449
+ "ation": 430,
450
+ "เตอร์": 431,
451
+ "ปร": 432,
452
+ "นี้": 433,
453
+ "จจ": 434,
454
+ "▁นั้น": 435,
455
+ "ศึกษา": 436,
456
+ "ร้าง": 437,
457
+ "▁ถึง": 438,
458
+ "▁พื้น": 439,
459
+ "ัฒ": 440,
460
+ "el": 441,
461
+ "วย": 442,
462
+ "ูง": 443,
463
+ "▁เรีย": 444,
464
+ "ตั้ง": 445,
465
+ "ur": 446,
466
+ "ตก": 447,
467
+ "็จ": 448,
468
+ "เช": 449,
469
+ "▁ช่ว": 450,
470
+ "าท": 451,
471
+ "ing": 452,
472
+ "▁the": 453,
473
+ "ดง": 454,
474
+ "กรรม": 455,
475
+ "ชาติ": 456,
476
+ "ac": 457,
477
+ "▁เมือง": 458,
478
+ "ก่": 459,
479
+ "▁ด้าน": 460,
480
+ "om": 461,
481
+ "ักร": 462,
482
+ "▁แบ": 463,
483
+ "▁สห": 464,
484
+ "ทาง": 465,
485
+ "ื้อ": 466,
486
+ "ed": 467,
487
+ "ดน": 468,
488
+ "▁รวม": 469,
489
+ "ุ่น": 470,
490
+ "▁วิทยา": 471,
491
+ "▁ได้รับ": 472,
492
+ "▁แล้ว": 473,
493
+ "บุ": 474,
494
+ "วรร": 475,
495
+ "et": 476,
496
+ "ัล": 477,
497
+ "ูน": 478,
498
+ "▁ปั": 479,
499
+ "▁กัน": 480,
500
+ "ิม": 481,
501
+ "▁ชื่อ": 482,
502
+ "ent": 483,
503
+ "เน": 484,
504
+ "หนือ": 485,
505
+ "่าว": 486,
506
+ "▁ประก": 487,
507
+ "มาณ": 488,
508
+ "▁โลก": 489,
509
+ "▁ปร": 490,
510
+ "ือน": 491,
511
+ "่อน": 492,
512
+ "ธรรม": 493,
513
+ "▁ปัจจ": 494,
514
+ "▁t": 495,
515
+ "▁แส": 496,
516
+ "am": 497,
517
+ "หา": 498,
518
+ "ิท": 499,
519
+ "เศ": 500,
520
+ "▁ราย": 501,
521
+ "ัพ": 502,
522
+ "▁หนึ่ง": 503,
523
+ "ออก": 504,
524
+ "▁อัน": 505,
525
+ "▁m": 506,
526
+ "▁อีก": 507,
527
+ "โน": 508,
528
+ "▁เครื่อง": 509,
529
+ "ตุ": 510,
530
+ "▁O": 511,
531
+ "▁ดัง": 512,
532
+ "▁ข้อมูล": 513,
533
+ "ุบ": 514,
534
+ "ใหญ่": 515,
535
+ "เมือง": 516,
536
+ "ั่ว": 517,
537
+ "▁and": 518,
538
+ "il": 519,
539
+ "กับ": 520,
540
+ "▁W": 521,
541
+ "▁กํา": 522,
542
+ "ig": 523,
543
+ "▁บาง": 524,
544
+ "ุน": 525,
545
+ "ยาย": 526,
546
+ "▁อ้าง": 527,
547
+ "▁เรื่อง": 528,
548
+ "หรับ": 529,
549
+ "รัฐ": 530,
550
+ "▁สา": 531,
551
+ "หว่าง": 532,
552
+ "▁ระหว่าง": 533,
553
+ "ณา": 534,
554
+ "▁ภาค": 535,
555
+ "▁แหล": 536,
556
+ "▁d": 537,
557
+ "ิ่ม": 538,
558
+ "ความ": 539,
559
+ "▁ตะวัน": 540,
560
+ "จํา": 541,
561
+ "ากาศ": 542,
562
+ "▁K": 543,
563
+ "อม": 544,
564
+ "▁เรียก": 545,
565
+ "un": 546,
566
+ "ลี่ย": 547,
567
+ "ผล": 548,
568
+ "พิ": 549,
569
+ "▁วง": 550,
570
+ "ia": 551,
571
+ "ากร": 552,
572
+ "เรียน": 553,
573
+ "หม่": 554,
574
+ "ุบัน": 555,
575
+ "ชน": 556,
576
+ "um": 557,
577
+ "ยา": 558,
578
+ "▁ฉ": 559,
579
+ "▁The": 560,
580
+ "▁จึง": 561,
581
+ "▁ประช": 562,
582
+ "อิง": 563,
583
+ "่งข": 564,
584
+ "▁หลาย": 565,
585
+ "▁อง": 566,
586
+ "ันธ์": 567,
587
+ "▁อ้างอิง": 568,
588
+ "▁ปัจจุบัน": 569,
589
+ "▁เพิ่ม": 570,
590
+ "▁เห": 571,
591
+ "รา": 572,
592
+ "ห์": 573,
593
+ "▁อิน": 574,
594
+ "▁คณะ": 575,
595
+ "ec": 576,
596
+ "▁ที่สุด": 577,
597
+ "▁มิ": 578,
598
+ "▁U": 579,
599
+ "▁b": 580,
600
+ "ัม": 581,
601
+ "▁โคร": 582,
602
+ "ครอง": 583,
603
+ "ตรี": 584,
604
+ "▁ทําให้": 585,
605
+ "ุง": 586,
606
+ "▁ชน": 587,
607
+ "▁สี": 588,
608
+ "▁หลัก": 589,
609
+ "▁ไม้": 590,
610
+ "▁แน": 591,
611
+ "ut": 592,
612
+ "▁ดู": 593,
613
+ "▁ช่วง": 594,
614
+ "ด์": 595,
615
+ "ตัว": 596,
616
+ "ใต้": 597,
617
+ "่วย": 598,
618
+ "▁กิ": 599,
619
+ "ดิ": 600,
620
+ "▁ภาพ": 601,
621
+ "นาด": 602,
622
+ "▁เบ": 603,
623
+ "้าย": 604,
624
+ "▁สถาน": 605,
625
+ "ag": 606,
626
+ "าด": 607,
627
+ "ือก": 608,
628
+ "▁นํา": 609,
629
+ "▁โรง": 610,
630
+ "็บ": 611,
631
+ "▁In": 612,
632
+ "▁ใบ": 613,
633
+ "นิ": 614,
634
+ "▁เฉ": 615,
635
+ "▁in": 616,
636
+ "▁n": 617,
637
+ "▁เกิด": 618,
638
+ "▁เกี่ย": 619,
639
+ "พาะ": 620,
640
+ "สาร": 621,
641
+ "▁แผ": 622,
642
+ "▁เขต": 623,
643
+ "แก่": 624,
644
+ "▁วันที่": 625,
645
+ "▁ง": 626,
646
+ "เบ": 627,
647
+ "▁ภูมิ": 628,
648
+ "เซีย": 629,
649
+ "ุล": 630,
650
+ "ต้น": 631,
651
+ "จะ": 632,
652
+ "หมาย": 633,
653
+ "ศ์": 634,
654
+ "▁แบ่ง": 635,
655
+ "iv": 636,
656
+ "เฉ": 637,
657
+ "▁ไว": 638,
658
+ "▁ภาย": 639,
659
+ "▁คล": 640,
660
+ "▁น้ํา": 641,
661
+ "▁สําหรับ": 642,
662
+ "▁แก": 643,
663
+ "▁เขา": 644,
664
+ "im": 645,
665
+ "ทน": 646,
666
+ "▁a": 647,
667
+ "▁สร้าง": 648,
668
+ "ัท": 649,
669
+ "อมพ": 650,
670
+ "▁สูง": 651,
671
+ "ใจ": 652,
672
+ "▁บุ": 653,
673
+ "คัญ": 654,
674
+ "บาล": 655,
675
+ "▁โครง": 656,
676
+ "ษฐ": 657,
677
+ "▁เทค": 658,
678
+ "ลาย": 659,
679
+ "▁ตอน": 660,
680
+ "▁หมาย": 661,
681
+ "▁หน่วย": 662,
682
+ "โร": 663,
683
+ "แบบ": 664,
684
+ "▁เค": 665,
685
+ "▁ได้แก่": 666,
686
+ "ังกฤษ": 667,
687
+ "เมตร": 668,
688
+ "▁สัง": 669,
689
+ "รรค": 670,
690
+ "ด้วย": 671,
691
+ "ot": 672,
692
+ "้อน": 673,
693
+ "่วม": 674,
694
+ "▁ลํา": 675,
695
+ "ศาสนา": 676,
696
+ "ชื่อ": 677,
697
+ "▁ประมาณ": 678,
698
+ "▁ในประเทศ": 679,
699
+ "em": 680,
700
+ "oc": 681,
701
+ "ist": 682,
702
+ "▁โอ": 683,
703
+ "อยู่": 684,
704
+ "▁ประกอบ": 685,
705
+ "ันท": 686,
706
+ "อมพิว": 687,
707
+ "อมพิวเตอร์": 688,
708
+ "st": 689,
709
+ "ีวิต": 690,
710
+ "▁ระดับ": 691,
711
+ "แต่": 692,
712
+ "▁ลง": 693,
713
+ "▁เจ้า": 694,
714
+ "▁พื้นที่": 695,
715
+ "▁ต้อง": 696,
716
+ "id": 697,
717
+ "▁จน": 698,
718
+ "ิทยา": 699,
719
+ "กครอง": 700,
720
+ "ลัง": 701,
721
+ "ริ่ม": 702,
722
+ "▁ขนาด": 703,
723
+ "ra": 704,
724
+ "ล์": 705,
725
+ "ลี่ยน": 706,
726
+ "ธี": 707,
727
+ "▁นา": 708,
728
+ "▁นอก": 709,
729
+ "▁บน": 710,
730
+ "▁J": 711,
731
+ "าติ": 712,
732
+ "▁เย": 713,
733
+ "▁จีน": 714,
734
+ "▁ญ": 715,
735
+ "ียว": 716,
736
+ "▁ทุก": 717,
737
+ "▁วิทยาศาสตร์": 718,
738
+ "จักร": 719,
739
+ "บุรี": 720,
740
+ "▁ทรง": 721,
741
+ "ัช": 722,
742
+ "▁ดี": 723,
743
+ "▁สิ่ง": 724,
744
+ "กา": 725,
745
+ "เจ้า": 726,
746
+ "ต่อ": 727,
747
+ "อากาศ": 728,
748
+ "▁ยุค": 729,
749
+ "เป็น": 730,
750
+ "ําเน": 731,
751
+ "▁ลักษ": 732,
752
+ "▁มาจาก": 733,
753
+ "ยน": 734,
754
+ "ไม": 735,
755
+ "ers": 736,
756
+ "▁ริ": 737,
757
+ "ยม": 738,
758
+ "ยี": 739,
759
+ "ังส": 740,
760
+ "▁โปร": 741,
761
+ "โนโล": 742,
762
+ "โนโลยี": 743,
763
+ "ณฑ": 744,
764
+ "ch": 745,
765
+ "วกับ": 746,
766
+ "▁เจ": 747,
767
+ "ขึ้น": 748,
768
+ "รู้": 749,
769
+ "▁สง": 750,
770
+ "▁ครั้ง": 751,
771
+ "ul": 752,
772
+ "รรณ": 753,
773
+ "▁ดอก": 754,
774
+ "วัติ": 755,
775
+ "มี": 756,
776
+ "เด็จ": 757,
777
+ "ิศ": 758,
778
+ "ะเล": 759,
779
+ "วิทยา": 760,
780
+ "ใน": 761,
781
+ "▁เส้น": 762,
782
+ "▁การป": 763,
783
+ "ธาน": 764,
784
+ "บัติ": 765,
785
+ "▁ความส": 766,
786
+ "▁ต้น": 767,
787
+ "▁พรรค": 768,
788
+ "▁ศาสนา": 769,
789
+ "og": 770,
790
+ "นตรี": 771,
791
+ "▁ดวง": 772,
792
+ "▁เหล": 773,
793
+ "▁St": 774,
794
+ "▁พิ": 775,
795
+ "▁แนว": 776,
796
+ "กรม": 777,
797
+ "▁ซี": 778,
798
+ "▁แรก": 779,
799
+ "เคร": 780,
800
+ "ได้": 781,
801
+ "▁ชั้น": 782,
802
+ "▁คอมพิวเตอร์": 783,
803
+ "▁ลักษณะ": 784,
804
+ "ัฒนา": 785,
805
+ "าการ": 786,
806
+ "เหนือ": 787,
807
+ "▁ใหม่": 788,
808
+ "▁ยาว": 789,
809
+ "รั่ง": 790,
810
+ "▁ทั่ว": 791,
811
+ "▁l": 792,
812
+ "▁สน": 793,
813
+ "▁การศึกษา": 794,
814
+ "วี": 795,
815
+ "▁ไว้": 796,
816
+ "เอ": 797,
817
+ "โด": 798,
818
+ "มพ์": 799,
819
+ "นั้น": 800,
820
+ "▁องค์": 801,
821
+ "▁เริ่ม": 802,
822
+ "ter": 803,
823
+ "นุ��": 804,
824
+ "▁รา": 805,
825
+ "▁ออ": 806,
826
+ "▁กรุง": 807,
827
+ "op": 808,
828
+ "▁อาจ": 809,
829
+ "อย่าง": 810,
830
+ "▁เทคโนโลยี": 811,
831
+ "ซ์": 812,
832
+ "ี่ป": 813,
833
+ "▁ก่อ": 814,
834
+ "▁ดิน": 815,
835
+ "ี่ปุ่น": 816,
836
+ "▁เสียง": 817,
837
+ "▁รับ": 818,
838
+ "▁ญี่ปุ่น": 819,
839
+ "าบัน": 820,
840
+ "▁หลัง": 821,
841
+ "▁ใหญ่": 822,
842
+ "▁ฝรั่ง": 823,
843
+ "เศส": 824,
844
+ "รษฐ": 825,
845
+ "▁สถาบัน": 826,
846
+ "ิทธิ": 827,
847
+ "็ม": 828,
848
+ "วรรษ": 829,
849
+ "▁ฝรั่งเศส": 830,
850
+ "ังสือ": 831,
851
+ "เดีย": 832,
852
+ "วบ": 833,
853
+ "ภูมิ": 834,
854
+ "ัญญา": 835,
855
+ "ทธ": 836,
856
+ "แล": 837,
857
+ "ายน": 838,
858
+ "ักษร": 839,
859
+ "ริส": 840,
860
+ "▁เต": 841,
861
+ "▁ติด": 842,
862
+ "▁เชิง": 843,
863
+ "▁พบ": 844,
864
+ "▁โค": 845,
865
+ "หนึ่ง": 846,
866
+ "▁อิ": 847,
867
+ "กิจ": 848,
868
+ "▁จุด": 849,
869
+ "กลาง": 850,
870
+ "ชีวิต": 851,
871
+ "▁สมัย": 852,
872
+ "าคม": 853,
873
+ "▁คุ": 854,
874
+ "เชีย": 855,
875
+ "▁เกี่ยวกับ": 856,
876
+ "ess": 857,
877
+ "ําร": 858,
878
+ "▁โร": 859,
879
+ "▁งาน": 860,
880
+ "▁เดือน": 861,
881
+ "แดน": 862,
882
+ "▁แหล่งข": 863,
883
+ "ียบ": 864,
884
+ "เขียน": 865,
885
+ "▁กลาง": 866,
886
+ "▁ตั้งแต่": 867,
887
+ "▁แหล่งข้อมูล": 868,
888
+ "▁ปฏ": 869,
889
+ "▁แสดง": 870,
890
+ "▁ตะวันออก": 871,
891
+ "ce": 872,
892
+ "ณิต": 873,
893
+ "▁มนุษ": 874,
894
+ "เห": 875,
895
+ "ัมพ": 876,
896
+ "▁สาย": 877,
897
+ "▁สําคัญ": 878,
898
+ "ูนย์": 879,
899
+ "▁สอง": 880,
900
+ "ัฒน": 881,
901
+ "▁เนื้อ": 882,
902
+ "ขา": 883,
903
+ "▁ส่ง": 884,
904
+ "▁หมู่": 885,
905
+ "ดา": 886,
906
+ "พล": 887,
907
+ "ยะ": 888,
908
+ "ว์": 889,
909
+ "▁เง": 890,
910
+ "▁แป": 891,
911
+ "ํานา": 892,
912
+ "ไทย": 893,
913
+ "▁แค": 894,
914
+ "ํานัก": 895,
915
+ "เจ": 896,
916
+ "▁ตํา": 897,
917
+ "od": 898,
918
+ "▁เกาะ": 899,
919
+ "ี่ยว": 900,
920
+ "ฎี": 901,
921
+ "▁ร้อย": 902,
922
+ "ir": 903,
923
+ "ad": 904,
924
+ "▁แอ": 905,
925
+ "▁สาร": 906,
926
+ "▁ล้าน": 907,
927
+ "ดิน": 908,
928
+ "เขา": 909,
929
+ "หนด": 910,
930
+ "่อย": 911,
931
+ "▁ละ": 912,
932
+ "▁ลิ": 913,
933
+ "▁ปราก": 914,
934
+ "▁สมเด็จ": 915,
935
+ "พร": 916,
936
+ "หน้า": 917,
937
+ "พิมพ์": 918,
938
+ "ส่วน": 919,
939
+ "▁หัว": 920,
940
+ "ท์": 921,
941
+ "▁ไฟ": 922,
942
+ "▁V": 923,
943
+ "ิ่น": 924,
944
+ "โรป": 925,
945
+ "▁ประเ": 926,
946
+ "▁ประวัติ": 927,
947
+ "ันธุ": 928,
948
+ "▁จํา": 929,
949
+ "▁เอก": 930,
950
+ "▁กา": 931,
951
+ "กว่า": 932,
952
+ "คราม": 933,
953
+ "าชิก": 934,
954
+ "เสียง": 935,
955
+ "▁การส": 936,
956
+ "็ต": 937,
957
+ "บริ": 938,
958
+ "ษัท": 939,
959
+ "ํานาจ": 940,
960
+ "▁ปรากฏ": 941,
961
+ "▁อันดับ": 942,
962
+ "วล": 943,
963
+ "▁w": 944,
964
+ "รณ์": 945,
965
+ "หมด": 946,
966
+ "ณาจักร": 947,
967
+ "▁เขียน": 948,
968
+ "▁รูปแบบ": 949,
969
+ "ab": 950,
970
+ "▁คา": 951,
971
+ "▁เศ": 952,
972
+ "ฤษฎี": 953,
973
+ "▁นับ": 954,
974
+ "▁เฉพาะ": 955,
975
+ "▁ประชากร": 956,
976
+ "้ม": 957,
977
+ "โลเมตร": 958,
978
+ "▁หนังสือ": 959,
979
+ "▁โบ": 960,
980
+ "▁ร่วม": 961,
981
+ "▁เวลา": 962,
982
+ "เหล": 963,
983
+ "ริกา": 964,
984
+ "▁บริษัท": 965,
985
+ "▁สํานัก": 966,
986
+ "าป": 967,
987
+ "โย": 968,
988
+ "▁โม": 969,
989
+ "▁ท่า": 970,
990
+ "▁การค": 971,
991
+ "ew": 972,
992
+ "▁ที": 973,
993
+ "▁รี": 974,
994
+ "▁ทั้งหมด": 975,
995
+ "ay": 976,
996
+ "ow": 977,
997
+ "สน": 978,
998
+ "▁รถ": 979,
999
+ "▁เชื่อ": 980,
1000
+ "ฟ้า": 981,
1001
+ "ภท": 982,
1002
+ "ุต": 983,
1003
+ "▁ค่า": 984,
1004
+ "▁นอกจาก": 985,
1005
+ "ian": 986,
1006
+ "▁อังกฤษ": 987,
1007
+ "าะห์": 988,
1008
+ "การณ์": 989,
1009
+ "ity": 990,
1010
+ "ทํา": 991,
1011
+ "▁มนุษย์": 992,
1012
+ "ิลป": 993,
1013
+ "เวณ": 994,
1014
+ "โลก": 995,
1015
+ "▁ยู": 996,
1016
+ "▁เหม": 997,
1017
+ "▁เว็บ": 998,
1018
+ "os": 999
1019
+ },
1020
+ "unk_token": "<unk>"
1021
+ }
1022
+ }