AngelPanizo commited on
Commit
26ebebd
·
verified ·
1 Parent(s): e94c217

Add BERTopic model

Browse files
README.md ADDED
@@ -0,0 +1,78 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ tags:
4
+ - bertopic
5
+ library_name: bertopic
6
+ pipeline_tag: text-classification
7
+ ---
8
+
9
+ # MARTINI_enrich_BERTopic_Rus_truth
10
+
11
+ This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
12
+ BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
13
+
14
+ ## Usage
15
+
16
+ To use this model, please install BERTopic:
17
+
18
+ ```
19
+ pip install -U bertopic
20
+ ```
21
+
22
+ You can use the model as follows:
23
+
24
+ ```python
25
+ from bertopic import BERTopic
26
+ topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_Rus_truth")
27
+
28
+ topic_model.get_topic_info()
29
+ ```
30
+
31
+ ## Topic overview
32
+
33
+ * Number of topics: 9
34
+ * Number of training documents: 995
35
+
36
+ <details>
37
+ <summary>Click here for an overview of all topics.</summary>
38
+
39
+ | Topic ID | Topic Keywords | Topic Frequency | Label |
40
+ |----------|----------------|-----------------|-------|
41
+ | -1 | donetsk - zakharova - sanctions - mercenaries - nazi | 23 | -1_donetsk_zakharova_sanctions_mercenaries |
42
+ | 0 | mariupol - azov - missiles - evacuated - battalion | 604 | 0_mariupol_azov_missiles_evacuated |
43
+ | 1 | gazprombank - sanctions - euros - vladimir - poland | 141 | 1_gazprombank_sanctions_euros_vladimir |
44
+ | 2 | zelensky - volodymyr - scholz - slovakia - suzdaltsev | 73 | 2_zelensky_volodymyr_scholz_slovakia |
45
+ | 3 | kharkov - biolaboratories - pentagon - outbreak - borisovna | 37 | 3_kharkov_biolaboratories_pentagon_outbreak |
46
+ | 4 | beijing - taiwan - ambassador - zhang - sino | 36 | 4_beijing_taiwan_ambassador_zhang |
47
+ | 5 | marchers - nazis - victory - ivanovo - slovakia | 29 | 5_marchers_nazis_victory_ivanovo |
48
+ | 6 | lavrov - sanctions - kissinger - baltic - aggressors | 28 | 6_lavrov_sanctions_kissinger_baltic |
49
+ | 7 | missiles - howitzers - raytheon - supplied - cnn | 24 | 7_missiles_howitzers_raytheon_supplied |
50
+
51
+ </details>
52
+
53
+ ## Training hyperparameters
54
+
55
+ * calculate_probabilities: True
56
+ * language: None
57
+ * low_memory: False
58
+ * min_topic_size: 10
59
+ * n_gram_range: (1, 1)
60
+ * nr_topics: None
61
+ * seed_topic_list: None
62
+ * top_n_words: 10
63
+ * verbose: False
64
+ * zeroshot_min_similarity: 0.7
65
+ * zeroshot_topic_list: None
66
+
67
+ ## Framework versions
68
+
69
+ * Numpy: 1.26.4
70
+ * HDBSCAN: 0.8.40
71
+ * UMAP: 0.5.7
72
+ * Pandas: 2.2.3
73
+ * Scikit-Learn: 1.5.2
74
+ * Sentence-transformers: 3.3.1
75
+ * Transformers: 4.46.3
76
+ * Numba: 0.60.0
77
+ * Plotly: 5.24.1
78
+ * Python: 3.10.12
config.json ADDED
@@ -0,0 +1,16 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "calculate_probabilities": true,
3
+ "language": null,
4
+ "low_memory": false,
5
+ "min_topic_size": 10,
6
+ "n_gram_range": [
7
+ 1,
8
+ 1
9
+ ],
10
+ "nr_topics": null,
11
+ "seed_topic_list": null,
12
+ "top_n_words": 10,
13
+ "verbose": false,
14
+ "zeroshot_min_similarity": 0.7,
15
+ "zeroshot_topic_list": null
16
+ }
ctfidf.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:375c43a83b28bb68f3613cc18c53a9e537d194402461d97d4e6f95c8d9ec46b8
3
+ size 279816
ctfidf_config.json ADDED
The diff for this file is too large to render. See raw diff
 
topic_embeddings.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f1e5e7995537a64ab513c60a46da902a2fcc9abee7e7ffd7bdb0bf2d8139846b
3
+ size 36952
topics.json ADDED
@@ -0,0 +1,1271 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "topic_representations": {
3
+ "-1": [
4
+ [
5
+ "donetsk",
6
+ 0.6243618726730347
7
+ ],
8
+ [
9
+ "zakharova",
10
+ 0.582450270652771
11
+ ],
12
+ [
13
+ "sanctions",
14
+ 0.5075616836547852
15
+ ],
16
+ [
17
+ "mercenaries",
18
+ 0.4866722822189331
19
+ ],
20
+ [
21
+ "nazi",
22
+ 0.4743220806121826
23
+ ]
24
+ ],
25
+ "0": [
26
+ [
27
+ "mariupol",
28
+ 0.6462557911872864
29
+ ],
30
+ [
31
+ "azov",
32
+ 0.5125661492347717
33
+ ],
34
+ [
35
+ "missiles",
36
+ 0.4879147410392761
37
+ ],
38
+ [
39
+ "evacuated",
40
+ 0.47194039821624756
41
+ ],
42
+ [
43
+ "battalion",
44
+ 0.4718695878982544
45
+ ]
46
+ ],
47
+ "1": [
48
+ [
49
+ "gazprombank",
50
+ 0.6547092199325562
51
+ ],
52
+ [
53
+ "sanctions",
54
+ 0.5318073034286499
55
+ ],
56
+ [
57
+ "euros",
58
+ 0.5146458148956299
59
+ ],
60
+ [
61
+ "vladimir",
62
+ 0.5116685032844543
63
+ ],
64
+ [
65
+ "poland",
66
+ 0.45887893438339233
67
+ ]
68
+ ],
69
+ "2": [
70
+ [
71
+ "zelensky",
72
+ 0.7036944627761841
73
+ ],
74
+ [
75
+ "volodymyr",
76
+ 0.5977223515510559
77
+ ],
78
+ [
79
+ "scholz",
80
+ 0.521346390247345
81
+ ],
82
+ [
83
+ "slovakia",
84
+ 0.4945768117904663
85
+ ],
86
+ [
87
+ "suzdaltsev",
88
+ 0.4895945191383362
89
+ ]
90
+ ],
91
+ "3": [
92
+ [
93
+ "kharkov",
94
+ 0.5453665256500244
95
+ ],
96
+ [
97
+ "biolaboratories",
98
+ 0.5244690775871277
99
+ ],
100
+ [
101
+ "pentagon",
102
+ 0.4786181151866913
103
+ ],
104
+ [
105
+ "outbreak",
106
+ 0.4745074510574341
107
+ ],
108
+ [
109
+ "borisovna",
110
+ 0.4614233076572418
111
+ ]
112
+ ],
113
+ "4": [
114
+ [
115
+ "beijing",
116
+ 0.553337812423706
117
+ ],
118
+ [
119
+ "taiwan",
120
+ 0.5265399217605591
121
+ ],
122
+ [
123
+ "ambassador",
124
+ 0.5144138336181641
125
+ ],
126
+ [
127
+ "zhang",
128
+ 0.5101980566978455
129
+ ],
130
+ [
131
+ "sino",
132
+ 0.5101712942123413
133
+ ]
134
+ ],
135
+ "5": [
136
+ [
137
+ "marchers",
138
+ 0.49833160638809204
139
+ ],
140
+ [
141
+ "nazis",
142
+ 0.4834396243095398
143
+ ],
144
+ [
145
+ "victory",
146
+ 0.4779723286628723
147
+ ],
148
+ [
149
+ "ivanovo",
150
+ 0.4542471170425415
151
+ ],
152
+ [
153
+ "slovakia",
154
+ 0.4508550763130188
155
+ ]
156
+ ],
157
+ "6": [
158
+ [
159
+ "lavrov",
160
+ 0.5439095497131348
161
+ ],
162
+ [
163
+ "sanctions",
164
+ 0.5338693857192993
165
+ ],
166
+ [
167
+ "kissinger",
168
+ 0.4888452887535095
169
+ ],
170
+ [
171
+ "baltic",
172
+ 0.4716664254665375
173
+ ],
174
+ [
175
+ "aggressors",
176
+ 0.43040725588798523
177
+ ]
178
+ ],
179
+ "7": [
180
+ [
181
+ "missiles",
182
+ 0.5293593406677246
183
+ ],
184
+ [
185
+ "howitzers",
186
+ 0.5067546963691711
187
+ ],
188
+ [
189
+ "raytheon",
190
+ 0.4819050431251526
191
+ ],
192
+ [
193
+ "supplied",
194
+ 0.43097996711730957
195
+ ],
196
+ [
197
+ "cnn",
198
+ 0.42392808198928833
199
+ ]
200
+ ]
201
+ },
202
+ "topics": [
203
+ 4,
204
+ -1,
205
+ -1,
206
+ -1,
207
+ 2,
208
+ -1,
209
+ -1,
210
+ -1,
211
+ -1,
212
+ 2,
213
+ -1,
214
+ -1,
215
+ -1,
216
+ -1,
217
+ 6,
218
+ 2,
219
+ -1,
220
+ 2,
221
+ 4,
222
+ -1,
223
+ -1,
224
+ -1,
225
+ 7,
226
+ 4,
227
+ -1,
228
+ -1,
229
+ 1,
230
+ -1,
231
+ -1,
232
+ 1,
233
+ -1,
234
+ -1,
235
+ -1,
236
+ -1,
237
+ -1,
238
+ -1,
239
+ 4,
240
+ 4,
241
+ -1,
242
+ -1,
243
+ 0,
244
+ -1,
245
+ -1,
246
+ -1,
247
+ 2,
248
+ -1,
249
+ -1,
250
+ 7,
251
+ -1,
252
+ -1,
253
+ -1,
254
+ 5,
255
+ -1,
256
+ -1,
257
+ 0,
258
+ -1,
259
+ -1,
260
+ 0,
261
+ -1,
262
+ -1,
263
+ -1,
264
+ -1,
265
+ -1,
266
+ -1,
267
+ -1,
268
+ -1,
269
+ -1,
270
+ 4,
271
+ -1,
272
+ -1,
273
+ -1,
274
+ -1,
275
+ -1,
276
+ -1,
277
+ 0,
278
+ -1,
279
+ -1,
280
+ -1,
281
+ -1,
282
+ -1,
283
+ -1,
284
+ -1,
285
+ -1,
286
+ -1,
287
+ 0,
288
+ 6,
289
+ -1,
290
+ -1,
291
+ -1,
292
+ -1,
293
+ -1,
294
+ -1,
295
+ -1,
296
+ 4,
297
+ 1,
298
+ -1,
299
+ -1,
300
+ -1,
301
+ 1,
302
+ -1,
303
+ -1,
304
+ -1,
305
+ -1,
306
+ 0,
307
+ 4,
308
+ 1,
309
+ 6,
310
+ 3,
311
+ -1,
312
+ 1,
313
+ 1,
314
+ -1,
315
+ -1,
316
+ 0,
317
+ -1,
318
+ 1,
319
+ -1,
320
+ -1,
321
+ -1,
322
+ 2,
323
+ 4,
324
+ -1,
325
+ -1,
326
+ 1,
327
+ 1,
328
+ -1,
329
+ -1,
330
+ 7,
331
+ -1,
332
+ -1,
333
+ 3,
334
+ -1,
335
+ 0,
336
+ 0,
337
+ -1,
338
+ 1,
339
+ 0,
340
+ -1,
341
+ -1,
342
+ 1,
343
+ 6,
344
+ -1,
345
+ -1,
346
+ -1,
347
+ -1,
348
+ -1,
349
+ 2,
350
+ 4,
351
+ -1,
352
+ -1,
353
+ -1,
354
+ 2,
355
+ 2,
356
+ 4,
357
+ -1,
358
+ 6,
359
+ -1,
360
+ -1,
361
+ -1,
362
+ 0,
363
+ 2,
364
+ -1,
365
+ 6,
366
+ -1,
367
+ 4,
368
+ -1,
369
+ -1,
370
+ -1,
371
+ 1,
372
+ 0,
373
+ -1,
374
+ -1,
375
+ 4,
376
+ -1,
377
+ -1,
378
+ -1,
379
+ -1,
380
+ -1,
381
+ -1,
382
+ -1,
383
+ -1,
384
+ 1,
385
+ -1,
386
+ 6,
387
+ -1,
388
+ 2,
389
+ -1,
390
+ -1,
391
+ 2,
392
+ -1,
393
+ 4,
394
+ -1,
395
+ -1,
396
+ 1,
397
+ -1,
398
+ -1,
399
+ 2,
400
+ -1,
401
+ 0,
402
+ -1,
403
+ -1,
404
+ 2,
405
+ 7,
406
+ -1,
407
+ -1,
408
+ -1,
409
+ -1,
410
+ -1,
411
+ 0,
412
+ -1,
413
+ 1,
414
+ 0,
415
+ 1,
416
+ -1,
417
+ -1,
418
+ -1,
419
+ -1,
420
+ 7,
421
+ 1,
422
+ -1,
423
+ 1,
424
+ -1,
425
+ -1,
426
+ -1,
427
+ -1,
428
+ 1,
429
+ -1,
430
+ 1,
431
+ 3,
432
+ -1,
433
+ -1,
434
+ -1,
435
+ -1,
436
+ -1,
437
+ -1,
438
+ -1,
439
+ -1,
440
+ -1,
441
+ -1,
442
+ 7,
443
+ -1,
444
+ -1,
445
+ 0,
446
+ -1,
447
+ 6,
448
+ -1,
449
+ 0,
450
+ -1,
451
+ -1,
452
+ 0,
453
+ -1,
454
+ 0,
455
+ -1,
456
+ 7,
457
+ 3,
458
+ 0,
459
+ -1,
460
+ 0,
461
+ 0,
462
+ -1,
463
+ 0,
464
+ -1,
465
+ -1,
466
+ -1,
467
+ -1,
468
+ 0,
469
+ 0,
470
+ -1,
471
+ -1,
472
+ 6,
473
+ 3,
474
+ -1,
475
+ -1,
476
+ -1,
477
+ -1,
478
+ 0,
479
+ 2,
480
+ -1,
481
+ 2,
482
+ 5,
483
+ 0,
484
+ -1,
485
+ 1,
486
+ 3,
487
+ -1,
488
+ -1,
489
+ -1,
490
+ 0,
491
+ -1,
492
+ -1,
493
+ -1,
494
+ -1,
495
+ -1,
496
+ 0,
497
+ -1,
498
+ -1,
499
+ -1,
500
+ 3,
501
+ 3,
502
+ -1,
503
+ -1,
504
+ 0,
505
+ 1,
506
+ -1,
507
+ -1,
508
+ 2,
509
+ -1,
510
+ -1,
511
+ 6,
512
+ 6,
513
+ 0,
514
+ -1,
515
+ 0,
516
+ -1,
517
+ -1,
518
+ -1,
519
+ -1,
520
+ -1,
521
+ 0,
522
+ -1,
523
+ -1,
524
+ 5,
525
+ -1,
526
+ 5,
527
+ -1,
528
+ -1,
529
+ -1,
530
+ 5,
531
+ -1,
532
+ 5,
533
+ 5,
534
+ 5,
535
+ -1,
536
+ -1,
537
+ 5,
538
+ 5,
539
+ 5,
540
+ 5,
541
+ 5,
542
+ 5,
543
+ -1,
544
+ 5,
545
+ 0,
546
+ -1,
547
+ -1,
548
+ 5,
549
+ -1,
550
+ 0,
551
+ -1,
552
+ -1,
553
+ 7,
554
+ -1,
555
+ -1,
556
+ 2,
557
+ 0,
558
+ -1,
559
+ 4,
560
+ -1,
561
+ -1,
562
+ -1,
563
+ 1,
564
+ 3,
565
+ -1,
566
+ 4,
567
+ -1,
568
+ 2,
569
+ -1,
570
+ -1,
571
+ 0,
572
+ -1,
573
+ -1,
574
+ 0,
575
+ -1,
576
+ 6,
577
+ 0,
578
+ 1,
579
+ -1,
580
+ -1,
581
+ -1,
582
+ -1,
583
+ -1,
584
+ -1,
585
+ 1,
586
+ 0,
587
+ 1,
588
+ -1,
589
+ -1,
590
+ -1,
591
+ 0,
592
+ 2,
593
+ -1,
594
+ -1,
595
+ 0,
596
+ -1,
597
+ -1,
598
+ -1,
599
+ 1,
600
+ -1,
601
+ -1,
602
+ -1,
603
+ -1,
604
+ 0,
605
+ -1,
606
+ -1,
607
+ -1,
608
+ -1,
609
+ 0,
610
+ 1,
611
+ -1,
612
+ -1,
613
+ -1,
614
+ -1,
615
+ -1,
616
+ -1,
617
+ -1,
618
+ -1,
619
+ -1,
620
+ 0,
621
+ 0,
622
+ 3,
623
+ -1,
624
+ 0,
625
+ 1,
626
+ -1,
627
+ -1,
628
+ 5,
629
+ 0,
630
+ -1,
631
+ -1,
632
+ 0,
633
+ 0,
634
+ -1,
635
+ 6,
636
+ -1,
637
+ -1,
638
+ -1,
639
+ -1,
640
+ 6,
641
+ 4,
642
+ -1,
643
+ -1,
644
+ -1,
645
+ -1,
646
+ -1,
647
+ -1,
648
+ -1,
649
+ 5,
650
+ 1,
651
+ 7,
652
+ -1,
653
+ 0,
654
+ 3,
655
+ -1,
656
+ -1,
657
+ 1,
658
+ 3,
659
+ 1,
660
+ 5,
661
+ 0,
662
+ 1,
663
+ -1,
664
+ -1,
665
+ -1,
666
+ 1,
667
+ -1,
668
+ -1,
669
+ -1,
670
+ -1,
671
+ 0,
672
+ 1,
673
+ -1,
674
+ 0,
675
+ 2,
676
+ 5,
677
+ 1,
678
+ -1,
679
+ -1,
680
+ 0,
681
+ -1,
682
+ -1,
683
+ -1,
684
+ 0,
685
+ -1,
686
+ 0,
687
+ -1,
688
+ -1,
689
+ 2,
690
+ -1,
691
+ -1,
692
+ 0,
693
+ -1,
694
+ -1,
695
+ -1,
696
+ -1,
697
+ -1,
698
+ -1,
699
+ -1,
700
+ -1,
701
+ -1,
702
+ -1,
703
+ -1,
704
+ 1,
705
+ -1,
706
+ -1,
707
+ 2,
708
+ -1,
709
+ -1,
710
+ 0,
711
+ -1,
712
+ 0,
713
+ 5,
714
+ -1,
715
+ 3,
716
+ -1,
717
+ -1,
718
+ 1,
719
+ 1,
720
+ 0,
721
+ -1,
722
+ 0,
723
+ -1,
724
+ -1,
725
+ -1,
726
+ -1,
727
+ -1,
728
+ 0,
729
+ 0,
730
+ 7,
731
+ 1,
732
+ 0,
733
+ 2,
734
+ -1,
735
+ 0,
736
+ -1,
737
+ -1,
738
+ 7,
739
+ 0,
740
+ 0,
741
+ -1,
742
+ -1,
743
+ 0,
744
+ 0,
745
+ -1,
746
+ -1,
747
+ -1,
748
+ 5,
749
+ -1,
750
+ -1,
751
+ 7,
752
+ -1,
753
+ -1,
754
+ 0,
755
+ -1,
756
+ 7,
757
+ 0,
758
+ -1,
759
+ -1,
760
+ -1,
761
+ -1,
762
+ -1,
763
+ 0,
764
+ -1,
765
+ 0,
766
+ -1,
767
+ -1,
768
+ -1,
769
+ 0,
770
+ -1,
771
+ 0,
772
+ 0,
773
+ -1,
774
+ -1,
775
+ -1,
776
+ -1,
777
+ 7,
778
+ 0,
779
+ 0,
780
+ -1,
781
+ 0,
782
+ 0,
783
+ -1,
784
+ -1,
785
+ -1,
786
+ 0,
787
+ -1,
788
+ -1,
789
+ 0,
790
+ 4,
791
+ 0,
792
+ -1,
793
+ 0,
794
+ -1,
795
+ -1,
796
+ -1,
797
+ 6,
798
+ -1,
799
+ 4,
800
+ 0,
801
+ -1,
802
+ 7,
803
+ -1,
804
+ 4,
805
+ 0,
806
+ -1,
807
+ -1,
808
+ 1,
809
+ -1,
810
+ 0,
811
+ -1,
812
+ -1,
813
+ -1,
814
+ -1,
815
+ -1,
816
+ -1,
817
+ -1,
818
+ -1,
819
+ -1,
820
+ -1,
821
+ -1,
822
+ -1,
823
+ 0,
824
+ -1,
825
+ -1,
826
+ -1,
827
+ 0,
828
+ -1,
829
+ -1,
830
+ -1,
831
+ -1,
832
+ 0,
833
+ -1,
834
+ -1,
835
+ -1,
836
+ 1,
837
+ 2,
838
+ 1,
839
+ 0,
840
+ -1,
841
+ -1,
842
+ -1,
843
+ 0,
844
+ 0,
845
+ 0,
846
+ -1,
847
+ -1,
848
+ -1,
849
+ -1,
850
+ -1,
851
+ 7,
852
+ -1,
853
+ 0,
854
+ -1,
855
+ -1,
856
+ -1,
857
+ 0,
858
+ -1,
859
+ -1,
860
+ 2,
861
+ -1,
862
+ 1,
863
+ -1,
864
+ -1,
865
+ -1,
866
+ -1,
867
+ 7,
868
+ -1,
869
+ -1,
870
+ 6,
871
+ 3,
872
+ -1,
873
+ -1,
874
+ -1,
875
+ -1,
876
+ -1,
877
+ 3,
878
+ -1,
879
+ 3,
880
+ -1,
881
+ 0,
882
+ -1,
883
+ -1,
884
+ 3,
885
+ -1,
886
+ -1,
887
+ 3,
888
+ -1,
889
+ -1,
890
+ 2,
891
+ -1,
892
+ -1,
893
+ 0,
894
+ -1,
895
+ 0,
896
+ 2,
897
+ 7,
898
+ -1,
899
+ -1,
900
+ 1,
901
+ -1,
902
+ -1,
903
+ -1,
904
+ 2,
905
+ -1,
906
+ 7,
907
+ -1,
908
+ 1,
909
+ 2,
910
+ 0,
911
+ -1,
912
+ 1,
913
+ -1,
914
+ -1,
915
+ -1,
916
+ -1,
917
+ -1,
918
+ -1,
919
+ 7,
920
+ -1,
921
+ -1,
922
+ -1,
923
+ -1,
924
+ -1,
925
+ -1,
926
+ -1,
927
+ 6,
928
+ 0,
929
+ -1,
930
+ -1,
931
+ -1,
932
+ 6,
933
+ -1,
934
+ 0,
935
+ -1,
936
+ -1,
937
+ -1,
938
+ 1,
939
+ -1,
940
+ -1,
941
+ -1,
942
+ -1,
943
+ -1,
944
+ -1,
945
+ 2,
946
+ -1,
947
+ -1,
948
+ -1,
949
+ -1,
950
+ -1,
951
+ -1,
952
+ 4,
953
+ -1,
954
+ 0,
955
+ -1,
956
+ -1,
957
+ -1,
958
+ -1,
959
+ -1,
960
+ -1,
961
+ -1,
962
+ 1,
963
+ 1,
964
+ 4,
965
+ -1,
966
+ 7,
967
+ 1,
968
+ -1,
969
+ -1,
970
+ 1,
971
+ -1,
972
+ 1,
973
+ 1,
974
+ 2,
975
+ -1,
976
+ -1,
977
+ 0,
978
+ -1,
979
+ -1,
980
+ -1,
981
+ -1,
982
+ 0,
983
+ -1,
984
+ -1,
985
+ -1,
986
+ -1,
987
+ -1,
988
+ 1,
989
+ 1,
990
+ 0,
991
+ 0,
992
+ -1,
993
+ 0,
994
+ -1,
995
+ -1,
996
+ 0,
997
+ -1,
998
+ -1,
999
+ -1,
1000
+ 4,
1001
+ -1,
1002
+ 0,
1003
+ -1,
1004
+ -1,
1005
+ -1,
1006
+ -1,
1007
+ -1,
1008
+ -1,
1009
+ -1,
1010
+ -1,
1011
+ -1,
1012
+ -1,
1013
+ 0,
1014
+ -1,
1015
+ 5,
1016
+ 1,
1017
+ 3,
1018
+ 1,
1019
+ 4,
1020
+ -1,
1021
+ 5,
1022
+ 1,
1023
+ -1,
1024
+ 2,
1025
+ -1,
1026
+ 1,
1027
+ 0,
1028
+ 0,
1029
+ 1,
1030
+ 0,
1031
+ -1,
1032
+ 0,
1033
+ 1,
1034
+ 1,
1035
+ -1,
1036
+ -1,
1037
+ 1,
1038
+ 1,
1039
+ -1,
1040
+ -1,
1041
+ 7,
1042
+ -1,
1043
+ -1,
1044
+ 3,
1045
+ -1,
1046
+ -1,
1047
+ 1,
1048
+ -1,
1049
+ -1,
1050
+ 4,
1051
+ -1,
1052
+ -1,
1053
+ -1,
1054
+ 1,
1055
+ -1,
1056
+ -1,
1057
+ -1,
1058
+ -1,
1059
+ -1,
1060
+ -1,
1061
+ 1,
1062
+ 1,
1063
+ -1,
1064
+ 0,
1065
+ -1,
1066
+ 3,
1067
+ -1,
1068
+ -1,
1069
+ -1,
1070
+ -1,
1071
+ -1,
1072
+ -1,
1073
+ 3,
1074
+ 0,
1075
+ 0,
1076
+ -1,
1077
+ 5,
1078
+ -1,
1079
+ 6,
1080
+ 1,
1081
+ -1,
1082
+ 0,
1083
+ 4,
1084
+ -1,
1085
+ 0,
1086
+ -1,
1087
+ -1,
1088
+ 0,
1089
+ 6,
1090
+ 4,
1091
+ 3,
1092
+ -1,
1093
+ -1,
1094
+ 0,
1095
+ -1,
1096
+ -1,
1097
+ 0,
1098
+ -1,
1099
+ -1,
1100
+ 2,
1101
+ 6,
1102
+ 6,
1103
+ 0,
1104
+ 0,
1105
+ -1,
1106
+ -1,
1107
+ -1,
1108
+ -1,
1109
+ -1,
1110
+ -1,
1111
+ -1,
1112
+ -1,
1113
+ -1,
1114
+ 1,
1115
+ -1,
1116
+ -1,
1117
+ 0,
1118
+ 0,
1119
+ 0,
1120
+ 0,
1121
+ -1,
1122
+ 0,
1123
+ -1,
1124
+ 2,
1125
+ -1,
1126
+ -1,
1127
+ -1,
1128
+ 0,
1129
+ 5,
1130
+ -1,
1131
+ -1,
1132
+ -1,
1133
+ 3,
1134
+ 1,
1135
+ 4,
1136
+ -1,
1137
+ 6,
1138
+ 5,
1139
+ -1,
1140
+ -1,
1141
+ 3,
1142
+ 0,
1143
+ 0,
1144
+ -1,
1145
+ 6,
1146
+ 0,
1147
+ -1,
1148
+ -1,
1149
+ -1,
1150
+ -1,
1151
+ -1,
1152
+ 5,
1153
+ -1,
1154
+ 3,
1155
+ 3,
1156
+ 3,
1157
+ 3,
1158
+ 3,
1159
+ 3,
1160
+ -1,
1161
+ -1,
1162
+ 3,
1163
+ 3,
1164
+ 4,
1165
+ -1,
1166
+ -1,
1167
+ -1,
1168
+ -1,
1169
+ -1,
1170
+ 3,
1171
+ 0,
1172
+ -1,
1173
+ 0,
1174
+ 0,
1175
+ -1,
1176
+ -1,
1177
+ -1,
1178
+ 3,
1179
+ 3,
1180
+ 2,
1181
+ -1,
1182
+ -1,
1183
+ -1,
1184
+ 7,
1185
+ -1,
1186
+ -1,
1187
+ 0,
1188
+ -1,
1189
+ 0,
1190
+ 2,
1191
+ -1,
1192
+ 0,
1193
+ -1,
1194
+ -1,
1195
+ -1,
1196
+ -1,
1197
+ -1
1198
+ ],
1199
+ "topic_sizes": {
1200
+ "4": 29,
1201
+ "-1": 604,
1202
+ "2": 37,
1203
+ "6": 24,
1204
+ "7": 23,
1205
+ "1": 73,
1206
+ "0": 141,
1207
+ "5": 28,
1208
+ "3": 36
1209
+ },
1210
+ "topic_mapper": [
1211
+ [
1212
+ -1,
1213
+ -1,
1214
+ -1
1215
+ ],
1216
+ [
1217
+ 0,
1218
+ 0,
1219
+ 3
1220
+ ],
1221
+ [
1222
+ 1,
1223
+ 1,
1224
+ 4
1225
+ ],
1226
+ [
1227
+ 2,
1228
+ 2,
1229
+ 7
1230
+ ],
1231
+ [
1232
+ 3,
1233
+ 3,
1234
+ 1
1235
+ ],
1236
+ [
1237
+ 4,
1238
+ 4,
1239
+ 6
1240
+ ],
1241
+ [
1242
+ 5,
1243
+ 5,
1244
+ 5
1245
+ ],
1246
+ [
1247
+ 6,
1248
+ 6,
1249
+ 2
1250
+ ],
1251
+ [
1252
+ 7,
1253
+ 7,
1254
+ 0
1255
+ ]
1256
+ ],
1257
+ "topic_labels": {
1258
+ "-1": "-1_donetsk_zakharova_sanctions_mercenaries",
1259
+ "0": "0_mariupol_azov_missiles_evacuated",
1260
+ "1": "1_gazprombank_sanctions_euros_vladimir",
1261
+ "2": "2_zelensky_volodymyr_scholz_slovakia",
1262
+ "3": "3_kharkov_biolaboratories_pentagon_outbreak",
1263
+ "4": "4_beijing_taiwan_ambassador_zhang",
1264
+ "5": "5_marchers_nazis_victory_ivanovo",
1265
+ "6": "6_lavrov_sanctions_kissinger_baltic",
1266
+ "7": "7_missiles_howitzers_raytheon_supplied"
1267
+ },
1268
+ "custom_labels": null,
1269
+ "_outliers": 1,
1270
+ "topic_aspects": {}
1271
+ }