AngelPanizo commited on
Commit
fe35bfc
·
verified ·
1 Parent(s): ed0618b

Add BERTopic model

Browse files
README.md ADDED
@@ -0,0 +1,80 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ tags:
4
+ - bertopic
5
+ library_name: bertopic
6
+ pipeline_tag: text-classification
7
+ ---
8
+
9
+ # MARTINI_enrich_BERTopic_generationidentitaire
10
+
11
+ This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
12
+ BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
13
+
14
+ ## Usage
15
+
16
+ To use this model, please install BERTopic:
17
+
18
+ ```
19
+ pip install -U bertopic
20
+ ```
21
+
22
+ You can use the model as follows:
23
+
24
+ ```python
25
+ from bertopic import BERTopic
26
+ topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_generationidentitaire")
27
+
28
+ topic_model.get_topic_info()
29
+ ```
30
+
31
+ ## Topic overview
32
+
33
+ * Number of topics: 11
34
+ * Number of training documents: 839
35
+
36
+ <details>
37
+ <summary>Click here for an overview of all topics.</summary>
38
+
39
+ | Topic ID | Topic Keywords | Topic Frequency | Label |
40
+ |----------|----------------|-----------------|-------|
41
+ | -1 | islamistes - terroriste - algerie - racisme - toulouse | 20 | -1_islamistes_terroriste_algerie_racisme |
42
+ | 0 | lyon - toulousains - agresseurs - arrondissement - affiches | 428 | 0_lyon_toulousains_agresseurs_arrondissement |
43
+ | 1 | marseille - migratoire - soutenez - frontieres - portillon | 134 | 1_marseille_migratoire_soutenez_frontieres |
44
+ | 2 | pauvres - solidaire - parisien - macron - quarantaine | 58 | 2_pauvres_solidaire_parisien_macron |
45
+ | 3 | droite - zemmour - colonialisme - raisons - charlemagne | 34 | 3_droite_zemmour_colonialisme_raisons |
46
+ | 4 | parler - sociaux - liberte - politiquement - censurer | 31 | 4_parler_sociaux_liberte_politiquement |
47
+ | 5 | boxeurs - lyon - reouverture - entrainements - septembre | 29 | 5_boxeurs_lyon_reouverture_entrainements |
48
+ | 6 | universite - belgique - macronisme - guillaume - redacteur | 29 | 6_universite_belgique_macronisme_guillaume |
49
+ | 7 | lyon - antireligieuse - decembre - traditionnelle - organisateurs | 27 | 7_lyon_antireligieuse_decembre_traditionnelle |
50
+ | 8 | islamistes - bataclan - attentats - abdeslam - novembre | 25 | 8_islamistes_bataclan_attentats_abdeslam |
51
+ | 9 | islamistes - muezzin - youssef - pourquoi - goussainville | 24 | 9_islamistes_muezzin_youssef_pourquoi |
52
+
53
+ </details>
54
+
55
+ ## Training hyperparameters
56
+
57
+ * calculate_probabilities: True
58
+ * language: None
59
+ * low_memory: False
60
+ * min_topic_size: 10
61
+ * n_gram_range: (1, 1)
62
+ * nr_topics: None
63
+ * seed_topic_list: None
64
+ * top_n_words: 10
65
+ * verbose: False
66
+ * zeroshot_min_similarity: 0.7
67
+ * zeroshot_topic_list: None
68
+
69
+ ## Framework versions
70
+
71
+ * Numpy: 1.26.4
72
+ * HDBSCAN: 0.8.40
73
+ * UMAP: 0.5.7
74
+ * Pandas: 2.2.3
75
+ * Scikit-Learn: 1.5.2
76
+ * Sentence-transformers: 3.3.1
77
+ * Transformers: 4.46.3
78
+ * Numba: 0.60.0
79
+ * Plotly: 5.24.1
80
+ * Python: 3.10.12
config.json ADDED
@@ -0,0 +1,16 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "calculate_probabilities": true,
3
+ "language": null,
4
+ "low_memory": false,
5
+ "min_topic_size": 10,
6
+ "n_gram_range": [
7
+ 1,
8
+ 1
9
+ ],
10
+ "nr_topics": null,
11
+ "seed_topic_list": null,
12
+ "top_n_words": 10,
13
+ "verbose": false,
14
+ "zeroshot_min_similarity": 0.7,
15
+ "zeroshot_topic_list": null
16
+ }
ctfidf.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1e09e09801067077431e9134e4b7588ae50181fb5ffa37c4e74190e4ba4ac54e
3
+ size 191016
ctfidf_config.json ADDED
The diff for this file is too large to render. See raw diff
 
topic_embeddings.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:89efd2369318b4fa43621c3c909ed5081ade3d1034f7db02f133bb75031b47da
3
+ size 45144
topics.json ADDED
@@ -0,0 +1,1173 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "topic_representations": {
3
+ "-1": [
4
+ [
5
+ "islamistes",
6
+ 0.5991633534431458
7
+ ],
8
+ [
9
+ "terroriste",
10
+ 0.5695631504058838
11
+ ],
12
+ [
13
+ "algerie",
14
+ 0.55776447057724
15
+ ],
16
+ [
17
+ "racisme",
18
+ 0.48910006880760193
19
+ ],
20
+ [
21
+ "toulouse",
22
+ 0.4854029417037964
23
+ ]
24
+ ],
25
+ "0": [
26
+ [
27
+ "lyon",
28
+ 0.5802635550498962
29
+ ],
30
+ [
31
+ "toulousains",
32
+ 0.5798710584640503
33
+ ],
34
+ [
35
+ "agresseurs",
36
+ 0.5778711438179016
37
+ ],
38
+ [
39
+ "arrondissement",
40
+ 0.5010396242141724
41
+ ],
42
+ [
43
+ "affiches",
44
+ 0.4899646043777466
45
+ ]
46
+ ],
47
+ "1": [
48
+ [
49
+ "marseille",
50
+ 0.5326090455055237
51
+ ],
52
+ [
53
+ "migratoire",
54
+ 0.527198314666748
55
+ ],
56
+ [
57
+ "soutenez",
58
+ 0.5029315948486328
59
+ ],
60
+ [
61
+ "frontieres",
62
+ 0.4995434880256653
63
+ ],
64
+ [
65
+ "portillon",
66
+ 0.47448915243148804
67
+ ]
68
+ ],
69
+ "2": [
70
+ [
71
+ "pauvres",
72
+ 0.546334981918335
73
+ ],
74
+ [
75
+ "solidaire",
76
+ 0.543067216873169
77
+ ],
78
+ [
79
+ "parisien",
80
+ 0.5228344202041626
81
+ ],
82
+ [
83
+ "macron",
84
+ 0.4830544590950012
85
+ ],
86
+ [
87
+ "quarantaine",
88
+ 0.48231571912765503
89
+ ]
90
+ ],
91
+ "3": [
92
+ [
93
+ "droite",
94
+ 0.6615764498710632
95
+ ],
96
+ [
97
+ "zemmour",
98
+ 0.6435277462005615
99
+ ],
100
+ [
101
+ "colonialisme",
102
+ 0.632229208946228
103
+ ],
104
+ [
105
+ "raisons",
106
+ 0.61241215467453
107
+ ],
108
+ [
109
+ "charlemagne",
110
+ 0.5887019634246826
111
+ ]
112
+ ],
113
+ "4": [
114
+ [
115
+ "parler",
116
+ 0.5166013240814209
117
+ ],
118
+ [
119
+ "sociaux",
120
+ 0.5062539577484131
121
+ ],
122
+ [
123
+ "liberte",
124
+ 0.4943889379501343
125
+ ],
126
+ [
127
+ "politiquement",
128
+ 0.4679053723812103
129
+ ],
130
+ [
131
+ "censurer",
132
+ 0.4490011930465698
133
+ ]
134
+ ],
135
+ "5": [
136
+ [
137
+ "boxeurs",
138
+ 0.5665551424026489
139
+ ],
140
+ [
141
+ "lyon",
142
+ 0.5520049929618835
143
+ ],
144
+ [
145
+ "reouverture",
146
+ 0.5419343709945679
147
+ ],
148
+ [
149
+ "entrainements",
150
+ 0.538833498954773
151
+ ],
152
+ [
153
+ "septembre",
154
+ 0.513873815536499
155
+ ]
156
+ ],
157
+ "6": [
158
+ [
159
+ "universite",
160
+ 0.5942580103874207
161
+ ],
162
+ [
163
+ "belgique",
164
+ 0.5359703302383423
165
+ ],
166
+ [
167
+ "macronisme",
168
+ 0.5265882015228271
169
+ ],
170
+ [
171
+ "guillaume",
172
+ 0.5094661712646484
173
+ ],
174
+ [
175
+ "redacteur",
176
+ 0.5072721838951111
177
+ ]
178
+ ],
179
+ "7": [
180
+ [
181
+ "lyon",
182
+ 0.5564420223236084
183
+ ],
184
+ [
185
+ "antireligieuse",
186
+ 0.5060789585113525
187
+ ],
188
+ [
189
+ "decembre",
190
+ 0.4940589368343353
191
+ ],
192
+ [
193
+ "traditionnelle",
194
+ 0.47525346279144287
195
+ ],
196
+ [
197
+ "organisateurs",
198
+ 0.4637477993965149
199
+ ]
200
+ ],
201
+ "8": [
202
+ [
203
+ "islamistes",
204
+ 0.6280872821807861
205
+ ],
206
+ [
207
+ "bataclan",
208
+ 0.5721944570541382
209
+ ],
210
+ [
211
+ "attentats",
212
+ 0.5674271583557129
213
+ ],
214
+ [
215
+ "abdeslam",
216
+ 0.5532614588737488
217
+ ],
218
+ [
219
+ "novembre",
220
+ 0.503973126411438
221
+ ]
222
+ ],
223
+ "9": [
224
+ [
225
+ "islamistes",
226
+ 0.6359930038452148
227
+ ],
228
+ [
229
+ "muezzin",
230
+ 0.5109359622001648
231
+ ],
232
+ [
233
+ "youssef",
234
+ 0.501860499382019
235
+ ],
236
+ [
237
+ "pourquoi",
238
+ 0.46685779094696045
239
+ ],
240
+ [
241
+ "goussainville",
242
+ 0.4648846983909607
243
+ ]
244
+ ]
245
+ },
246
+ "topics": [
247
+ 0,
248
+ -1,
249
+ -1,
250
+ -1,
251
+ -1,
252
+ -1,
253
+ 3,
254
+ -1,
255
+ 4,
256
+ 4,
257
+ -1,
258
+ -1,
259
+ -1,
260
+ -1,
261
+ -1,
262
+ -1,
263
+ -1,
264
+ -1,
265
+ -1,
266
+ -1,
267
+ 1,
268
+ -1,
269
+ 4,
270
+ -1,
271
+ -1,
272
+ -1,
273
+ -1,
274
+ 1,
275
+ -1,
276
+ -1,
277
+ -1,
278
+ 3,
279
+ 5,
280
+ 0,
281
+ -1,
282
+ -1,
283
+ 2,
284
+ 0,
285
+ 1,
286
+ 1,
287
+ -1,
288
+ 0,
289
+ -1,
290
+ 0,
291
+ 4,
292
+ -1,
293
+ -1,
294
+ -1,
295
+ -1,
296
+ -1,
297
+ -1,
298
+ 1,
299
+ -1,
300
+ -1,
301
+ 1,
302
+ 0,
303
+ 2,
304
+ -1,
305
+ -1,
306
+ 4,
307
+ -1,
308
+ -1,
309
+ -1,
310
+ -1,
311
+ 1,
312
+ 1,
313
+ 1,
314
+ -1,
315
+ 1,
316
+ -1,
317
+ -1,
318
+ -1,
319
+ -1,
320
+ 1,
321
+ 1,
322
+ 1,
323
+ 1,
324
+ 1,
325
+ 1,
326
+ 1,
327
+ 1,
328
+ 4,
329
+ -1,
330
+ 0,
331
+ 4,
332
+ -1,
333
+ 0,
334
+ 0,
335
+ 2,
336
+ -1,
337
+ 0,
338
+ -1,
339
+ -1,
340
+ -1,
341
+ -1,
342
+ -1,
343
+ -1,
344
+ -1,
345
+ 2,
346
+ 2,
347
+ 2,
348
+ 2,
349
+ -1,
350
+ 2,
351
+ 2,
352
+ -1,
353
+ -1,
354
+ -1,
355
+ 1,
356
+ -1,
357
+ -1,
358
+ -1,
359
+ 2,
360
+ -1,
361
+ -1,
362
+ -1,
363
+ 7,
364
+ 2,
365
+ 7,
366
+ 7,
367
+ -1,
368
+ 7,
369
+ 7,
370
+ -1,
371
+ -1,
372
+ -1,
373
+ -1,
374
+ 2,
375
+ -1,
376
+ -1,
377
+ -1,
378
+ 3,
379
+ -1,
380
+ -1,
381
+ 9,
382
+ 4,
383
+ -1,
384
+ -1,
385
+ -1,
386
+ -1,
387
+ -1,
388
+ -1,
389
+ -1,
390
+ -1,
391
+ -1,
392
+ 0,
393
+ -1,
394
+ -1,
395
+ -1,
396
+ -1,
397
+ -1,
398
+ 0,
399
+ -1,
400
+ 6,
401
+ -1,
402
+ -1,
403
+ -1,
404
+ -1,
405
+ -1,
406
+ -1,
407
+ -1,
408
+ 0,
409
+ -1,
410
+ -1,
411
+ 9,
412
+ 0,
413
+ -1,
414
+ -1,
415
+ 0,
416
+ -1,
417
+ 0,
418
+ 0,
419
+ -1,
420
+ 5,
421
+ -1,
422
+ -1,
423
+ 0,
424
+ 0,
425
+ 5,
426
+ 0,
427
+ 0,
428
+ 7,
429
+ -1,
430
+ -1,
431
+ -1,
432
+ 0,
433
+ -1,
434
+ -1,
435
+ 0,
436
+ -1,
437
+ 0,
438
+ 0,
439
+ 0,
440
+ -1,
441
+ 0,
442
+ 7,
443
+ -1,
444
+ 0,
445
+ -1,
446
+ -1,
447
+ 0,
448
+ -1,
449
+ -1,
450
+ -1,
451
+ -1,
452
+ 0,
453
+ 6,
454
+ -1,
455
+ 0,
456
+ -1,
457
+ 7,
458
+ -1,
459
+ -1,
460
+ 5,
461
+ -1,
462
+ 0,
463
+ -1,
464
+ 7,
465
+ 0,
466
+ 0,
467
+ 6,
468
+ -1,
469
+ -1,
470
+ 6,
471
+ -1,
472
+ 0,
473
+ 6,
474
+ 6,
475
+ 6,
476
+ 6,
477
+ 6,
478
+ 0,
479
+ 1,
480
+ -1,
481
+ -1,
482
+ 9,
483
+ 0,
484
+ 3,
485
+ 0,
486
+ -1,
487
+ -1,
488
+ 4,
489
+ -1,
490
+ 4,
491
+ 5,
492
+ 6,
493
+ -1,
494
+ 6,
495
+ 0,
496
+ 4,
497
+ 3,
498
+ -1,
499
+ 3,
500
+ 0,
501
+ 6,
502
+ 4,
503
+ 0,
504
+ 4,
505
+ 6,
506
+ -1,
507
+ 0,
508
+ 0,
509
+ -1,
510
+ -1,
511
+ -1,
512
+ -1,
513
+ 9,
514
+ 4,
515
+ 6,
516
+ -1,
517
+ -1,
518
+ -1,
519
+ -1,
520
+ -1,
521
+ -1,
522
+ 9,
523
+ -1,
524
+ 9,
525
+ 0,
526
+ -1,
527
+ -1,
528
+ -1,
529
+ -1,
530
+ -1,
531
+ -1,
532
+ -1,
533
+ -1,
534
+ -1,
535
+ -1,
536
+ -1,
537
+ 0,
538
+ 0,
539
+ -1,
540
+ 5,
541
+ 5,
542
+ 0,
543
+ 0,
544
+ 5,
545
+ -1,
546
+ 5,
547
+ 0,
548
+ 0,
549
+ 0,
550
+ 9,
551
+ -1,
552
+ 0,
553
+ 0,
554
+ -1,
555
+ -1,
556
+ 0,
557
+ 4,
558
+ 0,
559
+ 0,
560
+ -1,
561
+ -1,
562
+ -1,
563
+ 5,
564
+ -1,
565
+ -1,
566
+ -1,
567
+ -1,
568
+ 9,
569
+ -1,
570
+ -1,
571
+ -1,
572
+ -1,
573
+ 9,
574
+ -1,
575
+ 0,
576
+ -1,
577
+ -1,
578
+ 9,
579
+ 4,
580
+ -1,
581
+ 4,
582
+ -1,
583
+ -1,
584
+ -1,
585
+ 9,
586
+ -1,
587
+ 9,
588
+ 6,
589
+ -1,
590
+ -1,
591
+ -1,
592
+ -1,
593
+ 6,
594
+ -1,
595
+ 6,
596
+ -1,
597
+ 9,
598
+ 9,
599
+ -1,
600
+ -1,
601
+ -1,
602
+ -1,
603
+ -1,
604
+ -1,
605
+ -1,
606
+ -1,
607
+ 3,
608
+ -1,
609
+ 3,
610
+ -1,
611
+ -1,
612
+ -1,
613
+ 2,
614
+ 0,
615
+ -1,
616
+ 0,
617
+ -1,
618
+ -1,
619
+ 0,
620
+ -1,
621
+ -1,
622
+ -1,
623
+ -1,
624
+ -1,
625
+ -1,
626
+ -1,
627
+ 3,
628
+ 5,
629
+ 0,
630
+ 0,
631
+ 0,
632
+ 0,
633
+ -1,
634
+ -1,
635
+ 0,
636
+ 2,
637
+ 0,
638
+ -1,
639
+ -1,
640
+ 0,
641
+ -1,
642
+ 2,
643
+ -1,
644
+ 0,
645
+ -1,
646
+ 1,
647
+ 0,
648
+ -1,
649
+ 0,
650
+ 2,
651
+ -1,
652
+ 2,
653
+ -1,
654
+ 0,
655
+ 2,
656
+ 0,
657
+ -1,
658
+ -1,
659
+ -1,
660
+ 9,
661
+ 0,
662
+ 0,
663
+ -1,
664
+ -1,
665
+ -1,
666
+ 3,
667
+ 3,
668
+ 3,
669
+ 7,
670
+ 2,
671
+ 9,
672
+ 8,
673
+ 0,
674
+ 0,
675
+ 2,
676
+ 7,
677
+ -1,
678
+ -1,
679
+ 3,
680
+ 7,
681
+ 7,
682
+ -1,
683
+ -1,
684
+ -1,
685
+ 8,
686
+ 8,
687
+ 8,
688
+ 8,
689
+ 8,
690
+ 5,
691
+ 8,
692
+ 8,
693
+ 8,
694
+ 8,
695
+ 8,
696
+ 8,
697
+ 5,
698
+ 3,
699
+ 8,
700
+ 8,
701
+ -1,
702
+ -1,
703
+ 8,
704
+ 8,
705
+ 8,
706
+ 0,
707
+ 8,
708
+ -1,
709
+ 8,
710
+ 8,
711
+ 3,
712
+ 0,
713
+ 5,
714
+ -1,
715
+ -1,
716
+ 0,
717
+ 0,
718
+ -1,
719
+ 0,
720
+ 0,
721
+ 3,
722
+ 5,
723
+ -1,
724
+ 0,
725
+ -1,
726
+ -1,
727
+ -1,
728
+ -1,
729
+ 4,
730
+ 0,
731
+ 5,
732
+ 5,
733
+ 0,
734
+ 0,
735
+ 0,
736
+ 0,
737
+ -1,
738
+ 3,
739
+ 0,
740
+ 5,
741
+ -1,
742
+ -1,
743
+ -1,
744
+ -1,
745
+ 0,
746
+ 3,
747
+ 5,
748
+ -1,
749
+ -1,
750
+ -1,
751
+ -1,
752
+ -1,
753
+ -1,
754
+ -1,
755
+ -1,
756
+ -1,
757
+ -1,
758
+ -1,
759
+ 6,
760
+ -1,
761
+ 6,
762
+ 5,
763
+ 0,
764
+ -1,
765
+ -1,
766
+ 4,
767
+ 5,
768
+ 0,
769
+ -1,
770
+ -1,
771
+ 1,
772
+ -1,
773
+ -1,
774
+ -1,
775
+ 3,
776
+ 6,
777
+ 5,
778
+ 6,
779
+ 6,
780
+ 0,
781
+ 0,
782
+ 5,
783
+ 0,
784
+ 0,
785
+ 0,
786
+ 5,
787
+ 5,
788
+ 5,
789
+ 0,
790
+ -1,
791
+ -1,
792
+ -1,
793
+ -1,
794
+ -1,
795
+ 3,
796
+ 0,
797
+ -1,
798
+ 1,
799
+ -1,
800
+ 7,
801
+ 0,
802
+ -1,
803
+ 0,
804
+ 0,
805
+ -1,
806
+ -1,
807
+ -1,
808
+ 9,
809
+ -1,
810
+ 9,
811
+ -1,
812
+ -1,
813
+ 0,
814
+ 0,
815
+ -1,
816
+ 2,
817
+ -1,
818
+ -1,
819
+ -1,
820
+ -1,
821
+ -1,
822
+ 0,
823
+ -1,
824
+ 0,
825
+ -1,
826
+ -1,
827
+ -1,
828
+ -1,
829
+ -1,
830
+ -1,
831
+ -1,
832
+ -1,
833
+ 0,
834
+ 0,
835
+ 0,
836
+ 0,
837
+ 0,
838
+ -1,
839
+ -1,
840
+ -1,
841
+ 0,
842
+ -1,
843
+ -1,
844
+ -1,
845
+ -1,
846
+ 0,
847
+ -1,
848
+ -1,
849
+ -1,
850
+ -1,
851
+ -1,
852
+ -1,
853
+ 2,
854
+ 2,
855
+ -1,
856
+ 0,
857
+ 0,
858
+ -1,
859
+ 3,
860
+ 0,
861
+ -1,
862
+ 0,
863
+ -1,
864
+ 2,
865
+ 0,
866
+ 2,
867
+ -1,
868
+ 2,
869
+ -1,
870
+ -1,
871
+ 0,
872
+ -1,
873
+ -1,
874
+ 2,
875
+ -1,
876
+ -1,
877
+ -1,
878
+ 2,
879
+ -1,
880
+ -1,
881
+ -1,
882
+ -1,
883
+ -1,
884
+ 1,
885
+ 2,
886
+ 1,
887
+ -1,
888
+ -1,
889
+ -1,
890
+ -1,
891
+ -1,
892
+ -1,
893
+ 3,
894
+ -1,
895
+ 2,
896
+ -1,
897
+ -1,
898
+ 2,
899
+ -1,
900
+ -1,
901
+ -1,
902
+ 1,
903
+ -1,
904
+ -1,
905
+ -1,
906
+ -1,
907
+ -1,
908
+ 7,
909
+ 7,
910
+ 0,
911
+ 7,
912
+ 7,
913
+ 7,
914
+ -1,
915
+ 1,
916
+ 0,
917
+ -1,
918
+ -1,
919
+ 0,
920
+ -1,
921
+ 3,
922
+ 7,
923
+ -1,
924
+ -1,
925
+ -1,
926
+ 1,
927
+ -1,
928
+ 1,
929
+ 0,
930
+ -1,
931
+ 1,
932
+ 1,
933
+ 1,
934
+ 1,
935
+ 1,
936
+ 1,
937
+ 1,
938
+ 1,
939
+ 3,
940
+ -1,
941
+ -1,
942
+ 1,
943
+ -1,
944
+ 1,
945
+ 1,
946
+ 1,
947
+ -1,
948
+ -1,
949
+ -1,
950
+ -1,
951
+ 0,
952
+ -1,
953
+ 0,
954
+ -1,
955
+ 0,
956
+ -1,
957
+ 0,
958
+ 5,
959
+ 3,
960
+ 5,
961
+ 1,
962
+ 1,
963
+ -1,
964
+ 5,
965
+ 6,
966
+ 0,
967
+ 3,
968
+ -1,
969
+ 3,
970
+ -1,
971
+ -1,
972
+ -1,
973
+ -1,
974
+ 6,
975
+ 6,
976
+ 0,
977
+ -1,
978
+ 6,
979
+ -1,
980
+ -1,
981
+ 6,
982
+ 3,
983
+ 1,
984
+ 9,
985
+ -1,
986
+ 1,
987
+ 1,
988
+ 3,
989
+ -1,
990
+ 1,
991
+ 3,
992
+ 8,
993
+ 4,
994
+ 1,
995
+ 8,
996
+ 0,
997
+ -1,
998
+ 0,
999
+ -1,
1000
+ -1,
1001
+ -1,
1002
+ -1,
1003
+ -1,
1004
+ 7,
1005
+ 3,
1006
+ 4,
1007
+ -1,
1008
+ 4,
1009
+ 4,
1010
+ -1,
1011
+ -1,
1012
+ 4,
1013
+ -1,
1014
+ -1,
1015
+ 1,
1016
+ 1,
1017
+ 1,
1018
+ 4,
1019
+ -1,
1020
+ -1,
1021
+ 1,
1022
+ 4,
1023
+ 1,
1024
+ 4,
1025
+ 1,
1026
+ 1,
1027
+ 1,
1028
+ 1,
1029
+ -1,
1030
+ -1,
1031
+ -1,
1032
+ -1,
1033
+ 0,
1034
+ -1,
1035
+ 0,
1036
+ -1,
1037
+ -1,
1038
+ -1,
1039
+ -1,
1040
+ -1,
1041
+ -1,
1042
+ -1,
1043
+ -1,
1044
+ -1,
1045
+ -1,
1046
+ -1,
1047
+ -1,
1048
+ 7,
1049
+ 2,
1050
+ -1,
1051
+ 2,
1052
+ -1,
1053
+ -1,
1054
+ -1,
1055
+ -1,
1056
+ -1,
1057
+ -1,
1058
+ 4,
1059
+ -1,
1060
+ 7,
1061
+ -1,
1062
+ 9,
1063
+ 2,
1064
+ -1,
1065
+ -1,
1066
+ -1,
1067
+ 7,
1068
+ -1,
1069
+ -1,
1070
+ -1,
1071
+ -1,
1072
+ -1,
1073
+ -1,
1074
+ 1,
1075
+ -1,
1076
+ 8,
1077
+ -1,
1078
+ 0,
1079
+ 7,
1080
+ -1,
1081
+ -1,
1082
+ -1,
1083
+ -1,
1084
+ 8,
1085
+ 4
1086
+ ],
1087
+ "topic_sizes": {
1088
+ "0": 134,
1089
+ "-1": 428,
1090
+ "3": 31,
1091
+ "4": 29,
1092
+ "1": 58,
1093
+ "5": 29,
1094
+ "2": 34,
1095
+ "7": 25,
1096
+ "9": 20,
1097
+ "6": 27,
1098
+ "8": 24
1099
+ },
1100
+ "topic_mapper": [
1101
+ [
1102
+ -1,
1103
+ -1,
1104
+ -1
1105
+ ],
1106
+ [
1107
+ 0,
1108
+ 0,
1109
+ 3
1110
+ ],
1111
+ [
1112
+ 1,
1113
+ 1,
1114
+ 7
1115
+ ],
1116
+ [
1117
+ 2,
1118
+ 2,
1119
+ 2
1120
+ ],
1121
+ [
1122
+ 3,
1123
+ 3,
1124
+ 5
1125
+ ],
1126
+ [
1127
+ 4,
1128
+ 4,
1129
+ 6
1130
+ ],
1131
+ [
1132
+ 5,
1133
+ 5,
1134
+ 1
1135
+ ],
1136
+ [
1137
+ 6,
1138
+ 6,
1139
+ 8
1140
+ ],
1141
+ [
1142
+ 7,
1143
+ 7,
1144
+ 9
1145
+ ],
1146
+ [
1147
+ 8,
1148
+ 8,
1149
+ 0
1150
+ ],
1151
+ [
1152
+ 9,
1153
+ 9,
1154
+ 4
1155
+ ]
1156
+ ],
1157
+ "topic_labels": {
1158
+ "-1": "-1_islamistes_terroriste_algerie_racisme",
1159
+ "0": "0_lyon_toulousains_agresseurs_arrondissement",
1160
+ "1": "1_marseille_migratoire_soutenez_frontieres",
1161
+ "2": "2_pauvres_solidaire_parisien_macron",
1162
+ "3": "3_droite_zemmour_colonialisme_raisons",
1163
+ "4": "4_parler_sociaux_liberte_politiquement",
1164
+ "5": "5_boxeurs_lyon_reouverture_entrainements",
1165
+ "6": "6_universite_belgique_macronisme_guillaume",
1166
+ "7": "7_lyon_antireligieuse_decembre_traditionnelle",
1167
+ "8": "8_islamistes_bataclan_attentats_abdeslam",
1168
+ "9": "9_islamistes_muezzin_youssef_pourquoi"
1169
+ },
1170
+ "custom_labels": null,
1171
+ "_outliers": 1,
1172
+ "topic_aspects": {}
1173
+ }