Upload folder using huggingface_hub
Browse files- config.json +215 -0
- topic_embeddings.safetensors +3 -0
- topics.json +0 -0
config.json
ADDED
|
@@ -0,0 +1,215 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
{
|
| 2 |
+
"calculate_probabilities": false,
|
| 3 |
+
"language": "multilingual",
|
| 4 |
+
"low_memory": false,
|
| 5 |
+
"min_topic_size": 10,
|
| 6 |
+
"n_gram_range": [
|
| 7 |
+
1,
|
| 8 |
+
1
|
| 9 |
+
],
|
| 10 |
+
"nr_topics": "auto",
|
| 11 |
+
"seed_topic_list": [
|
| 12 |
+
[
|
| 13 |
+
"kementerian",
|
| 14 |
+
"menteri",
|
| 15 |
+
"kebijakan",
|
| 16 |
+
"infrastruktur",
|
| 17 |
+
"asn",
|
| 18 |
+
"pns",
|
| 19 |
+
"pemerintah",
|
| 20 |
+
"presiden",
|
| 21 |
+
"ibukota",
|
| 22 |
+
"otonomi",
|
| 23 |
+
"daerah",
|
| 24 |
+
"regulasi",
|
| 25 |
+
"proyek",
|
| 26 |
+
"pembangunan"
|
| 27 |
+
],
|
| 28 |
+
[
|
| 29 |
+
"pemilu",
|
| 30 |
+
"pilkada",
|
| 31 |
+
"dpr",
|
| 32 |
+
"partai",
|
| 33 |
+
"kampanye",
|
| 34 |
+
"bawaslu",
|
| 35 |
+
"kpu",
|
| 36 |
+
"pilpres",
|
| 37 |
+
"caleg",
|
| 38 |
+
"koalisi",
|
| 39 |
+
"oposisi",
|
| 40 |
+
"legislasi",
|
| 41 |
+
"debat",
|
| 42 |
+
"suara",
|
| 43 |
+
"konstitusi"
|
| 44 |
+
],
|
| 45 |
+
[
|
| 46 |
+
"olahraga",
|
| 47 |
+
"sepakbola",
|
| 48 |
+
"futsal",
|
| 49 |
+
"basket",
|
| 50 |
+
"bulutangkis",
|
| 51 |
+
"atlet",
|
| 52 |
+
"turnamen",
|
| 53 |
+
"medali",
|
| 54 |
+
"piala",
|
| 55 |
+
"fifa",
|
| 56 |
+
"aff",
|
| 57 |
+
"liga",
|
| 58 |
+
"stadion",
|
| 59 |
+
"pertandingan",
|
| 60 |
+
"klub"
|
| 61 |
+
],
|
| 62 |
+
[
|
| 63 |
+
"ekonomi",
|
| 64 |
+
"saham",
|
| 65 |
+
"investasi",
|
| 66 |
+
"inflasi",
|
| 67 |
+
"bank",
|
| 68 |
+
"keuangan",
|
| 69 |
+
"pajak",
|
| 70 |
+
"ihsg",
|
| 71 |
+
"umkm",
|
| 72 |
+
"harga",
|
| 73 |
+
"pasar",
|
| 74 |
+
"ekspor",
|
| 75 |
+
"impor",
|
| 76 |
+
"startup",
|
| 77 |
+
"bisnis",
|
| 78 |
+
"perdagangan"
|
| 79 |
+
],
|
| 80 |
+
[
|
| 81 |
+
"polisi",
|
| 82 |
+
"tersangka",
|
| 83 |
+
"pengadilan",
|
| 84 |
+
"hukum",
|
| 85 |
+
"penjara",
|
| 86 |
+
"korupsi",
|
| 87 |
+
"kpk",
|
| 88 |
+
"pembunuhan",
|
| 89 |
+
"penipuan",
|
| 90 |
+
"sidang",
|
| 91 |
+
"vonis",
|
| 92 |
+
"kriminal",
|
| 93 |
+
"kasus",
|
| 94 |
+
"penyidikan"
|
| 95 |
+
],
|
| 96 |
+
[
|
| 97 |
+
"kesehatan",
|
| 98 |
+
"penyakit",
|
| 99 |
+
"rumah sakit",
|
| 100 |
+
"dokter",
|
| 101 |
+
"virus",
|
| 102 |
+
"vaksin",
|
| 103 |
+
"obat",
|
| 104 |
+
"bpjs",
|
| 105 |
+
"pandemi",
|
| 106 |
+
"medis",
|
| 107 |
+
"gejala",
|
| 108 |
+
"terapi",
|
| 109 |
+
"pasien",
|
| 110 |
+
"klinis"
|
| 111 |
+
],
|
| 112 |
+
[
|
| 113 |
+
"teknologi",
|
| 114 |
+
"internet",
|
| 115 |
+
"aplikasi",
|
| 116 |
+
"ai",
|
| 117 |
+
"digital",
|
| 118 |
+
"siber",
|
| 119 |
+
"hacker",
|
| 120 |
+
"inovasi",
|
| 121 |
+
"satelit",
|
| 122 |
+
"algoritma",
|
| 123 |
+
"perangkat",
|
| 124 |
+
"data",
|
| 125 |
+
"machine learning",
|
| 126 |
+
"sistem"
|
| 127 |
+
],
|
| 128 |
+
[
|
| 129 |
+
"artis",
|
| 130 |
+
"film",
|
| 131 |
+
"musik",
|
| 132 |
+
"konser",
|
| 133 |
+
"selebritas",
|
| 134 |
+
"bioskop",
|
| 135 |
+
"drama",
|
| 136 |
+
"viral",
|
| 137 |
+
"sinetron",
|
| 138 |
+
"festival",
|
| 139 |
+
"gaya",
|
| 140 |
+
"influencer",
|
| 141 |
+
"lifestyle"
|
| 142 |
+
],
|
| 143 |
+
[
|
| 144 |
+
"gempa",
|
| 145 |
+
"banjir",
|
| 146 |
+
"cuaca",
|
| 147 |
+
"bmkg",
|
| 148 |
+
"tsunami",
|
| 149 |
+
"longsor",
|
| 150 |
+
"erupsi",
|
| 151 |
+
"badai",
|
| 152 |
+
"evakuasi",
|
| 153 |
+
"korban",
|
| 154 |
+
"mitigasi",
|
| 155 |
+
"iklim",
|
| 156 |
+
"hujan",
|
| 157 |
+
"angin"
|
| 158 |
+
],
|
| 159 |
+
[
|
| 160 |
+
"sekolah",
|
| 161 |
+
"guru",
|
| 162 |
+
"siswa",
|
| 163 |
+
"mahasiswa",
|
| 164 |
+
"kampus",
|
| 165 |
+
"universitas",
|
| 166 |
+
"beasiswa",
|
| 167 |
+
"kurikulum",
|
| 168 |
+
"ujian",
|
| 169 |
+
"akademik",
|
| 170 |
+
"pembelajaran",
|
| 171 |
+
"riset"
|
| 172 |
+
],
|
| 173 |
+
[
|
| 174 |
+
"luar negeri",
|
| 175 |
+
"global",
|
| 176 |
+
"diplomasi",
|
| 177 |
+
"perang",
|
| 178 |
+
"konflik",
|
| 179 |
+
"pbb",
|
| 180 |
+
"nato",
|
| 181 |
+
"geopolitik",
|
| 182 |
+
"negara",
|
| 183 |
+
"internasional",
|
| 184 |
+
"sanksi"
|
| 185 |
+
],
|
| 186 |
+
[
|
| 187 |
+
"jalan",
|
| 188 |
+
"tol",
|
| 189 |
+
"kereta",
|
| 190 |
+
"bandara",
|
| 191 |
+
"pelabuhan",
|
| 192 |
+
"transportasi",
|
| 193 |
+
"kendaraan",
|
| 194 |
+
"logistik",
|
| 195 |
+
"infrastruktur",
|
| 196 |
+
"proyek"
|
| 197 |
+
],
|
| 198 |
+
[
|
| 199 |
+
"lingkungan",
|
| 200 |
+
"energi",
|
| 201 |
+
"listrik",
|
| 202 |
+
"minyak",
|
| 203 |
+
"gas",
|
| 204 |
+
"emisi",
|
| 205 |
+
"polusi",
|
| 206 |
+
"renewable",
|
| 207 |
+
"energi terbarukan",
|
| 208 |
+
"tambang"
|
| 209 |
+
]
|
| 210 |
+
],
|
| 211 |
+
"top_n_words": 10,
|
| 212 |
+
"verbose": true,
|
| 213 |
+
"zeroshot_min_similarity": 0.7,
|
| 214 |
+
"zeroshot_topic_list": null
|
| 215 |
+
}
|
topic_embeddings.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:8fa3bc98d1850a29c1947c6c012955394176542b5638afca85fbf2cba65d476d
|
| 3 |
+
size 938584
|
topics.json
ADDED
|
The diff for this file is too large to render.
See raw diff
|
|
|