Kelvinmbewe commited on
Commit
cf76437
Β·
verified Β·
1 Parent(s): cd41807

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +83 -0
README.md CHANGED
@@ -171,3 +171,86 @@ import torch
171
  tokenizer = AutoTokenizer.from_pretrained("Kelvinmbewe/LusakaLang-MultiTask")
172
  model = torch.load("Kelvinmbewe/LusakaLang-MultiTask/model.pt")
173
  model.eval()
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
171
  tokenizer = AutoTokenizer.from_pretrained("Kelvinmbewe/LusakaLang-MultiTask")
172
  model = torch.load("Kelvinmbewe/LusakaLang-MultiTask/model.pt")
173
  model.eval()
174
+ ```
175
+
176
+ ```python
177
+ predict_language([
178
+ "Ndeumfwa bwino lelo",
179
+ "Galimoto inachedwa koma driver anali bwino",
180
+ "The service was terrible today"
181
+ ])
182
+ ```
183
+
184
+
185
+ ```python
186
+ predict_sentiment([
187
+ "Driver was rude and unprofessional",
188
+ "Ndimvela bwino lelo",
189
+ "The ride was okay, nothing special"
190
+ ])
191
+ ```
192
+
193
+ ```python
194
+ predict_topic([
195
+ "Payment failed but money was deducted",
196
+ "Support siyankhapo, waited long",
197
+ "Driver was over speeding"
198
+ ])
199
+ ```
200
+
201
+
202
+ ```python
203
+ @model{LusakaLangMultiTask,
204
+ author = {Kelvin Mbewe},
205
+ title = {LusakaLang Multi-Task Model},
206
+ year = 2025,
207
+ url = {https://huggingface.co/Kelvinmbewe/LusakaLang-MultiTask}
208
+ }
209
+ ```
210
+
211
+
212
+ ```python
213
+
214
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
215
+ β”‚ Input Text (Any Language) β”‚
216
+ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
217
+ β”‚
218
+ β–Ό
219
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
220
+ β”‚ Tokenizer (mBERT-based) β”‚
221
+ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
222
+ β”‚
223
+ β–Ό
224
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
225
+ β”‚ Shared mBERT Encoder Layer β”‚
226
+ β”‚ (bert-base-multilingual-cased) β”‚
227
+ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
228
+ β”‚
229
+ β–Ό
230
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
231
+ β”‚ [CLS] Pooled Representation β”‚
232
+ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
233
+ β”‚
234
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
235
+ β”‚ β”‚ β”‚
236
+ β–Ό β–Ό β–Ό
237
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
238
+ β”‚ Language Head β”‚ β”‚ Sentiment Head β”‚ β”‚ Topic Head β”‚
239
+ β”‚ (Kelvinmbewe/ β”‚ β”‚ (Kelvinmbewe/ β”‚ β”‚ (Kelvinmbewe/ β”‚
240
+ β”‚ mbert_Lusaka_ β”‚ β”‚ mbert_LusakaLang_ β”‚ β”‚ mbert_LusakaLang_ β”‚
241
+ β”‚ Language_Analysis) β”‚ β”‚ Sentiment_Analysis) β”‚ β”‚ Topic) β”‚
242
+ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
243
+ β”‚ β”‚ β”‚
244
+ β–Ό β–Ό β–Ό
245
+ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
246
+ β”‚ Language Label β”‚ β”‚ Sentiment Label β”‚ β”‚ Topic Label β”‚
247
+ β”‚ (e.g., Bemba, Nyanja, β”‚ β”‚ (Negative/Neutral/ β”‚ β”‚ (Driver, Payment, β”‚
248
+ β”‚ English, Code‑Switch)β”‚ β”‚ Positive) β”‚ β”‚ Support, etc.) β”‚
249
+ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
250
+
251
+ ```
252
+
253
+
254
+
255
+
256
+