Spaces:
Sleeping
Sleeping
push
Browse files
app.py
CHANGED
|
@@ -329,29 +329,38 @@ def get_ai_response(text: str) -> str:
|
|
| 329 |
HAUSA_WORDS = [
|
| 330 |
"aikin", "manoma", "gona", "amfanin", "yanayi", "tsaba", "fasaha", "bisa", "noman", "shuka",
|
| 331 |
"daji", "rani", "damina", "amfani", "bidi'a", "noma", "bashi", "manure", "tsiro", "gishiri",
|
| 332 |
-
"da", "shi", "ta", "su", "mu", "ku", "ni", "kai", "ita", "
|
| 333 |
-
"
|
| 334 |
-
"
|
| 335 |
-
"
|
| 336 |
-
"
|
|
|
|
|
|
|
| 337 |
]
|
| 338 |
|
| 339 |
YORUBA_WORDS = [
|
| 340 |
"ilé", "ọmọ", "òun", "awọn", "agbẹ", "oko", "ọgbà", "irugbin", "àkọsílẹ", "omi", "ojo", "àgbàlá", "irọlẹ",
|
| 341 |
"ni", "ti", "si", "fun", "lati", "ninu", "lori", "labe", "pelu", "ati", "tabi", "sugbon",
|
| 342 |
-
"o", "a", "e", "won", "mi", "re", "wa", "yin",
|
| 343 |
-
"kan", "kankan", "die", "pupo", "gbogbo", "kookan",
|
| 344 |
-
"nibi", "nibe", "
|
| 345 |
-
"
|
|
|
|
|
|
|
|
|
|
|
|
|
| 346 |
]
|
| 347 |
|
| 348 |
IGBO_WORDS = [
|
| 349 |
"ugbo", "akụkọ", "mmiri", "ala", "ọrụ", "ncheta", "ọhụrụ", "ugwu", "nri", "ahụhụ",
|
| 350 |
-
"
|
| 351 |
-
"
|
| 352 |
-
"otu", "ọtụtụ", "
|
| 353 |
-
"
|
| 354 |
-
"
|
|
|
|
|
|
|
|
|
|
| 355 |
]
|
| 356 |
|
| 357 |
def detect_language_keywords(text: str) -> str:
|
|
@@ -369,10 +378,10 @@ def detect_language_keywords(text: str) -> str:
|
|
| 369 |
if hausa_count > yoruba_count and hausa_count > igbo_count:
|
| 370 |
logger.info("Keyword detection: Hausa")
|
| 371 |
return "ha"
|
| 372 |
-
elif yoruba_count > igbo_count:
|
| 373 |
logger.info("Keyword detection: Yoruba")
|
| 374 |
return "yo"
|
| 375 |
-
elif igbo_count >
|
| 376 |
logger.info("Keyword detection: Igbo")
|
| 377 |
return "ig"
|
| 378 |
else:
|
|
|
|
| 329 |
HAUSA_WORDS = [
|
| 330 |
"aikin", "manoma", "gona", "amfanin", "yanayi", "tsaba", "fasaha", "bisa", "noman", "shuka",
|
| 331 |
"daji", "rani", "damina", "amfani", "bidi'a", "noma", "bashi", "manure", "tsiro", "gishiri",
|
| 332 |
+
"da", "shi", "ta", "su", "mu", "ku", "ni", "kai", "ita", "ina", "yana", "tana", "suna", "muna", "kuna", "na", "ka", "sa",
|
| 333 |
+
"wani", "wata", "wasu", "wadansu", "wadannan", "wannan", "wancan",
|
| 334 |
+
"kamar", "kusa", "nisa", "gaba", "baya", "hagu", "dama", "sama", "kasa", "lokaci",
|
| 335 |
+
"zan", "tsidaya", "jiya", "lafi", "siyo", "ba", "ce", "ya", "wani", "yafi",
|
| 336 |
+
"kowa", "kome", "koyaushe", "koyaushe", "koyaushe", "koyaushe", "koyaushe", "koyaushe",
|
| 337 |
+
"saboda", "domin", "don", "saboda", "domin", "don", "saboda", "domin", "don",
|
| 338 |
+
"kuma", "har", "kadan", "sosai", "daidai", "kwata", "kwata", "kwata"
|
| 339 |
]
|
| 340 |
|
| 341 |
YORUBA_WORDS = [
|
| 342 |
"ilé", "ọmọ", "òun", "awọn", "agbẹ", "oko", "ọgbà", "irugbin", "àkọsílẹ", "omi", "ojo", "àgbàlá", "irọlẹ",
|
| 343 |
"ni", "ti", "si", "fun", "lati", "ninu", "lori", "labe", "pelu", "ati", "tabi", "sugbon",
|
| 344 |
+
"o", "a", "e", "won", "mi", "re", "wa", "yin",
|
| 345 |
+
"kan", "kankan", "die", "pupo", "gbogbo", "kookan",
|
| 346 |
+
"nibi", "nibe", "igba", "akoko", "osu", "odun", "ise", "owo",
|
| 347 |
+
"láàsìbà", "dára", "jùlẹ̀", "ìwẹ̀", "ṣe", "kú", "tún", "fi", "wo",
|
| 348 |
+
"ẹ", "ọ", "ṣ", "gb", "gb", "gb", "gb", "gb", "gb", "gb", "gb",
|
| 349 |
+
"jẹ", "wá", "lọ", "dúró", "sọ", "gbọ", "rí", "mọ", "fẹ", "ní",
|
| 350 |
+
"pẹlu", "nitori", "tori", "nitori", "tori", "nitori", "tori", "nitori", "tori",
|
| 351 |
+
"ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn"
|
| 352 |
]
|
| 353 |
|
| 354 |
IGBO_WORDS = [
|
| 355 |
"ugbo", "akụkọ", "mmiri", "ala", "ọrụ", "ncheta", "ọhụrụ", "ugwu", "nri", "ahụhụ",
|
| 356 |
+
"n'", "maka", "n'ihi", "n'ime", "n'elu", "n'okpuru",
|
| 357 |
+
"ya", "anyị", "unu", "ha",
|
| 358 |
+
"otu", "ọtụtụ", "ebe", "oge",
|
| 359 |
+
"ụ", "ọ", "ị", "ụ", "ọ", "ị", "ụ", "ọ", "ị", "ụ", "ọ", "ị",
|
| 360 |
+
"bụ", "nọ", "ga", "na", "na", "na", "na", "na", "na", "na", "na",
|
| 361 |
+
"n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi",
|
| 362 |
+
"ma", "ọ", "bụ", "na", "ga", "nọ", "ma", "ọ", "bụ", "na", "ga", "nọ",
|
| 363 |
+
"dị", "ka", "n'ime", "n'elu", "n'okpuru", "n'ihi", "maka", "n'ihi", "maka"
|
| 364 |
]
|
| 365 |
|
| 366 |
def detect_language_keywords(text: str) -> str:
|
|
|
|
| 378 |
if hausa_count > yoruba_count and hausa_count > igbo_count:
|
| 379 |
logger.info("Keyword detection: Hausa")
|
| 380 |
return "ha"
|
| 381 |
+
elif yoruba_count > hausa_count and yoruba_count > igbo_count:
|
| 382 |
logger.info("Keyword detection: Yoruba")
|
| 383 |
return "yo"
|
| 384 |
+
elif igbo_count > hausa_count and igbo_count > yoruba_count:
|
| 385 |
logger.info("Keyword detection: Igbo")
|
| 386 |
return "ig"
|
| 387 |
else:
|