nexusbert commited on
Commit
b1df6f1
·
1 Parent(s): 79cc3f4
Files changed (1) hide show
  1. app.py +25 -16
app.py CHANGED
@@ -329,29 +329,38 @@ def get_ai_response(text: str) -> str:
329
  HAUSA_WORDS = [
330
  "aikin", "manoma", "gona", "amfanin", "yanayi", "tsaba", "fasaha", "bisa", "noman", "shuka",
331
  "daji", "rani", "damina", "amfani", "bidi'a", "noma", "bashi", "manure", "tsiro", "gishiri",
332
- "da", "shi", "ta", "su", "mu", "ku", "ni", "kai", "ita", "shi", "ita", "su", "mu", "ku",
333
- "ina", "yana", "tana", "suna", "muna", "kuna", "na", "ka", "ta", "sa", "mu", "ku",
334
- "wani", "wata", "wasu", "wadansu", "wadannan", "wannan", "wancan", "wannan",
335
- "kamar", "kusa", "nisa", "gaba", "baya", "hagu", "dama", "sama", "kasa",
336
- "lokaci", "wani", "wata", "wasu", "wadansu", "wadannan", "wannan", "wancan"
 
 
337
  ]
338
 
339
  YORUBA_WORDS = [
340
  "ilé", "ọmọ", "òun", "awọn", "agbẹ", "oko", "ọgbà", "irugbin", "àkọsílẹ", "omi", "ojo", "àgbàlá", "irọlẹ",
341
  "ni", "ti", "si", "fun", "lati", "ninu", "lori", "labe", "pelu", "ati", "tabi", "sugbon",
342
- "o", "a", "e", "won", "mi", "re", "wa", "yin", "won", "mi", "re", "wa", "yin",
343
- "kan", "kankan", "die", "pupo", "gbogbo", "kookan", "kookan", "gbogbo",
344
- "nibi", "nibe", "nibi", "nibe", "nibi", "nibe", "nibi", "nibe",
345
- "igba", "akoko", "ojo", "osu", "odun", "ise", "owo", "owo", "owo"
 
 
 
 
346
  ]
347
 
348
  IGBO_WORDS = [
349
  "ugbo", "akụkọ", "mmiri", "ala", "ọrụ", "ncheta", "ọhụrụ", "ugwu", "nri", "ahụhụ",
350
- "na", "n'", "maka", "n'ihi", "n'ime", "n'elu", "n'okpuru", "na", "na", "na",
351
- "m", "i", "o", "ya", "anyị", "unu", "ha", "m", "i", "o", "ya", "anyị", "unu", "ha",
352
- "otu", "ọtụtụ", "ọtụtụ", "ọtụtụ", "ọtụtụ", "ọtụtụ", "ọtụtụ", "ọtụtụ",
353
- "ebe", "ebe", "ebe", "ebe", "ebe", "ebe", "ebe", "ebe",
354
- "oge", "oge", "oge", "oge", "oge", "oge", "oge", "oge"
 
 
 
355
  ]
356
 
357
  def detect_language_keywords(text: str) -> str:
@@ -369,10 +378,10 @@ def detect_language_keywords(text: str) -> str:
369
  if hausa_count > yoruba_count and hausa_count > igbo_count:
370
  logger.info("Keyword detection: Hausa")
371
  return "ha"
372
- elif yoruba_count > igbo_count:
373
  logger.info("Keyword detection: Yoruba")
374
  return "yo"
375
- elif igbo_count > 0:
376
  logger.info("Keyword detection: Igbo")
377
  return "ig"
378
  else:
 
329
  HAUSA_WORDS = [
330
  "aikin", "manoma", "gona", "amfanin", "yanayi", "tsaba", "fasaha", "bisa", "noman", "shuka",
331
  "daji", "rani", "damina", "amfani", "bidi'a", "noma", "bashi", "manure", "tsiro", "gishiri",
332
+ "da", "shi", "ta", "su", "mu", "ku", "ni", "kai", "ita", "ina", "yana", "tana", "suna", "muna", "kuna", "na", "ka", "sa",
333
+ "wani", "wata", "wasu", "wadansu", "wadannan", "wannan", "wancan",
334
+ "kamar", "kusa", "nisa", "gaba", "baya", "hagu", "dama", "sama", "kasa", "lokaci",
335
+ "zan", "tsidaya", "jiya", "lafi", "siyo", "ba", "ce", "ya", "wani", "yafi",
336
+ "kowa", "kome", "koyaushe", "koyaushe", "koyaushe", "koyaushe", "koyaushe", "koyaushe",
337
+ "saboda", "domin", "don", "saboda", "domin", "don", "saboda", "domin", "don",
338
+ "kuma", "har", "kadan", "sosai", "daidai", "kwata", "kwata", "kwata"
339
  ]
340
 
341
  YORUBA_WORDS = [
342
  "ilé", "ọmọ", "òun", "awọn", "agbẹ", "oko", "ọgbà", "irugbin", "àkọsílẹ", "omi", "ojo", "àgbàlá", "irọlẹ",
343
  "ni", "ti", "si", "fun", "lati", "ninu", "lori", "labe", "pelu", "ati", "tabi", "sugbon",
344
+ "o", "a", "e", "won", "mi", "re", "wa", "yin",
345
+ "kan", "kankan", "die", "pupo", "gbogbo", "kookan",
346
+ "nibi", "nibe", "igba", "akoko", "osu", "odun", "ise", "owo",
347
+ "láàsìbà", "dára", "jùlẹ̀", "ìwẹ̀", "ṣe", "", "tún", "fi", "wo",
348
+ "ẹ", "ọ", "ṣ", "gb", "gb", "gb", "gb", "gb", "gb", "gb", "gb",
349
+ "jẹ", "wá", "lọ", "dúró", "sọ", "gbọ", "rí", "mọ", "fẹ", "ní",
350
+ "pẹlu", "nitori", "tori", "nitori", "tori", "nitori", "tori", "nitori", "tori",
351
+ "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn", "ṣugbọn"
352
  ]
353
 
354
  IGBO_WORDS = [
355
  "ugbo", "akụkọ", "mmiri", "ala", "ọrụ", "ncheta", "ọhụrụ", "ugwu", "nri", "ahụhụ",
356
+ "n'", "maka", "n'ihi", "n'ime", "n'elu", "n'okpuru",
357
+ "ya", "anyị", "unu", "ha",
358
+ "otu", "ọtụtụ", "ebe", "oge",
359
+ "", "", "", "", "", "", "", "", "ị", "ụ", "ọ", "ị",
360
+ "bụ", "nọ", "ga", "na", "na", "na", "na", "na", "na", "na", "na",
361
+ "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi", "n'ihi",
362
+ "ma", "ọ", "bụ", "na", "ga", "nọ", "ma", "ọ", "bụ", "na", "ga", "nọ",
363
+ "dị", "ka", "n'ime", "n'elu", "n'okpuru", "n'ihi", "maka", "n'ihi", "maka"
364
  ]
365
 
366
  def detect_language_keywords(text: str) -> str:
 
378
  if hausa_count > yoruba_count and hausa_count > igbo_count:
379
  logger.info("Keyword detection: Hausa")
380
  return "ha"
381
+ elif yoruba_count > hausa_count and yoruba_count > igbo_count:
382
  logger.info("Keyword detection: Yoruba")
383
  return "yo"
384
+ elif igbo_count > hausa_count and igbo_count > yoruba_count:
385
  logger.info("Keyword detection: Igbo")
386
  return "ig"
387
  else: