| | """
|
| | FLORES language code mapping to 2 letter ISO language code for compatibility
|
| | with Indic NLP Library (https://github.com/anoopkunchukuttan/indic_nlp_library)
|
| | """
|
| | flores_codes = {
|
| | "asm_Beng": "as",
|
| | "awa_Deva": "hi",
|
| | "ben_Beng": "bn",
|
| | "bho_Deva": "hi",
|
| | "brx_Deva": "hi",
|
| | "doi_Deva": "hi",
|
| | "eng_Latn": "en",
|
| | "gom_Deva": "kK",
|
| | "guj_Gujr": "gu",
|
| | "hin_Deva": "hi",
|
| | "hne_Deva": "hi",
|
| | "kan_Knda": "kn",
|
| | "kas_Arab": "ur",
|
| | "kas_Deva": "hi",
|
| | "kha_Latn": "en",
|
| | "lus_Latn": "en",
|
| | "mag_Deva": "hi",
|
| | "mai_Deva": "hi",
|
| | "mal_Mlym": "ml",
|
| | "mar_Deva": "mr",
|
| | "mni_Beng": "bn",
|
| | "mni_Mtei": "hi",
|
| | "npi_Deva": "ne",
|
| | "ory_Orya": "or",
|
| | "pan_Guru": "pa",
|
| | "san_Deva": "hi",
|
| | "sat_Olck": "or",
|
| | "snd_Arab": "ur",
|
| | "snd_Deva": "hi",
|
| | "tam_Taml": "ta",
|
| | "tel_Telu": "te",
|
| | "urd_Arab": "ur",
|
| | }
|
| |
|
| |
|
| | flores_to_iso = {
|
| | "asm_Beng": "as",
|
| | "awa_Deva": "awa",
|
| | "ben_Beng": "bn",
|
| | "bho_Deva": "bho",
|
| | "brx_Deva": "brx",
|
| | "doi_Deva": "doi",
|
| | "eng_Latn": "en",
|
| | "gom_Deva": "gom",
|
| | "guj_Gujr": "gu",
|
| | "hin_Deva": "hi",
|
| | "hne_Deva": "hne",
|
| | "kan_Knda": "kn",
|
| | "kas_Arab": "ksa",
|
| | "kas_Deva": "ksd",
|
| | "kha_Latn": "kha",
|
| | "lus_Latn": "lus",
|
| | "mag_Deva": "mag",
|
| | "mai_Deva": "mai",
|
| | "mal_Mlym": "ml",
|
| | "mar_Deva": "mr",
|
| | "mni_Beng": "mnib",
|
| | "mni_Mtei": "mnim",
|
| | "npi_Deva": "ne",
|
| | "ory_Orya": "or",
|
| | "pan_Guru": "pa",
|
| | "san_Deva": "sa",
|
| | "sat_Olck": "sat",
|
| | "snd_Arab": "sda",
|
| | "snd_Deva": "sdd",
|
| | "tam_Taml": "ta",
|
| | "tel_Telu": "te",
|
| | "urd_Arab": "ur",
|
| | }
|
| |
|
| | iso_to_flores = {iso_code: flores_code for flores_code, iso_code in flores_to_iso.items()}
|
| |
|
| | iso_to_flores["ks"] = "kas_Arab"
|
| | iso_to_flores["ks_Deva"] = "kas_Deva"
|
| | iso_to_flores["mni"] = "mni_Mtei"
|
| | iso_to_flores["mni_Beng"] = "mni_Beng"
|
| | iso_to_flores["sd"] = "snd_Arab"
|
| | iso_to_flores["sd_Deva"] = "snd_Deva"
|
| |
|