| """ |
| Static mapping tables for the SinCode engine. |
| |
| Includes common-word overrides, context-dependent overrides, |
| and phonetic mapping tables (consonants, vowels, modifiers). |
| """ |
|
|
| from typing import Dict, List |
|
|
| |
| |
| |
| |
| |
| |
| |
|
|
| COMMON_WORDS: Dict[str, str] = { |
| |
| "oya": "ඔයා", |
| "oyaa": "ඔයා", |
| "eya": "ඒයා", |
| "eyaa": "ඒයා", |
| "api": "අපි", |
| "mama": "මම", |
| "mage": "මගේ", |
| "oyage": "ඔයාගේ", |
| |
| "awa": "ආවා", |
| "aawa": "ආවා", |
| "giya": "ගියා", |
| "kala": "කළා", |
| "kiwa": "කිව්වා", |
| "kiwwa": "කිව්වා", |
| "yewwa": "යැව්වා", |
| "gawa": "ගැව්වා", |
| "katha": "කතා", |
| |
| "heta": "හෙට", |
| "ada": "අද", |
| "iye": "ඊයේ", |
| |
| "one": "ඕනෙ", |
| "oney": "ඕනේ", |
| "naa": "නෑ", |
| "na": "නෑ", |
| "hari": "හරි", |
| "wage": "වගේ", |
| "nisa": "නිසා", |
| "inne": "ඉන්නෙ", |
| "inna": "ඉන්න", |
| "kalin": "කලින්", |
| "madi": "මදි", |
| |
| "giye": "ගියේ", |
| "una": "උනා", |
| "wuna": "උනා", |
| |
| "gedaradi": "ගෙදරදී", |
| "gedara": "ගෙදර", |
| |
| "honda": "හොඳ", |
| "ape": "අපේ", |
| "me": "මේ", |
| "passe": "පස්සෙ", |
| "ba": "බෑ", |
| "bari": "බැරි", |
| "bri": "බැරි", |
| "danne": "දන්නෙ", |
| "wada": "වැඩ", |
| "epa": "එපා", |
| |
| "mn": "මං", |
| "mta": "මට", |
| "oyta": "ඔයාට", |
| "oyata": "ඔයාට", |
| "krnna": "කරන්න", |
| "blnna": "බලන්න", |
| "on": "ඕනෙ", |
| |
| "thiyanawa": "තියෙනවා", |
| "wenawa": "වෙනවා", |
| "enawa": "එනවා", |
| "yanawa": "යනවා", |
| "hithenawa":"හිතෙනවා", |
| "penenawa": "පේනවා", |
| "karamu": "කරමු", |
| "balamu": "බලමු", |
| "damu": "දාමු", |
| "yamu": "යමු", |
| |
| "pr": "PR", |
| "dm": "DM", |
| "ai": "AI", |
| "it": "IT", |
| "qa": "QA", |
| "ui": "UI", |
| "ok": "OK", |
| |
| "ek": "එක", |
| "ekta": "එකට", |
| "ekat": "ඒකට", |
| "eke": "එකේ", |
| "hta": "හෙට", |
| "damma": "දැම්මා", |
| "gannako": "ගන්නකෝ", |
| |
| "gena": "ගැන", |
| "mata": "මට", |
| "laga": "ළඟ", |
| "poth": "පොත", |
| "iwara": "ඉවර", |
| "karanna": "කරන්න", |
| "hadamu": "හදමු", |
| "kiyawala": "කියවලා", |
| "baya": "බය", |
| } |
|
|
| |
| |
| |
| CONTEXT_WORDS_STANDALONE: Dict[str, str] = { |
| "eka": "ඒක", |
| "ekak": "එකක්", |
| } |
|
|
|
|
| |
| |
| |
|
|
| CONSONANTS: List[str] = [ |
| "nnd", "nndh", "nng", |
| "th", "dh", "gh", "ch", "ph", "bh", "jh", "sh", |
| "GN", "KN", "Lu", "kh", "Th", "Dh", |
| "S", "d", "c", "th", "t", "k", "D", "n", "p", "b", "m", |
| "\\y", |
| "Y", "y", "j", "l", "v", "w", "s", "h", |
| "N", "L", "K", "G", "P", "B", "f", "g", "r", |
| ] |
|
|
| CONSONANTS_UNI: List[str] = [ |
| "ඬ", "ඳ", "ඟ", |
| "ත", "ධ", "ඝ", "ච", "ඵ", "භ", "ඣ", "ෂ", |
| "ඥ", "ඤ", "ළු", "ඛ", "ඨ", "ඪ", |
| "ශ", "ද", "ච", "ත", "ට", "ක", "ඩ", "න", "ප", "බ", "ම", |
| "ය", |
| "ය", "ය", "ජ", "ල", "ව", "ව", "ස", "හ", |
| "ණ", "ළ", "ඛ", "ඝ", "ඵ", "ඹ", "ෆ", "ග", "ර", |
| ] |
|
|
| VOWELS: List[str] = [ |
| "oo", "o\\)", "oe", "aa", "a\\)", "Aa", "A\\)", "ae", |
| "ii", "i\\)", "ie", "ee", "ea", "e\\)", "ei", |
| "uu", "u\\)", "au", |
| "\\a", "a", "A", "i", "e", "u", "o", "I", |
| ] |
|
|
| VOWELS_UNI: List[str] = [ |
| "ඌ", "ඕ", "ඕ", "ආ", "ආ", "ඈ", "ඈ", "ඈ", |
| "ඊ", "ඊ", "ඊ", "ඊ", "ඒ", "ඒ", "ඒ", |
| "ඌ", "ඌ", "ඖ", |
| "ඇ", "අ", "ඇ", "ඉ", "එ", "උ", "ඔ", "ඓ", |
| ] |
|
|
| VOWEL_MODIFIERS_UNI: List[str] = [ |
| "ූ", "ෝ", "ෝ", "ා", "ා", "ෑ", "ෑ", "ෑ", |
| "ී", "ී", "ී", "ී", "ේ", "ේ", "ේ", |
| "ූ", "ූ", "ෞ", |
| "ැ", "", "ැ", "ි", "ෙ", "ු", "ො", "ෛ", |
| ] |
|
|
| SPECIAL_CONSONANTS: List[str] = ["\\n", "\\h", "\\N", "\\R", "R", "\\r"] |
| SPECIAL_CONSONANTS_UNI: List[str] = ["ං", "ඃ", "ඞ", "ඍ", "ර්\u200D", "ර්\u200D"] |
|
|
| SPECIAL_CHARS: List[str] = ["ruu", "ru"] |
| SPECIAL_CHARS_UNI: List[str] = ["ෲ", "ෘ"] |
|
|
| N_VOWELS: int = 26 |
|
|