| [ | |
| "\t", | |
| "\n", | |
| " ", | |
| " ", | |
| " JOURNAL TITLE", | |
| " XXXX XXXX", | |
| " journal title", | |
| "\"", | |
| "'", | |
| "''", | |
| "'-(", | |
| "'-)", | |
| "'Cause", | |
| "'Cos", | |
| "'Coz", | |
| "'Cuz", | |
| "'S", | |
| "'X", | |
| "'Xxx", | |
| "'Xxxxx", | |
| "'am", | |
| "'bout", | |
| "'cause", | |
| "'cos", | |
| "'coz", | |
| "'cuz", | |
| "'d", | |
| "'em", | |
| "'ll", | |
| "'m", | |
| "'nuff", | |
| "'re", | |
| "'s", | |
| "'ve", | |
| "'x", | |
| "'xx", | |
| "'xxx", | |
| "'xxxx", | |
| "'y", | |
| "(", | |
| "(((", | |
| "(*>", | |
| "(*_*)", | |
| "(-8", | |
| "(-:", | |
| "(-;", | |
| "(-_-)", | |
| "(-d", | |
| "(._.)", | |
| "(:", | |
| "(;", | |
| "(=", | |
| "(>_<)", | |
| "(^_^)", | |
| "(o:", | |
| "(x:", | |
| "(x_x)", | |
| "(\u00ac_\u00ac)", | |
| "(\u0ca0_\u0ca0)", | |
| "(\u256f\u00b0\u25a1\u00b0\uff09\u256f\ufe35\u253b\u2501\u253b", | |
| ")", | |
| ")))", | |
| ")-:", | |
| ")/\u00af", | |
| "):", | |
| "*", | |
| ",", | |
| "-", | |
| "-((", | |
| "-))", | |
| "-/", | |
| "-0", | |
| "-3", | |
| "-8", | |
| "-D", | |
| "-O", | |
| "-P", | |
| "-X", | |
| "-_-", | |
| "-__-", | |
| "-d", | |
| "-o", | |
| "-p", | |
| "-x", | |
| "-|", | |
| ".", | |
| ".12", | |
| ".C.", | |
| ".D.", | |
| ".E.", | |
| ".G.", | |
| ".H.", | |
| ".J.", | |
| ".M.", | |
| ".Y.", | |
| "._.", | |
| ".e.", | |
| ".g.", | |
| ".m.", | |
| ".s.", | |
| "/", | |
| "/3", | |
| "/d", | |
| "/or", | |
| "0", | |
| "0.0", | |
| "0.3", | |
| "0.o", | |
| "008", | |
| "020", | |
| "022", | |
| "023", | |
| "024", | |
| "025", | |
| "077", | |
| "0_0", | |
| "0_o", | |
| "1", | |
| "1.1", | |
| "10", | |
| "10a.m", | |
| "10a.m.", | |
| "10p.m", | |
| "10p.m.", | |
| "11", | |
| "113", | |
| "11a.m", | |
| "11a.m.", | |
| "11p.m", | |
| "11p.m.", | |
| "12", | |
| "120", | |
| "121", | |
| "12a.m", | |
| "12a.m.", | |
| "12p.m", | |
| "12p.m.", | |
| "13", | |
| "134", | |
| "137", | |
| "14.1", | |
| "14.12", | |
| "143", | |
| "153", | |
| "156", | |
| "16.2", | |
| "18", | |
| "1990", | |
| "1a.m", | |
| "1a.m.", | |
| "1p.m", | |
| "1p.m.", | |
| "2", | |
| "2008", | |
| "2020", | |
| "2022", | |
| "2023", | |
| "2024", | |
| "2025", | |
| "229", | |
| "23", | |
| "244", | |
| "246", | |
| "2a.m", | |
| "2a.m.", | |
| "2p.m", | |
| "2p.m.", | |
| "3", | |
| "33", | |
| "333", | |
| "343", | |
| "35.2", | |
| "3a.m", | |
| "3a.m.", | |
| "3p.m", | |
| "3p.m.", | |
| "4", | |
| "4.1", | |
| "40.3", | |
| "418", | |
| "49", | |
| "4a.m", | |
| "4a.m.", | |
| "4p.m", | |
| "4p.m.", | |
| "5", | |
| "5.2", | |
| "51.1", | |
| "5a.m", | |
| "5a.m.", | |
| "5p.m", | |
| "5p.m.", | |
| "6", | |
| "6.2", | |
| "603", | |
| "638", | |
| "69", | |
| "6a.m", | |
| "6a.m.", | |
| "6p.m", | |
| "6p.m.", | |
| "7", | |
| "7.1", | |
| "73", | |
| "79", | |
| "7a.m", | |
| "7a.m.", | |
| "7p.m", | |
| "7p.m.", | |
| "8", | |
| "8)", | |
| "8-", | |
| "8-)", | |
| "8-D", | |
| "8-d", | |
| "85", | |
| "8D", | |
| "8a.m", | |
| "8a.m.", | |
| "8d", | |
| "8p.m", | |
| "8p.m.", | |
| "9", | |
| "95", | |
| "9603", | |
| "990", | |
| "9a.m", | |
| "9a.m.", | |
| "9p.m", | |
| "9p.m.", | |
| ":", | |
| ":'(", | |
| ":')", | |
| ":'-(", | |
| ":'-)", | |
| ":(", | |
| ":((", | |
| ":(((", | |
| ":()", | |
| ":)", | |
| ":))", | |
| ":)))", | |
| ":*", | |
| ":-(", | |
| ":-((", | |
| ":-(((", | |
| ":-)", | |
| ":-))", | |
| ":-)))", | |
| ":-*", | |
| ":-/", | |
| ":-0", | |
| ":-3", | |
| ":->", | |
| ":-D", | |
| ":-O", | |
| ":-P", | |
| ":-X", | |
| ":-]", | |
| ":-d", | |
| ":-o", | |
| ":-p", | |
| ":-x", | |
| ":-|", | |
| ":-}", | |
| ":/", | |
| ":0", | |
| ":1", | |
| ":3", | |
| ":>", | |
| ":D", | |
| ":O", | |
| ":P", | |
| ":X", | |
| ":]", | |
| ":d", | |
| ":o", | |
| ":o)", | |
| ":p", | |
| ":x", | |
| ":x)", | |
| ":|", | |
| ":}", | |
| ":\u2019(", | |
| ":\u2019)", | |
| ":\u2019-(", | |
| ":\u2019-)", | |
| ";", | |
| ";)", | |
| ";-)", | |
| ";-D", | |
| ";-X", | |
| ";-d", | |
| ";D", | |
| ";X", | |
| ";_;", | |
| ";d", | |
| "<", | |
| "<.<", | |
| "</3", | |
| "</d", | |
| "<3", | |
| "<33", | |
| "<333", | |
| "<d", | |
| "<dd", | |
| "<ddd", | |
| "<space>", | |
| "<xxxx>", | |
| "=", | |
| "=(", | |
| "=)", | |
| "=/", | |
| "=3", | |
| "=D", | |
| "=X", | |
| "=[", | |
| "=]", | |
| "=d", | |
| "=|", | |
| ">", | |
| ">.<", | |
| ">.>", | |
| ">:(", | |
| ">:o", | |
| ">:x", | |
| "><(((*>", | |
| "@", | |
| "@_@", | |
| "A", | |
| "ACM", | |
| "ATE", | |
| "AUTHOR", | |
| "Adam", | |
| "Adm", | |
| "Adm.", | |
| "Afli", | |
| "Ahmed", | |
| "Ai", | |
| "Ak", | |
| "Ak.", | |
| "Ala", | |
| "Ala.", | |
| "Alabama", | |
| "Alaska", | |
| "Algorithm", | |
| "Andy", | |
| "Apr", | |
| "Apr.", | |
| "April", | |
| "Are", | |
| "Ariz", | |
| "Ariz.", | |
| "Arizona", | |
| "Ark", | |
| "Ark.", | |
| "Arkansas", | |
| "Artificial", | |
| "Arzen", | |
| "Association", | |
| "Audio", | |
| "Aug", | |
| "Aug.", | |
| "August", | |
| "B", | |
| "Baijun", | |
| "Based", | |
| "Bros", | |
| "Bros.", | |
| "Brown", | |
| "C", | |
| "C'm", | |
| "C++", | |
| "C.", | |
| "CSUR", | |
| "Ca", | |
| "Calif", | |
| "Calif.", | |
| "California", | |
| "Can", | |
| "Cause", | |
| "Co", | |
| "Co.", | |
| "Code", | |
| "Colo", | |
| "Colo.", | |
| "Colorado", | |
| "Computational", | |
| "Computer", | |
| "Computing", | |
| "Conn", | |
| "Conn.", | |
| "Connecticut", | |
| "Corp", | |
| "Corp.", | |
| "Corpus", | |
| "Cos", | |
| "Could", | |
| "Coz", | |
| "Cuz", | |
| "C\u2019m", | |
| "D", | |
| "D.", | |
| "D.C.", | |
| "Dare", | |
| "Dec", | |
| "Dec.", | |
| "December", | |
| "Del", | |
| "Del.", | |
| "Delaware", | |
| "Did", | |
| "Distillation", | |
| "Do", | |
| "Does", | |
| "Doin", | |
| "Doin'", | |
| "Doin\u2019", | |
| "Dorothy", | |
| "Dr", | |
| "Dr.", | |
| "E", | |
| "E.G.", | |
| "E.g", | |
| "E.g.", | |
| "EEE", | |
| "Empowering", | |
| "Engineering", | |
| "English", | |
| "Ethics", | |
| "Exploring", | |
| "F", | |
| "F.", | |
| "Fang", | |
| "Feb", | |
| "Feb.", | |
| "February", | |
| "Felix", | |
| "Fine", | |
| "Fla", | |
| "Fla.", | |
| "Florida", | |
| "G", | |
| "Ga", | |
| "Ga.", | |
| "Gen", | |
| "Gen.", | |
| "Georgia", | |
| "Goin", | |
| "Goin'", | |
| "Goin\u2019", | |
| "Gon", | |
| "Got", | |
| "Gov", | |
| "Gov.", | |
| "H", | |
| "HOR", | |
| "Had", | |
| "Haifeng", | |
| "Haithem", | |
| "Has", | |
| "Have", | |
| "Havin", | |
| "Havin'", | |
| "Havin\u2019", | |
| "He", | |
| "He's", | |
| "Heakl", | |
| "He\u2019s", | |
| "How", | |
| "How's", | |
| "How\u2019s", | |
| "Human", | |
| "I", | |
| "I.E.", | |
| "I.e", | |
| "I.e.", | |
| "ICS", | |
| "IEEE", | |
| "Ia", | |
| "Ia.", | |
| "Id", | |
| "Id.", | |
| "Idaho", | |
| "Ill", | |
| "Ill.", | |
| "Illinois", | |
| "In", | |
| "Inc", | |
| "Inc.", | |
| "Ind", | |
| "Ind.", | |
| "Indiana", | |
| "Information", | |
| "Intelligence", | |
| "Iowa", | |
| "Is", | |
| "It", | |
| "It's", | |
| "It\u2019s", | |
| "J", | |
| "Jan", | |
| "Jan.", | |
| "January", | |
| "Ji", | |
| "Jianhui", | |
| "Joss", | |
| "Journal", | |
| "Jr", | |
| "Jr.", | |
| "Ju", | |
| "Jul", | |
| "Jul.", | |
| "July", | |
| "Jun", | |
| "Jun.", | |
| "June", | |
| "K", | |
| "K.", | |
| "Kan", | |
| "Kan.", | |
| "Kans", | |
| "Kans.", | |
| "Kansas", | |
| "Kenny", | |
| "Kentucky", | |
| "Knowledge", | |
| "Ky", | |
| "Ky.", | |
| "L", | |
| "LLM", | |
| "La", | |
| "La.", | |
| "Language", | |
| "Lankford", | |
| "Let", | |
| "Let's", | |
| "Let\u2019s", | |
| "Linguistics", | |
| "Lopez", | |
| "Louisiana", | |
| "Lovin", | |
| "Lovin'", | |
| "Lovin\u2019", | |
| "Ltd", | |
| "Ltd.", | |
| "M", | |
| "Ma'am", | |
| "Machine", | |
| "Mar", | |
| "Mar.", | |
| "March", | |
| "Mass", | |
| "Mass.", | |
| "Massachusetts", | |
| "May", | |
| "Ma\u2019am", | |
| "Md", | |
| "Md.", | |
| "Messrs", | |
| "Messrs.", | |
| "Miah", | |
| "Mich", | |
| "Mich.", | |
| "Michigan", | |
| "Might", | |
| "Minn", | |
| "Minn.", | |
| "Minnesota", | |
| "Miss", | |
| "Miss.", | |
| "Mississippi", | |
| "Mo", | |
| "Mo.", | |
| "Moghe", | |
| "Mohammed", | |
| "Mohsen", | |
| "Mont", | |
| "Mont.", | |
| "Moorkens", | |
| "Mount", | |
| "Mr", | |
| "Mr.", | |
| "Mrs", | |
| "Mrs.", | |
| "Ms", | |
| "Ms.", | |
| "Mt", | |
| "Mt.", | |
| "Must", | |
| "N", | |
| "N.C.", | |
| "N.D.", | |
| "N.H.", | |
| "N.J.", | |
| "N.M.", | |
| "N.Y.", | |
| "Neb", | |
| "Neb.", | |
| "Nebr", | |
| "Nebr.", | |
| "Nebraska", | |
| "Need", | |
| "Neural", | |
| "Nev", | |
| "Nev.", | |
| "Nevada", | |
| "New Hampshire", | |
| "New Jersey", | |
| "New Mexico", | |
| "New York", | |
| "Nikita", | |
| "Non\u2010Autoregressive", | |
| "North Carolina", | |
| "North Dakota", | |
| "Not", | |
| "Nothin", | |
| "Nothin'", | |
| "Nothin\u2019", | |
| "Nov", | |
| "Nov.", | |
| "November", | |
| "Nuthin", | |
| "Nuthin'", | |
| "Nuthin\u2019", | |
| "O", | |
| "O'clock", | |
| "O.O", | |
| "O.o", | |
| "O_O", | |
| "O_o", | |
| "Oct", | |
| "Oct.", | |
| "October", | |
| "Okla", | |
| "Okla.", | |
| "Oklahoma", | |
| "Ol", | |
| "Ol'", | |
| "Ol\u2019", | |
| "Ore", | |
| "Ore.", | |
| "Oregon", | |
| "Ought", | |
| "O\u2019clock", | |
| "P", | |
| "PSYCHOLINGUISTICS", | |
| "PUBLICATION DATE", | |
| "Pa", | |
| "Pa.", | |
| "Pang", | |
| "Pennsylvania", | |
| "Peter", | |
| "Ph", | |
| "Ph.D.", | |
| "Procedia", | |
| "Processing", | |
| "Prof", | |
| "Prof.", | |
| "Progress", | |
| "Prompting", | |
| "R", | |
| "ROOT", | |
| "Rep", | |
| "Rep.", | |
| "Reports", | |
| "Research", | |
| "Rev", | |
| "Rev.", | |
| "Revisiting", | |
| "S", | |
| "S.C.", | |
| "SUR", | |
| "Saef", | |
| "Salute", | |
| "Science", | |
| "Scientific", | |
| "Sen", | |
| "Sen.", | |
| "Sentences", | |
| "Sep", | |
| "Sep.", | |
| "Sept", | |
| "Sept.", | |
| "September", | |
| "Sha", | |
| "She", | |
| "She's", | |
| "She\u2019s", | |
| "Should", | |
| "Somethin", | |
| "Somethin'", | |
| "Somethin\u2019", | |
| "South Carolina", | |
| "Speech", | |
| "St", | |
| "St.", | |
| "Stahlberg", | |
| "Statistical", | |
| "Surveys", | |
| "S\u00e9amus", | |
| "T", | |
| "TLE", | |
| "Target", | |
| "Tenn", | |
| "Tenn.", | |
| "Tennessee", | |
| "That", | |
| "That's", | |
| "That\u2019s", | |
| "There", | |
| "There's", | |
| "There\u2019s", | |
| "These", | |
| "They", | |
| "This", | |
| "This's", | |
| "This\u2019s", | |
| "Those", | |
| "Transactions", | |
| "Translation", | |
| "U", | |
| "Ullah", | |
| "Using", | |
| "V", | |
| "V.V", | |
| "V_V", | |
| "Va", | |
| "Va.", | |
| "Virginia", | |
| "W", | |
| "Wang", | |
| "Was", | |
| "Wash", | |
| "Wash.", | |
| "Washington", | |
| "Way", | |
| "We", | |
| "Weihui", | |
| "Were", | |
| "What", | |
| "What's", | |
| "What\u2019s", | |
| "When", | |
| "When's", | |
| "When\u2019s", | |
| "Where", | |
| "Where's", | |
| "Where\u2019s", | |
| "Who", | |
| "Who's", | |
| "Who\u2019s", | |
| "Why", | |
| "Why's", | |
| "Why\u2019s", | |
| "Wis", | |
| "Wis.", | |
| "Wisconsin", | |
| "Wo", | |
| "Would", | |
| "X'x", | |
| "X'xxxx", | |
| "X++", | |
| "X.", | |
| "X.X", | |
| "X.X.", | |
| "X.x", | |
| "X.x.", | |
| "XD", | |
| "XDD", | |
| "XX", | |
| "XXX", | |
| "XXXX", | |
| "XXXX XXXX", | |
| "X_X", | |
| "X_x", | |
| "Xx", | |
| "Xx'", | |
| "Xx'x", | |
| "Xx'xx", | |
| "Xx.", | |
| "Xx.X.", | |
| "Xxx", | |
| "Xxx'x", | |
| "Xxx.", | |
| "Xxxx", | |
| "Xxxx'", | |
| "Xxxx'x", | |
| "Xxxx.", | |
| "Xxxxx", | |
| "Xxxxx'", | |
| "Xxxxx'x", | |
| "Xxxxx.", | |
| "Xxxxx\u2019", | |
| "Xxxxx\u2019x", | |
| "Xxxx\u2019", | |
| "Xxxx\u2019x", | |
| "Xxx\u2010Xxxxx", | |
| "Xxx\u2019x", | |
| "Xx\u2019", | |
| "Xx\u2019x", | |
| "Xx\u2019xx", | |
| "X\u2019x", | |
| "X\u2019xxxx", | |
| "Y", | |
| "You", | |
| "Z", | |
| "Zero", | |
| "Zhiwei", | |
| "[", | |
| "[-:", | |
| "[:", | |
| "[=", | |
| "\\", | |
| "\\\")", | |
| "\\n", | |
| "\\t", | |
| "\\x", | |
| "]", | |
| "]=", | |
| "^", | |
| "^_^", | |
| "^__^", | |
| "^___^", | |
| "_*)", | |
| "_-)", | |
| "_.)", | |
| "_<)", | |
| "_^)", | |
| "__-", | |
| "__^", | |
| "_\u00ac)", | |
| "_\u0ca0)", | |
| "a", | |
| "a.", | |
| "a.m", | |
| "a.m.", | |
| "about", | |
| "academic", | |
| "accuracy", | |
| "ace", | |
| "ach", | |
| "acm", | |
| "acy", | |
| "adam", | |
| "adaptmllm", | |
| "adm", | |
| "adm.", | |
| "aef", | |
| "afli", | |
| "age", | |
| "ahmed", | |
| "ai", | |
| "ain", | |
| "ak", | |
| "ak.", | |
| "akl", | |
| "al", | |
| "ala", | |
| "ala.", | |
| "algorithm", | |
| "all", | |
| "am", | |
| "an.", | |
| "analysis", | |
| "and", | |
| "and/or", | |
| "andy", | |
| "ang", | |
| "ans", | |
| "approach", | |
| "apr", | |
| "apr.", | |
| "ar.", | |
| "arabic", | |
| "are", | |
| "ariz", | |
| "ariz.", | |
| "ark", | |
| "ark.", | |
| "artificial", | |
| "arzen", | |
| "ash", | |
| "ass", | |
| "association", | |
| "ate", | |
| "audio", | |
| "aug", | |
| "aug.", | |
| "author", | |
| "ave", | |
| "b", | |
| "b.", | |
| "baijun", | |
| "based", | |
| "because", | |
| "bic", | |
| "ble", | |
| "bout", | |
| "br.", | |
| "bros", | |
| "bros.", | |
| "brown", | |
| "c", | |
| "c'm", | |
| "c++", | |
| "c.", | |
| "ca", | |
| "cal", | |
| "calif", | |
| "calif.", | |
| "can", | |
| "cause", | |
| "ce>", | |
| "ces", | |
| "ch.", | |
| "challenge", | |
| "challenges", | |
| "classic", | |
| "co", | |
| "co.", | |
| "code", | |
| "colo", | |
| "colo.", | |
| "come", | |
| "comparative", | |
| "computational", | |
| "computer", | |
| "computing", | |
| "conn", | |
| "conn.", | |
| "corp", | |
| "corp.", | |
| "corpus", | |
| "cos", | |
| "could", | |
| "coz", | |
| "cross", | |
| "csur", | |
| "ct.", | |
| "cuz", | |
| "c\u2019m", | |
| "d", | |
| "d)", | |
| "d-", | |
| "d-)", | |
| "d-X", | |
| "d.", | |
| "d.c.", | |
| "d.d", | |
| "d.x", | |
| "dX", | |
| "d_d", | |
| "d_x", | |
| "dal", | |
| "dam", | |
| "dare", | |
| "dd", | |
| "dd.d", | |
| "dd.dd", | |
| "ddd", | |
| "dddd", | |
| "ddx.x", | |
| "ddx.x.", | |
| "dec", | |
| "dec.", | |
| "del", | |
| "del.", | |
| "dge", | |
| "dia", | |
| "did", | |
| "dio", | |
| "distillation", | |
| "dm.", | |
| "do", | |
| "does", | |
| "doin", | |
| "doin'", | |
| "doing", | |
| "doin\u2019", | |
| "domain", | |
| "dorothy", | |
| "dr", | |
| "dr.", | |
| "dx.x", | |
| "dx.x.", | |
| "e", | |
| "e's", | |
| "e.", | |
| "e.g", | |
| "e.g.", | |
| "e13077", | |
| "eb.", | |
| "ebr", | |
| "ec.", | |
| "ech", | |
| "eed", | |
| "eee", | |
| "egy", | |
| "egyptian", | |
| "el.", | |
| "els", | |
| "em", | |
| "empowering", | |
| "en", | |
| "en.", | |
| "eng", | |
| "engineering", | |
| "english", | |
| "enn", | |
| "enough", | |
| "ens", | |
| "ensemble", | |
| "ent", | |
| "ep.", | |
| "ept", | |
| "ere", | |
| "erg", | |
| "ero", | |
| "ers", | |
| "ese", | |
| "ess", | |
| "et", | |
| "eta", | |
| "ethics", | |
| "ets", | |
| "ev.", | |
| "evaluation", | |
| "everyone", | |
| "exploring", | |
| "eys", | |
| "e\u2019s", | |
| "f", | |
| "f.", | |
| "fang", | |
| "feb", | |
| "feb.", | |
| "felix", | |
| "fic", | |
| "fine", | |
| "fla", | |
| "fla.", | |
| "fli", | |
| "for", | |
| "g", | |
| "g.", | |
| "ga", | |
| "ga.", | |
| "gen", | |
| "gen.", | |
| "ges", | |
| "get", | |
| "ghe", | |
| "ght", | |
| "gle", | |
| "goin", | |
| "goin'", | |
| "going", | |
| "goin\u2019", | |
| "gon", | |
| "gonna", | |
| "google", | |
| "got", | |
| "gov", | |
| "gov.", | |
| "h", | |
| "h.", | |
| "had", | |
| "haifeng", | |
| "haithem", | |
| "has", | |
| "hat", | |
| "have", | |
| "havin", | |
| "havin'", | |
| "having", | |
| "havin\u2019", | |
| "he", | |
| "he's", | |
| "heakl", | |
| "hed", | |
| "hem", | |
| "hen", | |
| "hey", | |
| "he\u2019s", | |
| "hin", | |
| "his", | |
| "hot", | |
| "how", | |
| "how's", | |
| "how\u2019s", | |
| "hui", | |
| "human", | |
| "i", | |
| "i.", | |
| "i.e", | |
| "i.e.", | |
| "ia", | |
| "ia.", | |
| "iah", | |
| "ial", | |
| "ian", | |
| "ich", | |
| "ics", | |
| "id", | |
| "id.", | |
| "ieee", | |
| "iew", | |
| "if.", | |
| "ike", | |
| "ill", | |
| "ill.", | |
| "in", | |
| "in'", | |
| "inc", | |
| "inc.", | |
| "ind", | |
| "ind.", | |
| "ine", | |
| "information", | |
| "ing", | |
| "inn", | |
| "integrated", | |
| "intelligence", | |
| "in\u2019", | |
| "ion", | |
| "is", | |
| "is.", | |
| "ish", | |
| "iss", | |
| "it", | |
| "it's", | |
| "ita", | |
| "ith", | |
| "it\u2019s", | |
| "ive", | |
| "iz.", | |
| "j", | |
| "j.", | |
| "jan", | |
| "jan.", | |
| "ji", | |
| "jianhui", | |
| "joss", | |
| "journal", | |
| "jr", | |
| "jr.", | |
| "ju", | |
| "jul", | |
| "jul.", | |
| "jun", | |
| "jun.", | |
| "k", | |
| "k.", | |
| "kan", | |
| "kan.", | |
| "kans", | |
| "kans.", | |
| "kenny", | |
| "kla", | |
| "knowledge", | |
| "ky", | |
| "ky.", | |
| "l", | |
| "l.", | |
| "la", | |
| "la.", | |
| "lah", | |
| "language", | |
| "languages", | |
| "lankford", | |
| "large", | |
| "let", | |
| "let's", | |
| "let\u2019s", | |
| "lif", | |
| "like", | |
| "lingual", | |
| "linguistics", | |
| "lix", | |
| "ll", | |
| "ll.", | |
| "llm", | |
| "llms", | |
| "lms", | |
| "lo.", | |
| "lopez", | |
| "lovin", | |
| "lovin'", | |
| "loving", | |
| "lovin\u2019", | |
| "low", | |
| "ltd", | |
| "ltd.", | |
| "m", | |
| "m.", | |
| "ma'am", | |
| "machine", | |
| "madam", | |
| "man", | |
| "mar", | |
| "mar.", | |
| "mass", | |
| "mass.", | |
| "may", | |
| "ma\u2019am", | |
| "md", | |
| "md.", | |
| "med", | |
| "mer", | |
| "messrs", | |
| "messrs.", | |
| "miah", | |
| "mic", | |
| "mich", | |
| "mich.", | |
| "might", | |
| "minn", | |
| "minn.", | |
| "miss", | |
| "miss.", | |
| "mo", | |
| "mo.", | |
| "models", | |
| "moghe", | |
| "mohammed", | |
| "mohsen", | |
| "mont", | |
| "mont.", | |
| "moorkens", | |
| "mr", | |
| "mr.", | |
| "mrs", | |
| "mrs.", | |
| "ms", | |
| "ms.", | |
| "mt", | |
| "mt.", | |
| "multilingual", | |
| "multimodal", | |
| "mus", | |
| "must", | |
| "n", | |
| "n's", | |
| "n't", | |
| "n.", | |
| "n.c.", | |
| "n.d.", | |
| "n.h.", | |
| "n.j.", | |
| "n.m.", | |
| "n.y.", | |
| "na", | |
| "nal", | |
| "nc.", | |
| "nce", | |
| "nd.", | |
| "nds", | |
| "ndy", | |
| "neb", | |
| "neb.", | |
| "nebr", | |
| "nebr.", | |
| "need", | |
| "neural", | |
| "nev", | |
| "nev.", | |
| "nge", | |
| "nikita", | |
| "nn.", | |
| "nny", | |
| "non\u2010autoregressive", | |
| "not", | |
| "nothin", | |
| "nothin'", | |
| "nothing", | |
| "nothin\u2019", | |
| "nov", | |
| "nov.", | |
| "ns.", | |
| "nt", | |
| "nt.", | |
| "nuff", | |
| "nuthin", | |
| "nuthin'", | |
| "nuthin\u2019", | |
| "n\u2019s", | |
| "n\u2019t", | |
| "o", | |
| "o'clock", | |
| "o's", | |
| "o.", | |
| "o.0", | |
| "o.O", | |
| "o.o", | |
| "o_0", | |
| "o_O", | |
| "o_o", | |
| "ock", | |
| "oct", | |
| "oct.", | |
| "ode", | |
| "oes", | |
| "of", | |
| "of.", | |
| "oin", | |
| "okla", | |
| "okla.", | |
| "ol", | |
| "ol'", | |
| "old", | |
| "olo", | |
| "ol\u2019", | |
| "on", | |
| "one", | |
| "onn", | |
| "ons", | |
| "ont", | |
| "or", | |
| "ord", | |
| "ore", | |
| "ore.", | |
| "orp", | |
| "os.", | |
| "ose", | |
| "oss", | |
| "ought", | |
| "out", | |
| "ov.", | |
| "own", | |
| "o\u2019clock", | |
| "o\u2019s", | |
| "p", | |
| "p.", | |
| "p.m", | |
| "p.m.", | |
| "pa", | |
| "pa.", | |
| "pang", | |
| "peter", | |
| "pez", | |
| "ph", | |
| "ph.d.", | |
| "playgrounds", | |
| "pm", | |
| "pr.", | |
| "procedia", | |
| "processing", | |
| "prof", | |
| "prof.", | |
| "progress", | |
| "prompting", | |
| "psycholinguistics", | |
| "pt.", | |
| "publication date", | |
| "pus", | |
| "q", | |
| "q.", | |
| "r", | |
| "r.", | |
| "ral", | |
| "rce", | |
| "rch", | |
| "re", | |
| "re.", | |
| "recognition", | |
| "rep", | |
| "rep.", | |
| "reports", | |
| "research", | |
| "resource", | |
| "rev", | |
| "rev.", | |
| "review", | |
| "revisiting", | |
| "rge", | |
| "riz", | |
| "rk.", | |
| "rof", | |
| "ros", | |
| "rp.", | |
| "rs.", | |
| "rts", | |
| "s", | |
| "s's", | |
| "s.", | |
| "s.c.", | |
| "saef", | |
| "salute", | |
| "science", | |
| "scientific", | |
| "sed", | |
| "sen", | |
| "sen.", | |
| "sentences", | |
| "sentiment", | |
| "sep", | |
| "sep.", | |
| "sept", | |
| "sept.", | |
| "sets", | |
| "sh.", | |
| "sha", | |
| "shall", | |
| "she", | |
| "she's", | |
| "she\u2019s", | |
| "shot", | |
| "should", | |
| "sic", | |
| "sis", | |
| "somethin", | |
| "somethin'", | |
| "something", | |
| "somethin\u2019", | |
| "space", | |
| "speech", | |
| "srs", | |
| "ss.", | |
| "st", | |
| "st.", | |
| "stahlberg", | |
| "statistical", | |
| "strategy", | |
| "study", | |
| "sur", | |
| "surveys", | |
| "switched", | |
| "s\u00e9amus", | |
| "s\u2019s", | |
| "t", | |
| "t's", | |
| "t.", | |
| "ta", | |
| "target", | |
| "td.", | |
| "ted", | |
| "tenn", | |
| "tenn.", | |
| "ter", | |
| "that", | |
| "that's", | |
| "that\u2019s", | |
| "the", | |
| "them", | |
| "there", | |
| "there's", | |
| "there\u2019s", | |
| "these", | |
| "they", | |
| "this", | |
| "this's", | |
| "this\u2019s", | |
| "thm", | |
| "those", | |
| "through", | |
| "thy", | |
| "to", | |
| "transactions", | |
| "transformer", | |
| "translate", | |
| "translation", | |
| "tuning", | |
| "t\u2019s", | |
| "u", | |
| "u.", | |
| "ual", | |
| "udy", | |
| "uff", | |
| "ug.", | |
| "ugh", | |
| "ul.", | |
| "uld", | |
| "ullah", | |
| "un.", | |
| "us", | |
| "use", | |
| "users", | |
| "using", | |
| "ust", | |
| "ute", | |
| "v", | |
| "v.", | |
| "v.s", | |
| "v.s.", | |
| "v.v", | |
| "v_v", | |
| "va", | |
| "va.", | |
| "ve", | |
| "vin", | |
| "vs", | |
| "vs.", | |
| "w", | |
| "w's", | |
| "w.", | |
| "w/o", | |
| "wang", | |
| "was", | |
| "wash", | |
| "wash.", | |
| "way", | |
| "we", | |
| "wei", | |
| "weihui", | |
| "were", | |
| "what", | |
| "what's", | |
| "what\u2019s", | |
| "when", | |
| "when's", | |
| "when\u2019s", | |
| "where", | |
| "where's", | |
| "where\u2019s", | |
| "who", | |
| "who's", | |
| "who\u2019s", | |
| "why", | |
| "why's", | |
| "why\u2019s", | |
| "will", | |
| "wis", | |
| "wis.", | |
| "with", | |
| "without", | |
| "wo", | |
| "would", | |
| "w\u2019s", | |
| "x", | |
| "x'", | |
| "x'x", | |
| "x'xxxx", | |
| "x.", | |
| "x.X", | |
| "x.d", | |
| "x.x", | |
| "x.x.", | |
| "x/x", | |
| "xD", | |
| "xDD", | |
| "xX", | |
| "xXX", | |
| "x_X", | |
| "x_d", | |
| "x_x", | |
| "xd", | |
| "xdd", | |
| "xdddd", | |
| "xx", | |
| "xx'", | |
| "xx'x", | |
| "xx'xx", | |
| "xx.", | |
| "xxx", | |
| "xxx'x", | |
| "xxx/xx", | |
| "xxxx", | |
| "xxxx'", | |
| "xxxx'x", | |
| "xxxx\u2019", | |
| "xxxx\u2019x", | |
| "xxx\u2010xxxx", | |
| "xxx\u2019x", | |
| "xx\u2019", | |
| "xx\u2019x", | |
| "xx\u2019xx", | |
| "x\u2019", | |
| "x\u2019x", | |
| "x\u2019xxxx", | |
| "x\ufe35x", | |
| "y", | |
| "y'", | |
| "y's", | |
| "y.", | |
| "you", | |
| "y\u2019", | |
| "y\u2019s", | |
| "z", | |
| "z.", | |
| "zen", | |
| "zero", | |
| "zhiwei", | |
| "|", | |
| "}", | |
| "\u00a0", | |
| "\u00ac", | |
| "\u00ac_\u00ac", | |
| "\u00af", | |
| "\u00af\\(x)/\u00af", | |
| "\u00af\\(\u30c4)/\u00af", | |
| "\u00b0", | |
| "\u00b0C.", | |
| "\u00b0F.", | |
| "\u00b0K.", | |
| "\u00b0X.", | |
| "\u00b0c.", | |
| "\u00b0f.", | |
| "\u00b0k.", | |
| "\u00b0x.", | |
| "\u00e4", | |
| "\u00e4.", | |
| "\u00f6", | |
| "\u00f6.", | |
| "\u00fc", | |
| "\u00fc.", | |
| "\u0ca0", | |
| "\u0ca0_\u0ca0", | |
| "\u0ca0\ufe35\u0ca0", | |
| "\u2014", | |
| "\u2018", | |
| "\u2018S", | |
| "\u2018X", | |
| "\u2018s", | |
| "\u2018x", | |
| "\u2019", | |
| "\u2019-(", | |
| "\u2019-)", | |
| "\u2019Cause", | |
| "\u2019Cos", | |
| "\u2019Coz", | |
| "\u2019Cuz", | |
| "\u2019S", | |
| "\u2019X", | |
| "\u2019Xxx", | |
| "\u2019Xxxxx", | |
| "\u2019am", | |
| "\u2019bout", | |
| "\u2019cause", | |
| "\u2019cos", | |
| "\u2019coz", | |
| "\u2019cuz", | |
| "\u2019d", | |
| "\u2019em", | |
| "\u2019ll", | |
| "\u2019m", | |
| "\u2019nuff", | |
| "\u2019re", | |
| "\u2019s", | |
| "\u2019ve", | |
| "\u2019x", | |
| "\u2019xx", | |
| "\u2019xxx", | |
| "\u2019xxxx", | |
| "\u2019y", | |
| "\u2019\u2019", | |
| "\u2501", | |
| "\u253b", | |
| "\u253b\u2501\u253b", | |
| "\u256f", | |
| "\u25a1", | |
| "\ufe35", | |
| "\uff09" | |
| ] |