Spaces:
Sleeping
Sleeping
Update replaceWords.py
Browse files- replaceWords.py +141 -153
replaceWords.py
CHANGED
|
@@ -1,153 +1,141 @@
|
|
| 1 |
-
|
| 2 |
-
|
| 3 |
-
|
| 4 |
-
#
|
| 5 |
-
|
| 6 |
-
|
| 7 |
-
|
| 8 |
-
|
| 9 |
-
|
| 10 |
-
|
| 11 |
-
'
|
| 12 |
-
'
|
| 13 |
-
'
|
| 14 |
-
'
|
| 15 |
-
'
|
| 16 |
-
|
| 17 |
-
|
| 18 |
-
'
|
| 19 |
-
'
|
| 20 |
-
'
|
| 21 |
-
|
| 22 |
-
|
| 23 |
-
'
|
| 24 |
-
'
|
| 25 |
-
'
|
| 26 |
-
'
|
| 27 |
-
|
| 28 |
-
|
| 29 |
-
'
|
| 30 |
-
'
|
| 31 |
-
'
|
| 32 |
-
|
| 33 |
-
|
| 34 |
-
'
|
| 35 |
-
'
|
| 36 |
-
'
|
| 37 |
-
|
| 38 |
-
|
| 39 |
-
'
|
| 40 |
-
'
|
| 41 |
-
'
|
| 42 |
-
|
| 43 |
-
|
| 44 |
-
'twenty
|
| 45 |
-
'twenty
|
| 46 |
-
'twenty
|
| 47 |
-
'twenty
|
| 48 |
-
|
| 49 |
-
|
| 50 |
-
'
|
| 51 |
-
'
|
| 52 |
-
'
|
| 53 |
-
|
| 54 |
-
|
| 55 |
-
'thirty
|
| 56 |
-
'thirty
|
| 57 |
-
'thirty
|
| 58 |
-
'thirty
|
| 59 |
-
|
| 60 |
-
|
| 61 |
-
'
|
| 62 |
-
'
|
| 63 |
-
'
|
| 64 |
-
|
| 65 |
-
|
| 66 |
-
'forty
|
| 67 |
-
'forty
|
| 68 |
-
'forty
|
| 69 |
-
'forty
|
| 70 |
-
|
| 71 |
-
|
| 72 |
-
'
|
| 73 |
-
'
|
| 74 |
-
'
|
| 75 |
-
|
| 76 |
-
|
| 77 |
-
'fifty
|
| 78 |
-
'fifty
|
| 79 |
-
'fifty
|
| 80 |
-
'fifty
|
| 81 |
-
|
| 82 |
-
|
| 83 |
-
'
|
| 84 |
-
'
|
| 85 |
-
'
|
| 86 |
-
|
| 87 |
-
|
| 88 |
-
'sixty
|
| 89 |
-
'sixty
|
| 90 |
-
'sixty
|
| 91 |
-
'sixty
|
| 92 |
-
|
| 93 |
-
|
| 94 |
-
'
|
| 95 |
-
'
|
| 96 |
-
'
|
| 97 |
-
|
| 98 |
-
|
| 99 |
-
'seventy
|
| 100 |
-
'seventy
|
| 101 |
-
'seventy
|
| 102 |
-
'seventy
|
| 103 |
-
|
| 104 |
-
|
| 105 |
-
'
|
| 106 |
-
'
|
| 107 |
-
'
|
| 108 |
-
|
| 109 |
-
|
| 110 |
-
'eighty
|
| 111 |
-
'eighty
|
| 112 |
-
'eighty
|
| 113 |
-
'eighty
|
| 114 |
-
|
| 115 |
-
|
| 116 |
-
'
|
| 117 |
-
'
|
| 118 |
-
'
|
| 119 |
-
|
| 120 |
-
|
| 121 |
-
'ninety
|
| 122 |
-
'ninety
|
| 123 |
-
'ninety
|
| 124 |
-
'ninety
|
| 125 |
-
|
| 126 |
-
|
| 127 |
-
'
|
| 128 |
-
|
| 129 |
-
'
|
| 130 |
-
|
| 131 |
-
|
| 132 |
-
|
| 133 |
-
|
| 134 |
-
|
| 135 |
-
|
| 136 |
-
|
| 137 |
-
|
| 138 |
-
|
| 139 |
-
|
| 140 |
-
|
| 141 |
-
|
| 142 |
-
if word in patterns:
|
| 143 |
-
words[i] = replacement # Replace the word if it's fully matched
|
| 144 |
-
|
| 145 |
-
# Join the processed words back into a sentence
|
| 146 |
-
return ' '.join(words)
|
| 147 |
-
|
| 148 |
-
|
| 149 |
-
# In[ ]:
|
| 150 |
-
|
| 151 |
-
|
| 152 |
-
|
| 153 |
-
|
|
|
|
| 1 |
+
import re
|
| 2 |
+
def replace_words(sentence):
|
| 3 |
+
replacement_map = {
|
| 4 |
+
# Single digits
|
| 5 |
+
'zero':['பூஜ்யம்','சுழியம்'],
|
| 6 |
+
'one': ['ஒன்று', 'ஒன்னு', 'ஒன்'],
|
| 7 |
+
'two': ['இரண்டு', 'ரெண்டு', 'டூ'],
|
| 8 |
+
'three': ['மூன்று', 'முன்னு', 'த்ரீ'],
|
| 9 |
+
'four': ['நான்கு', 'நாலு', 'ஃபோர்'],
|
| 10 |
+
'five': ['ஐந்து', 'அஞ்சு', 'ஃபைவ்'],
|
| 11 |
+
'six': ['ஆறு', 'ஆறு', 'சிக்ஸ்'],
|
| 12 |
+
'seven': ['ஏழு', 'எழு', 'செவன்'],
|
| 13 |
+
'eight': ['எட்டு', 'எட்டு', 'எய்ட்'],
|
| 14 |
+
'nine': ['ஒன்பது', 'ஒம்பது', 'நைன்'],
|
| 15 |
+
'ten': ['பத்து', 'பத்து', 'டென'],
|
| 16 |
+
|
| 17 |
+
# Numbers from 11 to 19
|
| 18 |
+
'eleven': ['பதினொன்று', 'பதினொன்னு', 'எலெவன்'],
|
| 19 |
+
'twelve': ['பன்னிரண்டு', 'பன்னிரண்டு', 'ட்வெ���்வ்'],
|
| 20 |
+
'thirteen': ['பதின்மூன்று', 'பதின்முன்னு', 'தர்டீன்'],
|
| 21 |
+
'fourteen': ['பதினான்கு', 'பதின்நாலு', 'ஃபோர்டீன்'],
|
| 22 |
+
'fifteen': ['பதினைந்து', 'பதினஞ்சு', 'ஃபிப்டீன்'],
|
| 23 |
+
'sixteen': ['பதினாறு', 'பதினாறோ', 'சிக்ஸ்டீன்'],
|
| 24 |
+
'seventeen': ['பதினேழு', 'பதினேழு', 'செவன்டீன்'],
|
| 25 |
+
'eighteen': ['பதினெட்டு', 'பதினெட்டு', 'ஏட்டீன்'],
|
| 26 |
+
'nineteen': ['பத்தொன்பது', 'பத்தொம்பது', 'நைன்டீன்'],
|
| 27 |
+
|
| 28 |
+
# Multiples of ten
|
| 29 |
+
'twenty': ['இருபது', 'இருபத்து', 'ட்வென்டி'],
|
| 30 |
+
'thirty': ['முப்பது', 'முப்பத்து', 'தர்டி'],
|
| 31 |
+
'forty': ['நாற்பது', 'நாற்பத்து', 'ஃபோர்டி'],
|
| 32 |
+
'fifty': ['ஐம்பது', 'ஐம்பத்து', 'ஃபிப்டி'],
|
| 33 |
+
'sixty': ['அறுபது', 'அறுபத்து', 'சிக்ஸ்டி'],
|
| 34 |
+
'seventy': ['எழுபது', 'எழுபத்து', 'செவன்டி'],
|
| 35 |
+
'eighty': ['எண்பது', 'எண்பத்து', 'ஏட்டி'],
|
| 36 |
+
'ninety': ['தொண்ணூறு', 'தொன்னூறு', 'நைன்டி'],
|
| 37 |
+
|
| 38 |
+
# Numbers from 21 to 29
|
| 39 |
+
'twenty one': ['இருபத்து ஒன்று', 'இருபத்தொன்று', 'ட்வென்டி ஒன்'],
|
| 40 |
+
'twenty two': ['இருபத்து இரண்டு', 'இருபத்திரண்டு', 'ட்வென்டி டூ'],
|
| 41 |
+
'twenty three': ['இருபத்து மூன்று', 'இருபத்துமூன்று', 'ட்வென்டி த்ரீ'],
|
| 42 |
+
'twenty four': ['இருபத்து நான்கு', 'இருபத்துநான்கு', 'ட்வென்டி ஃபோர்'],
|
| 43 |
+
'twenty five': ['இருபத்து ஐந்து', 'இருபத்துஐந்து', 'ட்வென்டி ஃபைவ்'],
|
| 44 |
+
'twenty six': ['இருபத்து ஆறு', 'இருபத்துஆறு', 'ட்வென்டி சிக்ஸ்'],
|
| 45 |
+
'twenty seven': ['இருபத்து ஏழு', 'இருபத்துஏழு', 'ட்வென்டி செவன்'],
|
| 46 |
+
'twenty eight': ['இருபத்து எட்டு', 'இருபத்துஎட்டு', 'ட்வென்டி ஏட்'],
|
| 47 |
+
'twenty nine': ['இருபத்து ஒன்பது', 'இருபத்தொன்பது', 'ட்வென்டி நைன்'],
|
| 48 |
+
|
| 49 |
+
# Numbers from 31 to 39
|
| 50 |
+
'thirty one': ['முப்பத்து ஒன்று', 'முப்பத்தொன்று', 'தர்டி ஒன்'],
|
| 51 |
+
'thirty two': ['முப்பத்து இரண்டு', 'முப்பத்திரண்டு', 'தர்டி டூ'],
|
| 52 |
+
'thirty three': ['முப்பத்து மூன்று', 'முப்பத்துமூன்று', 'தர்டி த்ரீ'],
|
| 53 |
+
'thirty four': ['முப்பத்து நான்கு', 'முப்பத்துநான்கு', 'தர்டி ஃபோர்'],
|
| 54 |
+
'thirty five': ['முப்பத்து ஐந்து', 'முப்பத்துஐந்து', 'தர்டி ஃபைவ்'],
|
| 55 |
+
'thirty six': ['முப்பத்து ஆறு', 'முப்பத்துஆறு', 'தர்டி சிக்ஸ்'],
|
| 56 |
+
'thirty seven': ['முப்பத்து ஏழு', 'முப்பத்துஏழு', 'தர்டி செவன்'],
|
| 57 |
+
'thirty eight': ['முப்பத்து எட்டு', 'முப்பத்துஎட்டு', 'தர்டி ஏட்'],
|
| 58 |
+
'thirty nine': ['முப்பத்து ஒன்பது', 'முப்பத்தொன்பது', 'தர்டி நைன்'],
|
| 59 |
+
|
| 60 |
+
# Numbers from 41 to 49
|
| 61 |
+
'forty one': ['நாற்பத்து ஒன்று', 'நாற்பத்தொன்று', 'ஃபோர்டி ஒன்'],
|
| 62 |
+
'forty two': ['நாற்பத்து இரண்டு', 'நாற்பத்திரண்டு', 'ஃபோர்டி டூ'],
|
| 63 |
+
'forty three': ['நாற்பத்து மூன்று', 'நாற்பத்துமூன்று', 'ஃபோர்டி த்ரீ'],
|
| 64 |
+
'forty four': ['நாற்பத்து நான்கு', 'நாற்பத்துநான்கு', 'ஃபோர்டி ஃபோர்'],
|
| 65 |
+
'forty five': ['நாற்பத்து ஐந்து', 'நாற்பத்துஐந்து', 'ஃபோர்டி ஃபைவ்'],
|
| 66 |
+
'forty six': ['நாற்பத்து ஆ���ு', 'நாற்பத்துஆறு', 'ஃபோர்டி சிக்ஸ்'],
|
| 67 |
+
'forty seven': ['நாற்பத்து ஏழு', 'நாற்பத்துஏழு', 'ஃபோர்டி செவன்'],
|
| 68 |
+
'forty eight': ['நாற்பத்து எட்டு', 'நாற்பத்துஎட்டு', 'ஃபோர்டி ஏட்'],
|
| 69 |
+
'forty nine': ['நாற்பத்து ஒன்பது', 'நாற்பத்தொன்பது', 'ஃபோர்டி நைன்'],
|
| 70 |
+
|
| 71 |
+
# Numbers from 51 to 59
|
| 72 |
+
'fifty one': ['ஐம்பத்து ஒன்று', 'ஐம்பத்தொன்று', 'ஃபிப்டி ஒன்'],
|
| 73 |
+
'fifty two': ['ஐம்பத்து இரண்டு', 'ஐம்பத்திரண்டு', 'ஃபிப்டி டூ'],
|
| 74 |
+
'fifty three': ['ஐம்பத்து மூன்று', 'ஐம்பத்துமூன்று', 'ஃபிப்டி த்ரீ'],
|
| 75 |
+
'fifty four': ['ஐம்பத்து நான்கு', 'ஐம்பத்துநான்கு', 'ஃபிப்டி ஃபோர்'],
|
| 76 |
+
'fifty five': ['ஐம்பத்து ஐந்து', 'ஐம்பத்துஐந்து', 'ஃபிப்டி ஃபைவ்'],
|
| 77 |
+
'fifty six': ['ஐம்பத்து ஆறு', 'ஐம்பத்துஆறு', 'ஃபிப்டி சிக்ஸ்'],
|
| 78 |
+
'fifty seven': ['ஐம்பத்து ஏழு', 'ஐம்பத்துஏழு', 'ஃபிப்டி செவன்'],
|
| 79 |
+
'fifty eight': ['ஐம்பத்து எட்டு', 'ஐம்பத்துஎட்டு', 'ஃபிப்டி ஏட்'],
|
| 80 |
+
'fifty nine': ['ஐம்பத்து ஒன்பது', 'ஐம்பத்தொன்பது', 'ஃபிப்டி நைன்'],
|
| 81 |
+
|
| 82 |
+
# Numbers from 61 to 69
|
| 83 |
+
'sixty one': ['அறுபத்து ஒன்று', 'அறுபத்தொன்று', 'சிக்ஸ்டி ஒன்'],
|
| 84 |
+
'sixty two': ['அறுபத்து இரண்டு', 'அறுபத்திரண்டு', 'சிக்ஸ்டி டூ'],
|
| 85 |
+
'sixty three': ['அறுபத்து மூன்று', 'அறுபத்துமூன்று', 'சிக்ஸ்டி த்ரீ'],
|
| 86 |
+
'sixty four': ['அறுபத்து நான்கு', 'அறுபத்துநான்கு', 'சிக்ஸ்டி ஃபோர்'],
|
| 87 |
+
'sixty five': ['அறுபத்து ஐந்து', 'அறுபத்துஐந்து', 'சிக்ஸ்டி ஃபைவ்'],
|
| 88 |
+
'sixty six': ['அறுபத்து ஆறு', 'அறுபத்துஆறு', 'சிக்ஸ்டி சிக்ஸ்'],
|
| 89 |
+
'sixty seven': ['அறுபத்து ஏழு', 'அறுபத்துஏழு', 'சிக்ஸ்டி செவன்'],
|
| 90 |
+
'sixty eight': ['அறுபத்து எட்டு', 'அறுபத்துஎட்டு', 'சிக்ஸ்டி ஏட்'],
|
| 91 |
+
'sixty nine': ['அறுபத்து ஒன்பது', 'அறுபத்தொன்பது', 'சிக்ஸ்டி நைன்'],
|
| 92 |
+
|
| 93 |
+
# Numbers from 71 to 79
|
| 94 |
+
'seventy one': ['எழுபத்து ஒன்று', 'எழுபத்தொன்று', 'செவன்டி ஒன்'],
|
| 95 |
+
'seventy two': ['எழுபத்து இரண்டு', 'எழுபத்திரண்டு', 'செவன்டி டூ'],
|
| 96 |
+
'seventy three': ['எழுபத்து மூன்று', 'எழுபத்துமூன்று', 'செவன்டி த்ரீ'],
|
| 97 |
+
'seventy four': ['எழுபத்து நான்கு', 'எழுபத்துநான்கு', 'செவன்டி ஃபோர்'],
|
| 98 |
+
'seventy five': ['எழுபத்து ஐந்து', 'எழுபத்துஐந்து', 'செவன்டி ஃபைவ்'],
|
| 99 |
+
'seventy six': ['எழுபத்து ஆறு', 'எழுபத்துஆறு', 'செவன்டி சிக்ஸ்'],
|
| 100 |
+
'seventy seven': ['எழுபத்து ஏழு', 'எழுபத்துஏழு', 'செவன்டி செவன்'],
|
| 101 |
+
'seventy eight': ['எழுபத்து எட்டு', 'எழுபத்துஎட்டு', 'செவன்டி ஏட்'],
|
| 102 |
+
'seventy nine': ['எழுபத்து ஒன்பது', 'எழுபத்தொன்பது', 'செவன்டி நைன்'],
|
| 103 |
+
|
| 104 |
+
# Numbers from 81 to 89
|
| 105 |
+
'eighty one': ['எண்பத்து ஒன்று', 'எண்பத்தொன்று', 'ஏட்டி ஒன்'],
|
| 106 |
+
'eighty two': ['எண்பத்து இரண்டு', 'எண்பத்திரண்டு', 'ஏட்டி டூ'],
|
| 107 |
+
'eighty three': ['எண்பத்து மூன்று', 'எண்பத்துமூன்று', 'ஏட்டி த்ரீ'],
|
| 108 |
+
'eighty four': ['எண்பத்து நான��கு', 'எண்பத்துநான்கு', 'ஏட்டி ஃபோர்'],
|
| 109 |
+
'eighty five': ['எண்பத்து ஐந்து', 'எண்பத்துஐந்து', 'ஏட்டி ஃபைவ்'],
|
| 110 |
+
'eighty six': ['எண்பத்து ஆறு', 'எண்பத்துஆறு', 'ஏட்டி சிக்ஸ்'],
|
| 111 |
+
'eighty seven': ['எண்பத்து ஏழு', 'எண்பத்துஏழு', 'ஏட்டி செவன்'],
|
| 112 |
+
'eighty eight': ['எண்பத்து எட்டு', 'எண்பத்துஎட்டு', 'ஏட்டி ஏட்'],
|
| 113 |
+
'eighty nine': ['எண்பத்து ஒன்பது', 'எண்பத்தொன்பது', 'ஏட்டி நைன்'],
|
| 114 |
+
|
| 115 |
+
# Numbers from 91 to 99
|
| 116 |
+
'ninety one': ['தொண்ணூற்று ஒன்று', 'தொண்ணூற்றொன்று', 'நைன்டி ஒன்'],
|
| 117 |
+
'ninety two': ['தொண்ணூற்று இரண்டு', 'தொண்ணூற்றிரண்டு', 'நைன்டி டூ'],
|
| 118 |
+
'ninety three': ['தொண்ணூற்று மூன்று', 'தொண்ணூற்றுமூன்று', 'நைன்டி த்ரீ'],
|
| 119 |
+
'ninety four': ['தொண்ணூற்று நான்கு', 'தொண்ணூற்றுநான்கு', 'நைன்டி ஃபோர்'],
|
| 120 |
+
'ninety five': ['தொண்ணூற்று ஐந்து', 'தொண்ணூற்றுஐந்து', 'நைன்டி ஃபைவ்'],
|
| 121 |
+
'ninety six': ['தொண்ணூற்று ஆறு', 'தொண்ணூற்றுஆறு', 'நைன்டி சிக்ஸ்'],
|
| 122 |
+
'ninety seven': ['தொண்ணூற்று ஏழு', 'தொண்ணூற்றுஏழு', 'நைன்டி செவன்'],
|
| 123 |
+
'ninety eight': ['தொண்ணூற்று எட்டு', 'தொண்ணூற்றுஎட்டு', 'நைன்டி ஏட்'],
|
| 124 |
+
'ninety nine': ['தொண்ணூற்று ஒன்பது', 'தொண்ணூற்றொன்பது', 'நைன்டி நைன்'],
|
| 125 |
+
|
| 126 |
+
# Hundred
|
| 127 |
+
'hundred': ['நூறு', 'நூறை', 'ஹண்ட்ரெட்'],
|
| 128 |
+
# Thousand
|
| 129 |
+
'thousand': ['ஆயிரம்'],
|
| 130 |
+
}
|
| 131 |
+
|
| 132 |
+
words = sentence.split() # Split the sentence by spaces
|
| 133 |
+
|
| 134 |
+
# Replace words using the mapping
|
| 135 |
+
for i, word in enumerate(words):
|
| 136 |
+
for replacement, patterns in replacement_map.items():
|
| 137 |
+
if word in patterns:
|
| 138 |
+
words[i] = replacement # Replace the word if it's fully matched
|
| 139 |
+
|
| 140 |
+
# Join the processed words back into a sentence
|
| 141 |
+
return ' '.join(words)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|