utkarsh2299 commited on
Commit
7e2037e
·
verified ·
1 Parent(s): 1779ec9

Upload 31 files

Browse files
charmap/Text_Cleaning.ipynb ADDED
@@ -0,0 +1,332 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cells": [
3
+ {
4
+ "cell_type": "code",
5
+ "execution_count": 2,
6
+ "metadata": {
7
+ "collapsed": true
8
+ },
9
+ "outputs": [],
10
+ "source": [
11
+ "############################################################\n",
12
+ "#Author : Bhagyashree\n",
13
+ "#Date : 1st Sept, 2020\n",
14
+ "#Purpose : Text Cleaning\n",
15
+ "#Input : Text file after timestamp removal\n",
16
+ "#Output : Text file after cleaning data\n",
17
+ "############################################################"
18
+ ]
19
+ },
20
+ {
21
+ "cell_type": "code",
22
+ "execution_count": 3,
23
+ "metadata": {
24
+ "collapsed": true
25
+ },
26
+ "outputs": [],
27
+ "source": [
28
+ "import nltk\n",
29
+ "import numpy\n",
30
+ "import xlrd\n",
31
+ "import openpyxl \n",
32
+ "import re"
33
+ ]
34
+ },
35
+ {
36
+ "cell_type": "code",
37
+ "execution_count": 21,
38
+ "metadata": {},
39
+ "outputs": [
40
+ {
41
+ "name": "stdout",
42
+ "output_type": "stream",
43
+ "text": [
44
+ "अब हम ऑलट्रेशन ऑफ मेमोरेंडम के बारे में बात करेंगे।\n",
45
+ " मेमोरेंडम के विषयों को बदल दिया जा सकता है।\n",
46
+ "कंपनी अधिनियम 1956 के तहत\n",
47
+ "निम्नलिखित प्रक्रिया के अनुसार\n",
48
+ "यदि कोई कंपनी अपना नाम बदलना चाहती है,\n",
49
+ "तो वे विशेष संकल्प में ऐसा कर सकती है।\n",
50
+ "और केंद्र सरकार की मंजूरी के साथ\n",
51
+ "लिखित में\n",
52
+ "हालाँकि, ऐसी किसी भी मंजूरी की आवश्यकता नहीं होती है\n",
53
+ "केवल कंपनी के नाम में परिवर्तन के लिए\n",
54
+ "बल्कि यह प्रक्रिया\n",
55
+ "पूरी तरह से निजी शब्द को हटाने के लिए होती है।\n",
56
+ "तो इस मामले में\n",
57
+ "एक सार्वजनिक कंपनी को एक निजी कंपनी के संबंध में,\n",
58
+ "या एक निजी कंपनी को एक सार्वजनिक कंपनी में परिवर्तित करने\n",
59
+ "दूसरी जगह पर पंजीकृत कार्यालय का दोबारा परिवर्तन किया जाना है\n",
60
+ "अगर एक ही शहर, कस्बे\n",
61
+ "या गाँव में एक जगह से\n",
62
+ "30 दिनों का नोटिस दिया जाना होता है।\n",
63
+ "यह रजिस्ट्रार द्वारा परिवर्तन की तिथि के बाद\n",
64
+ "होगा जो उसी को दर्ज करेगा।\n",
65
+ "पंजीकृत कार्यालय के परिवर्तन के मामले में\n",
66
+ "जबकि एक ही राज्य में 1 शहर से दूसरे शहर में,\n",
67
+ "विशेष प्रस्ताव पारित किया जाना आवश्यक है।\n",
68
+ "शेयरधारकों की आम बैठक में\n",
69
+ "और इसकी एक प्रति रजिस्ट्रार के पास कार्यालय को\n",
70
+ "30 दिनों के भीतर बदलने के दाखिल करनी होगी।\n",
71
+ "नोटिस देना होगा।\n",
72
+ "रजिस्ट्रार को कार्यालय के नये पते का\n",
73
+ "तब तक परिवर्तन प्रभावी नहीं होगा।\n",
74
+ "जब तक केंद्र सरकार द्वारा प्रस्ताव की पुष्टि नहीं हो जाती\n",
75
+ "कंपनी किसी भी आधार पर\n",
76
+ "उपधारा 1 से\n",
77
+ "उपधारा 7 में धारा 17 तक उल्लेखित है।\n",
78
+ "जैसा कि अधिनियम के बाद ही परिवर्तन प्रभावी होगा।\n",
79
+ "अपने उद्देश्यों में बदलाव कर सकती है\n",
80
+ "सामान्य बैठक में सदस्यों द्वारा\n",
81
+ "कंपनी संशोधन अधिनियम 1996 को मेमोरेंडम ऑफ एसोसिएशन के\n",
82
+ "केंद्र सरकार के प्रतिबंध के ��ाथ समाप्त कर दिया गया है।\n",
83
+ "विशेष संकल्प के अनुरूप अनुमोदित किए जाने\n",
84
+ "ऑब्जेक्ट क्लॉज में परिवर्तन के प्रति शेयर पूंजी में\n",
85
+ "परिवर्तन की प्रक्रिया और ऐसे परिवर्तन करने के अधिकार।\n",
86
+ "समान्य पहलु को आर्टीकल ऑफ एसोसिएशन में रखा गया है।\n",
87
+ "यदि संबंधित विषय के\n",
88
+ " आर्टीकल ऑफ एसोसिएशन में पीछे की प्रक्रिया नहीं दी गई है।\n",
89
+ "कंपनी को पारित करके आर्टीकल ऑफ एसोसिएशन को बदलना होगा।\n",
90
+ "एक विशेष प्रस्ताव\n",
91
+ "अब, हम ऑलट्रेशन ऑफ पर चर्चा करेंगे।\n",
92
+ "कंपनी अधिनियम 2013 के तहत मेमोरेंडम\n",
93
+ "अधिनियम की धारा 16, 17, 18, 19,\n",
94
+ "1956 के कंपनी 21, 23 और 37 के अनुरूप।\n",
95
+ "कंपनी अधिनियम, 2013 की धारा 13 ने\n",
96
+ " ऑलट्रेशन ऑफ मेमोरेंडम के लिए मानदंड निर्धारित किए हैं।\n",
97
+ "यह वही वर्णन करता है कि जैसा कि धारा 61 में दिया गया है।\n",
98
+ "एक कंपनी विशेष संकल्प द्वारा\n",
99
+ "और प्रावधानों को बदल सकती है।\n",
100
+ "निर्दिष्ट प्रक्रिया के अनुपालन से मेमोरेंडम\n",
101
+ "नाम खंड के परिवर्तन के संबंध में,\n",
102
+ "कंपनी अपना नाम बदल सकती है।\n",
103
+ "अनुमोदन के बाद लिखित रूप में केंद्र सरकार द्वारा\n",
104
+ "इसलिए जब कंपनी के नाम में कोई बदलाव किया जाता है,\n",
105
+ "रजिस्टर में दर्ज करेगा।\n",
106
+ " तो रजिस्ट्रार कंपनी के नया नाम\n",
107
+ "पुराने नाम के स्थान पर\n",
108
+ "निगमन का एक नया प्रमाणपत्र जारी करेगा।\n",
109
+ "कंपनी के पंजीकृत कार्यालय के बारे में\n",
110
+ "जैसा कि पहले उल्लेख किया गया है,\n",
111
+ "तब तक कोई प्रभाव नहीं पड़ेगा जब तक कि वह केंद्र सरकार द्वारा अनुमोदित नहीं हो जाता।\n",
112
+ "ऑब्जेक्ट क्लॉज के किसी भी परिवर्तन के संबंध में,\n",
113
+ "किसी कंपनी के मेमोरेंडम के\n",
114
+ "रजिस्ट्रार को दाखिल करने की\n",
115
+ "30 दिनों की अवधि के भीतर\n",
116
+ "तारीख से पंजीकरण को प्रमाणित करना होता है।\n",
117
+ "इस विशेष प्रस्ताव खंड के उप खंड 6 के खंड A के अनुसार\n",
118
+ "चलिए फिर से संक्षेप में\n",
119
+ " ऑलट्रेशन ऑफ मेमोरेंडम के महत्व के बारे में चर्चा करते हैं\n",
120
+ " क्योंकि ये इस मॉड्यूल के अध्ययन का एक बहुत महत्वपूर्ण हिस्सा है।\n",
121
+ "पहला महत्व यह है\n",
122
+ "कि यह एक बहुत ही आवश्यक दस्तावेज है।\n",
123
+ "एक कंपनी के निगमन के लिए\n",
124
+ "दूसरा, यह कंपनी के पंजीकृत कार्यालय को निर्दिष्ट करते हुए\n",
125
+ "रजिस्ट्रार और अदालत के अधिकार क्षेत्र को निर्धारित करता है।\n",
126
+ "तीसरा, यह कंपनी के अधिकारों में उद्देश्यों को\n",
127
+ "जनता की जानकारी के लिए दर्ज करता है।\n",
128
+ "अगला, यह कंपनी को केवल उन कृत्यों को करने के लिए\n",
129
+ "बाध्य करता है जो कंपनी के ऑब्जेक्ट क्लॉज में शामिल हैं।\n",
130
+ "यह कंपनी की अधिकृत कैपिटल\n",
131
+ "और उसके विभाजन को निश्चित राशि के शेयरों में निर्दिष्ट करता है।\n",
132
+ "पर प्रकाश डालता है।\n",
133
+ "यह कंपनी के सदस्यों के लायबिलिटी\n",
134
+ "अंत में, संघ के नियमों को\n",
135
+ "यह एक कंपनी के भी नियंत्रित करता है।\n"
136
+ ]
137
+ }
138
+ ],
139
+ "source": [
140
+ "file1 = open(\"recent_deliverables_dec2020/Corporate_Law/Hindi/ankita objects 02_Hindi_new.txt\",\"r+\",encoding='utf-8') \n",
141
+ "data = file1.read()\n",
142
+ "print(data)\n",
143
+ "file1.close()"
144
+ ]
145
+ },
146
+ {
147
+ "cell_type": "code",
148
+ "execution_count": 22,
149
+ "metadata": {},
150
+ "outputs": [
151
+ {
152
+ "name": "stdout",
153
+ "output_type": "stream",
154
+ "text": [
155
+ "अब हम ऑलट्रेशन ऑफ मेमोरेंडम के बारे में बात करेंगे\n",
156
+ " मेमोरेंडम के विषयों को बदल दिया जा सकता है\n",
157
+ "कंपनी अधिनियम वन नाइन फाइव सिक्स के तहत\n",
158
+ "निम्नलिखित प्रक्रिया के अनुसार\n",
159
+ "यदि कोई कंपनी अपना नाम बदलना चाहती है\n",
160
+ "तो वे विशेष संकल्प में ऐसा कर सकती है\n",
161
+ "और केंद्र सरकार की मंजूरी के साथ\n",
162
+ "लिखित में\n",
163
+ "हालाँकि ऐसी किसी भी मंजूरी की आवश्यकता नहीं होती है\n",
164
+ "केवल कंपनी के नाम में परिवर्तन के लिए\n",
165
+ "बल्कि यह प्रक्रिया\n",
166
+ "पूरी तरह से निजी शब्द को हटाने के लिए होती है\n",
167
+ "तो इस मामले में\n",
168
+ "एक सार्वजनिक कंपनी को एक निजी कंपनी के संबंध में\n",
169
+ "या एक निजी कंपनी को एक सार्वजनिक कंपनी में परिवर्तित करने\n",
170
+ "दूसरी जगह पर पंजीकृत कार्यालय का दोबारा परिवर्तन किया जाना है\n",
171
+ "अगर एक ही शहर कस्बे\n",
172
+ "या गाँव में एक जगह से\n",
173
+ " थ्री ज़ीरो दिनों का नोटिस दिया जाना होता है\n",
174
+ "यह रजिस्ट्रार द्वारा परिवर्तन की तिथि के बाद\n",
175
+ "होगा जो उसी को दर्ज करेगा\n",
176
+ "पंजीकृत कार्यालय के परिवर्तन के मामले में\n",
177
+ "जबकि एक ही राज्य में वन शहर से दूसरे शहर में\n",
178
+ "विशेष प्रस्ताव पारित किया जाना आवश्यक है\n",
179
+ "शेयरधारकों की आम बैठक में\n",
180
+ "और इसकी एक प्रति रजिस्ट्रार के पास कार्यालय को\n",
181
+ " थ्री ज़ीरो दिनों के भीतर बदलने के दाखिल करनी होगी\n",
182
+ "नोटिस देना होगा\n",
183
+ "रजिस्ट्रार को कार्यालय के नये पते का\n",
184
+ "तब तक परिवर्तन प्रभावी नहीं होगा\n",
185
+ "जब तक केंद्र सरकार द्वारा प्रस्ताव की पुष्टि नहीं हो जाती\n",
186
+ "कंपनी किसी भी आधार पर\n",
187
+ "उपधारा वन से\n",
188
+ "उपधारा सेवेन में ध���रा वन सेवेन तक उल्लेखित है\n",
189
+ "जैसा कि अधिनियम के बाद ही परिवर्तन प्रभावी होगा\n",
190
+ "अपने उद्देश्यों में बदलाव कर सकती है\n",
191
+ "सामान्य बैठक में सदस्यों द्वारा\n",
192
+ "कंपनी संशोधन अधिनियम वन नाइन नाइन सिक्स को मेमोरेंडम ऑफ एसोसिएशन के\n",
193
+ "केंद्र सरकार के प्रतिबंध के साथ समाप्त कर दिया गया है\n",
194
+ "विशेष संकल्प के अनुरूप अनुमोदित किए जाने\n",
195
+ "ऑब्जेक्ट क्लॉज में परिवर्तन के प्रति शेयर पूंजी में\n",
196
+ "परिवर्तन की प्रक्रिया और ऐसे परिवर्तन करने के अधिकार\n",
197
+ "समान्य पहलु को आर्टीकल ऑफ एसोसिएशन में रखा गया है\n",
198
+ "यदि संबंधित विषय के\n",
199
+ " आर्टीकल ऑफ एसोसिएशन में पीछे की प्रक्रिया नहीं दी गई है\n",
200
+ "कंपनी को पारित करके आर्टीकल ऑफ एसोसिएशन को बदलना होगा\n",
201
+ "एक विशेष प्रस्ताव\n",
202
+ "अब हम ऑलट्रेशन ऑफ पर चर्चा करेंगे\n",
203
+ "कंपनी अधिनियम टू ज़ीरो वन थ्री के तहत मेमोरेंडम\n",
204
+ "अधिनियम की धारा वन सिक्स वन सेवेन वन ऐइट वन नाइन \n",
205
+ " वन नाइन फाइव सिक्स के कंपनी टू वन टू थ्री और थ्री सेवेन के अनुरूप\n",
206
+ "कंपनी अधिनियम टू ज़ीरो वन थ्री की धारा वन थ्री ने\n",
207
+ " ऑलट्रेशन ऑफ मेमोरेंडम के लिए मानदंड निर्धारित किए हैं\n",
208
+ "यह वही वर्णन करता है कि जैसा कि धारा सिक्स वन में दिया गया है\n",
209
+ "एक कंपनी विशेष संकल्प द्वारा\n",
210
+ "और प्रावधानों को बदल सकती है\n",
211
+ "निर्दिष्ट प्रक्रिया के अनुपालन से मेमोरेंडम\n",
212
+ "नाम खंड के परिवर्तन के संबंध में\n",
213
+ "कंपनी अपना नाम बदल सकती है\n",
214
+ "अनुमोदन के बाद लिखित रूप में केंद्र सरकार द्वारा\n",
215
+ "इसलिए जब कंपनी के नाम में कोई बदलाव किया जाता है\n",
216
+ "रजिस्टर में दर्ज करेगा\n",
217
+ " तो रजिस्ट्रार कंपनी के नया नाम\n",
218
+ "पुराने नाम के स्थान पर\n",
219
+ "निगमन का एक नया प्रमाणपत्र जारी करेगा\n",
220
+ "कंपनी के पंजीकृत कार्यालय के बारे में\n",
221
+ "जैसा कि पहले उल्लेख किया गया है\n",
222
+ "तब तक कोई प्रभाव नहीं पड़ेगा जब तक कि वह केंद्र सरकार द्वारा अनुमोदित नहीं हो जाता\n",
223
+ "ऑब्जेक्ट क्लॉज के किसी भी परिवर्तन के संबंध में\n",
224
+ "किसी कंपनी के मेमोरेंडम के\n",
225
+ "रजिस्ट्रार को दाखिल करने की\n",
226
+ " थ्री ज़ीरो दिनों की अवधि के भीतर\n",
227
+ "तारीख से पंजीकरण को प्रमाणित करना होता है\n",
228
+ "इस विशेष प्रस्ताव खंड के उप खंड सिक्स के खंड ए के अनुसार\n",
229
+ "चलिए फिर से संक्ष���प में\n",
230
+ " ऑलट्रेशन ऑफ मेमोरेंडम के महत्व के बारे में चर्चा करते हैं\n",
231
+ " क्योंकि ये इस मॉड्यूल के अध्ययन का एक बहुत महत्वपूर्ण हिस्सा है\n",
232
+ "पहला महत्व यह है\n",
233
+ "कि यह एक बहुत ही आवश्यक दस्तावेज है\n",
234
+ "एक कंपनी के निगमन के लिए\n",
235
+ "दूसरा यह कंपनी के पंजीकृत कार्यालय को निर्दिष्ट करते हुए\n",
236
+ "रजिस्ट्रार और अदालत के अधिकार क्षेत्र को निर्धारित करता है\n",
237
+ "तीसरा यह कंपनी के अधिकारों में उद्देश्यों को\n",
238
+ "जनता की जानकारी के लिए दर्ज करता है\n",
239
+ "अगला यह कंपनी को केवल उन कृत्यों को करने के लिए\n",
240
+ "बाध्य करता है जो कंपनी के ऑब्जेक्ट क्लॉज में शामिल हैं\n",
241
+ "यह कंपनी की अधिकृत कैपिटल\n",
242
+ "और उसके विभाजन को निश्चित राशि के शेयरों में निर्दिष्ट करता है\n",
243
+ "पर प्रकाश डालता है\n",
244
+ "यह कंपनी के सदस्यों के लायबिलिटी\n",
245
+ "अंत में संघ के नियमों को\n",
246
+ "यह एक कंपनी के भी नियंत्रित करता है\n"
247
+ ]
248
+ }
249
+ ],
250
+ "source": [
251
+ "\n",
252
+ "wb_obj = openpyxl.load_workbook(\"charmap_v2_new.xlsx\") \n",
253
+ "sheet_obj = wb_obj.active \n",
254
+ "\n",
255
+ "#data = re.sub('[A-Z]*', '',data)\n",
256
+ "#print(data)\n",
257
+ "data = data.replace('?','')\n",
258
+ "data = data.replace(' ',' ')\n",
259
+ "data = data.replace(';','')\n",
260
+ "data = data.replace(')','')\n",
261
+ "data = data.replace('(','')\n",
262
+ "data = data.replace('!','')\n",
263
+ "data = data.replace(' – ',' ')\n",
264
+ "data = data.replace('-',' ')\n",
265
+ "data = data.replace('।','')\n",
266
+ "data = data.replace('&','')\n",
267
+ "data = data.replace('’','')\n",
268
+ "data = data.replace('‘','')\n",
269
+ "data = data.replace(':','')\n",
270
+ "data = data.replace(',','')\n",
271
+ "data = data.replace('/','')\n",
272
+ "data = data.replace(',','')\n",
273
+ "data = data.replace('.','')\n",
274
+ "data = data.replace('|','')\n",
275
+ "m_row = sheet_obj.max_row \n",
276
+ "line = data\n",
277
+ "\n",
278
+ "for i in range(1,m_row+1):\n",
279
+ " num = sheet_obj.cell(row = i, column = 1).value \n",
280
+ " word = sheet_obj.cell(row = i, column = 2).value\n",
281
+ " #print(num)\n",
282
+ " #print(word)\n",
283
+ " line = line.replace(str(num), word)\n",
284
+ "#print(line)\n",
285
+ "#' '.join(line.split())\n",
286
+ "print(line) \n",
287
+ "file1 = open(\"recent_deliverables_dec2020/Corporate_Law/Hindi/ankita objects 02_Hindi.txt\",\"w+\",encoding='utf-8') \n",
288
+ "file1.write(line)\n",
289
+ "file1.close()"
290
+ ]
291
+ },
292
+ {
293
+ "cell_type": "code",
294
+ "execution_count": null,
295
+ "metadata": {
296
+ "collapsed": true
297
+ },
298
+ "outputs": [],
299
+ "source": []
300
+ },
301
+ {
302
+ "cell_type": "code",
303
+ "execution_count": null,
304
+ "metadata": {
305
+ "collapsed": true
306
+ },
307
+ "outputs": [],
308
+ "source": []
309
+ }
310
+ ],
311
+ "metadata": {
312
+ "kernelspec": {
313
+ "display_name": "Python 3",
314
+ "language": "python",
315
+ "name": "python3"
316
+ },
317
+ "language_info": {
318
+ "codemirror_mode": {
319
+ "name": "ipython",
320
+ "version": 3
321
+ },
322
+ "file_extension": ".py",
323
+ "mimetype": "text/x-python",
324
+ "name": "python",
325
+ "nbconvert_exporter": "python",
326
+ "pygments_lexer": "ipython3",
327
+ "version": "3.6.3"
328
+ }
329
+ },
330
+ "nbformat": 4,
331
+ "nbformat_minor": 2
332
+ }
charmap/Text_Cleaning.py ADDED
@@ -0,0 +1,76 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ #!/usr/bin/env python
2
+ # coding: utf-8
3
+
4
+ # In[2]:
5
+
6
+
7
+ ############################################################
8
+ #Author : Bhagyashree
9
+ #Date : 1st Sept, 2020
10
+ #Purpose : Text Cleaning
11
+ #Input : Text file after timestamp removal
12
+ #Output : Text file after cleaning data
13
+ ############################################################
14
+
15
+
16
+ # In[3]:
17
+
18
+
19
+ import nltk
20
+ import numpy
21
+ import xlrd
22
+ import openpyxl
23
+ import re
24
+ import sys
25
+
26
+ # In[21]:
27
+
28
+ #file1 = open("recent_deliverables_dec2020/Corporate_Law/Hindi/ankita objects 02_Hindi_new.txt","r+",encoding='utf-8')
29
+ file1 = open(sys.argv[1],"r+",encoding='utf-8')
30
+ data = file1.read()
31
+ #print(data)
32
+ file1.close()
33
+
34
+
35
+ # In[22]:
36
+
37
+ wb_obj = openpyxl.load_workbook(sys.argv[2])
38
+ sheet_obj = wb_obj.active
39
+
40
+ #data = re.sub('[A-Z]*', '',data)
41
+ #print(data)
42
+ data = data.replace('?','')
43
+ data = data.replace(' ',' ')
44
+ data = data.replace(';','')
45
+ data = data.replace(')','')
46
+ data = data.replace('(','')
47
+ data = data.replace('!','')
48
+ data = data.replace(' – ',' ')
49
+ data = data.replace('-',' ')
50
+ data = data.replace('।','')
51
+ data = data.replace('&','')
52
+ data = data.replace('’','')
53
+ data = data.replace('‘','')
54
+ data = data.replace(':','')
55
+ data = data.replace(',','')
56
+ data = data.replace('/','')
57
+ data = data.replace(',','')
58
+ data = data.replace('.','')
59
+ data = data.replace('|','')
60
+ m_row = sheet_obj.max_row
61
+ line = data
62
+
63
+ for i in range(1,m_row+1):
64
+ num = sheet_obj.cell(row = i, column = 1).value
65
+ word = sheet_obj.cell(row = i, column = 2).value
66
+ #print(num)
67
+ #print(word)
68
+ line = line.replace(str(num), word)
69
+ #print(line)
70
+ #' '.join(line.split())
71
+ #print(line)
72
+ file1 = open(sys.argv[3],"w+",encoding='utf-8')
73
+ #file1 = open("recent_deliverables_dec2020/Corporate_Law/Hindi/ankita objects 02_Hindi.txt","w+",encoding='utf-8')
74
+ file1.write(line)
75
+ file1.close()
76
+
charmap/charmap_Bengali.txt ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0 জিরো
2
+ 1 ওয়ান
3
+ 2 টু
4
+ 3 থ্রী
5
+ 4 ফোর
6
+ 5 ফাইভ
7
+ 6 সিক্স
8
+ 7 সেবন
9
+ 8 এইট
10
+ 9 নাইন
11
+ A এ
12
+ a এ
13
+ B বী
14
+ b বী
15
+ C সী
16
+ c সী
17
+ D ডি
18
+ d ডি
19
+ E ই
20
+ e ই
21
+ F এফ
22
+ f এফ
23
+ G জি
24
+ g জি
25
+ H এছ
26
+ h এছ
27
+ I আই
28
+ i আই
29
+ J জে
30
+ j জে
31
+ K কে
32
+ k কে
33
+ L এল
34
+ l এল
35
+ M এম
36
+ m এম
37
+ N এন
38
+ n এন
39
+ O ও
40
+ o ও
41
+ P পি
42
+ p পি
43
+ Q ক্যু
44
+ q ক্যু
45
+ R আর
46
+ r আর
47
+ S এস
48
+ s এস
49
+ T টি
50
+ t টি
51
+ U ইউ
52
+ u ইউ
53
+ V ভি
54
+ v ভি
55
+ W ডাবলু
56
+ w ডাবলু
57
+ X এক্স
58
+ x এক্স
59
+ Y উহাই
60
+ y উহাই
61
+ Z জেডঃ
62
+ z জেডঃ
charmap/charmap_Hindi.txt ADDED
@@ -0,0 +1,81 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0 ज़ीरो
2
+ 1 वन
3
+ 2 टू
4
+ 3 थ्री
5
+ 4 फोर
6
+ 5 फाइव
7
+ 6 सिक्स
8
+ 7 सेवेन
9
+ 8 ऐइट
10
+ 9 नाइन
11
+ ० ज़ीरो
12
+ १ वन
13
+ २ टू
14
+ ३ थ्री
15
+ ४ फोर
16
+ ५ फाइव
17
+ ६ सिक्स
18
+ ७ सेवेन
19
+ ८ ऐइट
20
+ ९ नाइन
21
+ A ए
22
+ a ए
23
+ B बी
24
+ b बी
25
+ C सी
26
+ c सी
27
+ D डी
28
+ d डी
29
+ E इ
30
+ e इ
31
+ F एफ
32
+ f एफ
33
+ G जी
34
+ g जी
35
+ H एच
36
+ h एच
37
+ I आई
38
+ i आई
39
+ J जे
40
+ j जे
41
+ K के
42
+ k के
43
+ L एल
44
+ l एल
45
+ M एम
46
+ m एम
47
+ N एन
48
+ n एन
49
+ O ओ
50
+ o ओ
51
+ P पी
52
+ p पी
53
+ Q क्यू
54
+ q क्यू
55
+ R आर
56
+ r आर
57
+ S एस
58
+ s एस
59
+ T टी
60
+ t टी
61
+ U यू
62
+ u यू
63
+ V वी
64
+ v वी
65
+ W डबलु
66
+ w डबलु
67
+ X एक्स
68
+ x एक्स
69
+ Y व्हाई
70
+ y व्हाई
71
+ Z ज़ेड
72
+ z ज़ेड
73
+ α अल्फा
74
+ φ फ़ाई
75
+ + प्लस
76
+ = इक्वल
77
+ λ लैम्ब्डा
78
+ ∅ नॉट
79
+ ϕ फ़ाई
80
+ 𝝅 पाई
81
+ ⇒ इम्प्लइज
charmap/charmap_Hindi.xlsx ADDED
Binary file (10.8 kB). View file
 
charmap/charmap_Malayalam.txt ADDED
@@ -0,0 +1,81 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0 സീറോ
2
+ 1 വൺ
3
+ 2 ടു
4
+ 3 ത്രീ
5
+ 4 ഫോർ
6
+ 5 ഫൈവ്
7
+ 6 സിക്സ്
8
+ 7 സെവൻ
9
+ 8 എയ്റ്റ്
10
+ 9 നൈൻ
11
+ 0 സീറോ
12
+ 1 വൺ
13
+ 2 ടു
14
+ 3 ത്രീ
15
+ 4 ഫോർ
16
+ 5 ഫൈവ്
17
+ 6 സിക്സ്
18
+ 7 സെവൻ
19
+ 8 എയ്റ്റ്
20
+ 9 നൈൻ
21
+ A എ
22
+ a എ
23
+ B ബി
24
+ b ബി
25
+ C സി
26
+ c സി
27
+ D ഡി
28
+ d ഡി
29
+ E ഇ
30
+ e ഇ
31
+ F എഫ്
32
+ f എഫ്
33
+ G ജി
34
+ g ജി
35
+ H എഛ്
36
+ h എഛ്
37
+ I ഐ
38
+ i ഐ
39
+ J ജെ
40
+ j ജെ
41
+ K കെ
42
+ k കെ
43
+ L എൽ
44
+ l എൽ
45
+ M എം
46
+ m എം
47
+ N എൻ
48
+ n എൻ
49
+ O ഒ
50
+ o ഒ
51
+ P പി
52
+ p പി
53
+ Q ക്യു
54
+ q ക്യു
55
+ R ആർ
56
+ r ആർ
57
+ S എസ്
58
+ s എസ്
59
+ T ടി
60
+ t ടി
61
+ U യു
62
+ u യു
63
+ V വി
64
+ v വി
65
+ W ഡബ്ല്യൂ
66
+ w ഡബ്ല്യൂ
67
+ X എക്സ്
68
+ x എക്സ്
69
+ Y വൈ
70
+ y വൈ
71
+ Z സെഡ്
72
+ z സെഡ്
73
+ α ആൽഫ
74
+ φ ഫി
75
+ + പ്ലസ്
76
+ = ഈക്വൽ
77
+ λ ലാംബ്ടാ
78
+ ∅ നോട്ട്
79
+ ϕ സൈ
80
+ 𝝅 പൈ
81
+ ⇒ ഇമ്പ്ലെയ്സ്
charmap/charmap_Malayalam.xlsx ADDED
Binary file (13.1 kB). View file
 
charmap/charmap_Marathi.txt ADDED
@@ -0,0 +1,81 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0 ज़ीरो
2
+ 1 वन
3
+ 2 टू
4
+ 3 थ्री
5
+ 4 फोर
6
+ 5 फाइव
7
+ 6 सिक्स
8
+ 7 सेवेन
9
+ 8 ऐइट
10
+ 9 नाइन
11
+ ० ज़ीरो
12
+ १ वन
13
+ २ टू
14
+ ३ थ्री
15
+ ४ फोर
16
+ ५ फाइव
17
+ ६ सिक्स
18
+ ७ सेवेन
19
+ ८ ऐइट
20
+ ९ नाइन
21
+ A ए
22
+ a ए
23
+ B बी
24
+ b बी
25
+ C सी
26
+ c सी
27
+ D डी
28
+ d डी
29
+ E इ
30
+ e इ
31
+ F एफ
32
+ f एफ
33
+ G जी
34
+ g जी
35
+ H एच
36
+ h एच
37
+ I आई
38
+ i आई
39
+ J जे
40
+ j जे
41
+ K के
42
+ k के
43
+ L एल
44
+ l एल
45
+ M एम
46
+ m एम
47
+ N एन
48
+ n एन
49
+ O ओ
50
+ o ओ
51
+ P पी
52
+ p पी
53
+ Q क्यू
54
+ q क्यू
55
+ R आर
56
+ r आर
57
+ S एस
58
+ s एस
59
+ T टी
60
+ t टी
61
+ U यू
62
+ u यू
63
+ V वी
64
+ v वी
65
+ W डबलु
66
+ w डबलु
67
+ X एक्स
68
+ x एक्स
69
+ Y व्हाई
70
+ y व्हाई
71
+ Z ज़ेड
72
+ z ज़ेड
73
+ α अल्फा
74
+ φ फ़ाई
75
+ + प्लस
76
+ = इक्वल
77
+ λ लैम्ब्डा
78
+ ∅ नॉट
79
+ ϕ फ़ाई
80
+ 𝝅 पाई
81
+ ⇒ इम्प्लइज
charmap/charmap_Marathi.xlsx ADDED
Binary file (10.8 kB). View file
 
charmap/charmap_Tamil.disabled ADDED
@@ -0,0 +1,76 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0 ஸிரோ
2
+ 1 ஒன்னு
3
+ 2 டூ
4
+ 3 த்ரீ
5
+ 4 போர்
6
+ 5 பைவ்
7
+ 6 சீஸ்
8
+ 7 செவென்
9
+ 8 எயிட்
10
+ 9 நயன்
11
+ A எ
12
+ a எ
13
+ B பி
14
+ b பி
15
+ C சி
16
+ c சி
17
+ D டி
18
+ d டி
19
+ E இ
20
+ e இ
21
+ F எப்
22
+ f எப்
23
+ G ஜி
24
+ g ஜி
25
+ H ஹ்
26
+ h ஹ்
27
+ I ஐ
28
+ i ஐ
29
+ J ஜே
30
+ j ஜே
31
+ K கே
32
+ k கே
33
+ L ல்
34
+ l ல்
35
+ M ம்
36
+ m ம்
37
+ N ன்
38
+ n ன்
39
+ O ஓ
40
+ o ஓ
41
+ P பி
42
+ p பி
43
+ Q கியூ
44
+ q கியூ
45
+ R ர்
46
+ r ர்
47
+ S ஸ்
48
+ s ஸ்
49
+ T டீ
50
+ t டீ
51
+ U யூ
52
+ u யூ
53
+ V வி
54
+ v வி
55
+ W டௌபிள்யூ
56
+ w டௌபிள்யூ
57
+ X எஸ்
58
+ x எஸ்
59
+ Y யை
60
+ y யை
61
+ Z செட்
62
+ z செட்
63
+ α ஆல்பா
64
+ φ பிய்
65
+ + பிளஸ்
66
+ = ஏகுவாள்
67
+ λ லாம்டா
68
+ ∅ நோட்
69
+ ϕ பிய்
70
+ 𝝅 பை
71
+ ⇒ இம்ப்ளிஸ்
72
+ . பாயிண்ட்
73
+ % பெர்ஸண்டாஜ்
74
+ °C டிகிரிசெல்சியஸ்
75
+ θ தீட்டா
76
+ * இண்டூ
charmap/charmap_Tamil.xlsx ADDED
Binary file (11.1 kB). View file
 
charmap/charmap_Telugu.txt ADDED
@@ -0,0 +1,81 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0 జీరొ
2
+ 1 వన్
3
+ 2 టు
4
+ 3 త్రీ
5
+ 4 ఫోర్
6
+ 5 ఫైవ్
7
+ 6 సిక్స్
8
+ 7 సెవెన్
9
+ 8 ఎఇట్
10
+ 9 నైన్
11
+ ० జీరొ
12
+ १ వన్
13
+ २ టు
14
+ ३ త్రీ
15
+ ४ ఫోర్
16
+ ५ ఫైవ్
17
+ ६ సిక్స్
18
+ ७ సెవెన్
19
+ ८ ఎఇట్
20
+ ९ నైన్
21
+ A ఎ
22
+ a ఎ
23
+ B బి
24
+ b బి
25
+ C సి
26
+ c సి
27
+ D డి
28
+ d డి
29
+ E ఇ
30
+ e ఇ
31
+ F ఎఫ్
32
+ f ఎఫ్
33
+ G జి
34
+ g జి
35
+ H హెచ్
36
+ h హెచ్
37
+ I ఐ
38
+ i ఐ
39
+ J జె
40
+ j జె
41
+ K కె
42
+ k కె
43
+ L ఎల్
44
+ l ఎల్
45
+ M ఎమ్
46
+ m ఎమ్
47
+ N ఎన్
48
+ n ఎన్
49
+ O ఒ
50
+ o ఒ
51
+ P పి
52
+ p పి
53
+ Q క్యు
54
+ q క్యు
55
+ R ఆర్
56
+ r ఆర్
57
+ S ఎస్
58
+ s ఎస్
59
+ T టి
60
+ t టి
61
+ U యు
62
+ u యు
63
+ V వి
64
+ v వి
65
+ W డబ్లు
66
+ w డబ్లు
67
+ X ఎక్స్
68
+ x ఎక్స్
69
+ Y వై
70
+ y వై
71
+ Z జెడ్
72
+ z జెడ్
73
+ α ఆల్ఫ
74
+ φ ఫై
75
+ + ప్లస్
76
+ = ఈక్వల్
77
+ λ లామ్బ్డ
78
+ ∅ నల్
79
+ ϕ ఫై
80
+ 𝝅 పై
81
+ ⇒ ఇమ్ప్లైస్
charmap/charmap_Telugu.xlsx ADDED
Binary file (10 kB). View file
 
dogri_latest/female/model/config.yaml ADDED
@@ -0,0 +1,320 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 8
2
+ adapter: lora
3
+ adapter_conf: {}
4
+ allow_multi_rates: false
5
+ allow_variable_data_keys: false
6
+ batch_bins: 3000000
7
+ batch_size: 20
8
+ batch_type: numel
9
+ best_model_criterion:
10
+ - - valid
11
+ - loss
12
+ - min
13
+ - - train
14
+ - loss
15
+ - min
16
+ bpemodel: null
17
+ category_sample_size: 10
18
+ chunk_default_fs: null
19
+ chunk_discard_short_samples: true
20
+ chunk_excluded_key_prefixes: []
21
+ chunk_length: 500
22
+ chunk_max_abs_length: null
23
+ chunk_shift_ratio: 0.5
24
+ cleaner: null
25
+ collect_stats: false
26
+ config: conf/tuning/train_fastspeech2.yaml
27
+ create_graph_in_tensorboard: false
28
+ cudnn_benchmark: false
29
+ cudnn_deterministic: true
30
+ cudnn_enabled: true
31
+ deepspeed_config: null
32
+ detect_anomaly: false
33
+ dist_backend: nccl
34
+ dist_init_method: env://
35
+ dist_launcher: null
36
+ dist_master_addr: localhost
37
+ dist_master_port: 33333
38
+ dist_rank: 0
39
+ dist_world_size: 2
40
+ distributed: true
41
+ drop_last_iter: false
42
+ dry_run: false
43
+ early_stopping_criterion:
44
+ - valid
45
+ - loss
46
+ - min
47
+ energy_extract: energy
48
+ energy_extract_conf:
49
+ fs: 48000
50
+ hop_length: 1024
51
+ n_fft: 8192
52
+ reduction_factor: 1
53
+ win_length: 4096
54
+ energy_normalize: global_mvn
55
+ energy_normalize_conf:
56
+ stats_file: /home/speech/Suji/FS2/Fastspeech2_HS/Models_ph3/Dogri_fem_mono/energy_stats.npz
57
+ exclude_weight_decay: false
58
+ exclude_weight_decay_conf: {}
59
+ feats_extract: fbank
60
+ feats_extract_conf:
61
+ fmax: 24000
62
+ fmin: 0
63
+ fs: 48000
64
+ hop_length: 1024
65
+ n_fft: 8192
66
+ n_mels: 160
67
+ win_length: 4096
68
+ fold_length:
69
+ - 150
70
+ - 819200
71
+ freeze_param: []
72
+ g2p: null
73
+ grad_clip: 1.0
74
+ grad_clip_type: 2.0
75
+ grad_noise: false
76
+ ignore_init_mismatch: false
77
+ init_param: []
78
+ iterator_type: sequence
79
+ keep_nbest_models: 5
80
+ local_rank: 0
81
+ log_interval: null
82
+ log_level: INFO
83
+ max_cache_fd: 32
84
+ max_cache_size: 0.0
85
+ max_epoch: 1000
86
+ model_conf: {}
87
+ multi_task_dataset: false
88
+ multiple_iterator: false
89
+ multiprocessing_distributed: true
90
+ nbest_averaging_interval: 0
91
+ ngpu: 1
92
+ no_forward_run: false
93
+ non_linguistic_symbols: null
94
+ normalize: global_mvn
95
+ normalize_conf:
96
+ stats_file: /home/speech/Suji/FS2/Fastspeech2_HS/Models_ph3/Dogri_fem_mono/feats_stats.npz
97
+ num_att_plot: 3
98
+ num_cache_chunks: 1024
99
+ num_iters_per_epoch: 800
100
+ num_workers: 1
101
+ odim: null
102
+ optim: adam
103
+ optim_conf:
104
+ lr: 1.0
105
+ output_dir: exp/tts_train_fastspeech2_raw_char_None
106
+ patience: null
107
+ pitch_extract: dio
108
+ pitch_extract_conf:
109
+ f0max: 400
110
+ f0min: 80
111
+ fs: 48000
112
+ hop_length: 1024
113
+ n_fft: 8192
114
+ reduction_factor: 1
115
+ pitch_normalize: global_mvn
116
+ pitch_normalize_conf:
117
+ stats_file: /home/speech/Suji/FS2/Fastspeech2_HS/Models_ph3/Dogri_fem_mono/pitch_stats.npz
118
+ pretrain_path: null
119
+ print_config: false
120
+ required:
121
+ - output_dir
122
+ - token_list
123
+ resume: true
124
+ save_strategy: all
125
+ scheduler: noamlr
126
+ scheduler_conf:
127
+ model_size: 384
128
+ warmup_steps: 4000
129
+ seed: 0
130
+ sharded_ddp: false
131
+ shuffle_within_batch: false
132
+ sort_batch: descending
133
+ sort_in_batch: descending
134
+ token_list:
135
+ - <blank>
136
+ - <unk>
137
+ - <space>
138
+ - $
139
+ - ','
140
+ - .
141
+ - M
142
+ - q
143
+ - H
144
+ - k
145
+ - "\u0916"
146
+ - g
147
+ - "\u0918"
148
+ - "\u0919"
149
+ - c
150
+ - C
151
+ - j
152
+ - J
153
+ - "\u091E"
154
+ - "\u091F"
155
+ - "\u0920"
156
+ - "\u0921"
157
+ - "\u0922"
158
+ - "\u0923"
159
+ - t
160
+ - "\u0925"
161
+ - d
162
+ - "\u0927"
163
+ - n
164
+ - "\u0929"
165
+ - p
166
+ - P
167
+ - b
168
+ - B
169
+ - m
170
+ - y
171
+ - r
172
+ - "\u0931"
173
+ - l
174
+ - "\u0D33"
175
+ - Z
176
+ - w
177
+ - "\u0936"
178
+ - "\u0937"
179
+ - s
180
+ - h
181
+ - Y
182
+ - "\u093D"
183
+ - "\u0915"
184
+ - K
185
+ - G
186
+ - z
187
+ - D
188
+ - T
189
+ - f
190
+ - "\u0960"
191
+ - "\u0D7A"
192
+ - N
193
+ - "\u0D7C"
194
+ - "\u0D7D"
195
+ - "\u0D7E"
196
+ - a
197
+ - A
198
+ - i
199
+ - I
200
+ - u
201
+ - U
202
+ - R
203
+ - "\u090D"
204
+ - e
205
+ - E
206
+ - "\u0910"
207
+ - "\u0911"
208
+ - o
209
+ - O
210
+ - "\u0914"
211
+ - "\u0B89"
212
+ - <sos/eos>
213
+ token_type: char
214
+ train_data_path_and_name_and_type:
215
+ - - dump/raw/tr_no_dev/text
216
+ - text
217
+ - text
218
+ - - duration_info/tr_no_dev/durations
219
+ - durations
220
+ - text_int
221
+ - - dump/raw/tr_no_dev/wav.scp
222
+ - speech
223
+ - sound
224
+ - - exp/tts_stats_raw_char_None/train/collect_feats/pitch.scp
225
+ - pitch
226
+ - npy
227
+ - - exp/tts_stats_raw_char_None/train/collect_feats/energy.scp
228
+ - energy
229
+ - npy
230
+ train_dtype: float32
231
+ train_shape_file:
232
+ - exp/tts_stats_raw_char_None/train/text_shape.char
233
+ - exp/tts_stats_raw_char_None/train/speech_shape
234
+ tts: fastspeech2
235
+ tts_conf:
236
+ adim: 384
237
+ aheads: 2
238
+ decoder_normalize_before: true
239
+ dlayers: 4
240
+ dunits: 1536
241
+ duration_predictor_chans: 256
242
+ duration_predictor_kernel_size: 3
243
+ duration_predictor_layers: 2
244
+ elayers: 4
245
+ encoder_normalize_before: true
246
+ energy_embed_dropout: 0.0
247
+ energy_embed_kernel_size: 1
248
+ energy_predictor_chans: 256
249
+ energy_predictor_dropout: 0.5
250
+ energy_predictor_kernel_size: 3
251
+ energy_predictor_layers: 2
252
+ eunits: 1536
253
+ init_dec_alpha: 1.0
254
+ init_enc_alpha: 1.0
255
+ init_type: xavier_uniform
256
+ pitch_embed_dropout: 0.0
257
+ pitch_embed_kernel_size: 1
258
+ pitch_predictor_chans: 256
259
+ pitch_predictor_dropout: 0.5
260
+ pitch_predictor_kernel_size: 5
261
+ pitch_predictor_layers: 5
262
+ positionwise_conv_kernel_size: 3
263
+ positionwise_layer_type: conv1d
264
+ postnet_chans: 256
265
+ postnet_filts: 5
266
+ postnet_layers: 5
267
+ reduction_factor: 1
268
+ stop_gradient_from_energy_predictor: false
269
+ stop_gradient_from_pitch_predictor: true
270
+ transformer_dec_attn_dropout_rate: 0.2
271
+ transformer_dec_dropout_rate: 0.2
272
+ transformer_dec_positional_dropout_rate: 0.2
273
+ transformer_enc_attn_dropout_rate: 0.2
274
+ transformer_enc_dropout_rate: 0.2
275
+ transformer_enc_positional_dropout_rate: 0.2
276
+ use_masking: true
277
+ use_scaled_pos_enc: true
278
+ unused_parameters: false
279
+ use_adapter: false
280
+ use_amp: false
281
+ use_deepspeed: false
282
+ use_matplotlib: true
283
+ use_preprocessor: true
284
+ use_tensorboard: true
285
+ use_tf32: false
286
+ use_wandb: false
287
+ val_scheduler_criterion:
288
+ - valid
289
+ - loss
290
+ valid_batch_bins: null
291
+ valid_batch_size: null
292
+ valid_batch_type: null
293
+ valid_data_path_and_name_and_type:
294
+ - - dump/raw/dev/text
295
+ - text
296
+ - text
297
+ - - duration_info/dev/durations
298
+ - durations
299
+ - text_int
300
+ - - dump/raw/dev/wav.scp
301
+ - speech
302
+ - sound
303
+ - - exp/tts_stats_raw_char_None/valid/collect_feats/pitch.scp
304
+ - pitch
305
+ - npy
306
+ - - exp/tts_stats_raw_char_None/valid/collect_feats/energy.scp
307
+ - energy
308
+ - npy
309
+ valid_iterator_type: null
310
+ valid_max_cache_size: null
311
+ valid_shape_file:
312
+ - exp/tts_stats_raw_char_None/valid/text_shape.char
313
+ - exp/tts_stats_raw_char_None/valid/speech_shape
314
+ version: '202412'
315
+ wandb_entity: null
316
+ wandb_id: null
317
+ wandb_model_log_interval: -1
318
+ wandb_name: null
319
+ wandb_project: null
320
+ write_collected_feats: false
dogri_latest/female/model/energy_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0fb130c5668e5ed45e934c17a1538a8756c5eb9c68815ba5d32533e45852eb3a
3
+ size 770
dogri_latest/female/model/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b19d99c343e9d668bd1823dc2ca76ded554b799251ff82714836b467044f1f6b
3
+ size 2042
dogri_latest/female/model/feats_type ADDED
@@ -0,0 +1 @@
 
 
1
+ raw
dogri_latest/female/model/model.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b5b78ddee3e2fd4f3f5cae45eb7b17efc3d5484db515ad659b8562d3af965085
3
+ size 152129434
dogri_latest/female/model/pitch_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8528e3b22495fb791b9d37076bc1170418bda61cd85e33dc1693aacc8bb01cb8
3
+ size 770
dogri_latest/male/model/config.yaml ADDED
@@ -0,0 +1,320 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 8
2
+ adapter: lora
3
+ adapter_conf: {}
4
+ allow_multi_rates: false
5
+ allow_variable_data_keys: false
6
+ batch_bins: 3000000
7
+ batch_size: 20
8
+ batch_type: numel
9
+ best_model_criterion:
10
+ - - valid
11
+ - loss
12
+ - min
13
+ - - train
14
+ - loss
15
+ - min
16
+ bpemodel: null
17
+ category_sample_size: 10
18
+ chunk_default_fs: null
19
+ chunk_discard_short_samples: true
20
+ chunk_excluded_key_prefixes: []
21
+ chunk_length: 500
22
+ chunk_max_abs_length: null
23
+ chunk_shift_ratio: 0.5
24
+ cleaner: null
25
+ collect_stats: false
26
+ config: conf/tuning/train_fastspeech2.yaml
27
+ create_graph_in_tensorboard: false
28
+ cudnn_benchmark: false
29
+ cudnn_deterministic: true
30
+ cudnn_enabled: true
31
+ deepspeed_config: null
32
+ detect_anomaly: false
33
+ dist_backend: nccl
34
+ dist_init_method: env://
35
+ dist_launcher: null
36
+ dist_master_addr: localhost
37
+ dist_master_port: 56691
38
+ dist_rank: 0
39
+ dist_world_size: 2
40
+ distributed: true
41
+ drop_last_iter: false
42
+ dry_run: false
43
+ early_stopping_criterion:
44
+ - valid
45
+ - loss
46
+ - min
47
+ energy_extract: energy
48
+ energy_extract_conf:
49
+ fs: 48000
50
+ hop_length: 1024
51
+ n_fft: 8192
52
+ reduction_factor: 1
53
+ win_length: 4096
54
+ energy_normalize: global_mvn
55
+ energy_normalize_conf:
56
+ stats_file: /home/speech/Suji/FS2/Fastspeech2_HS/Models_ph3/Dogri_male_mono/energy_stats.npz
57
+ exclude_weight_decay: false
58
+ exclude_weight_decay_conf: {}
59
+ feats_extract: fbank
60
+ feats_extract_conf:
61
+ fmax: 24000
62
+ fmin: 0
63
+ fs: 48000
64
+ hop_length: 1024
65
+ n_fft: 8192
66
+ n_mels: 160
67
+ win_length: 4096
68
+ fold_length:
69
+ - 150
70
+ - 819200
71
+ freeze_param: []
72
+ g2p: null
73
+ grad_clip: 1.0
74
+ grad_clip_type: 2.0
75
+ grad_noise: false
76
+ ignore_init_mismatch: false
77
+ init_param: []
78
+ iterator_type: sequence
79
+ keep_nbest_models: 5
80
+ local_rank: 0
81
+ log_interval: null
82
+ log_level: INFO
83
+ max_cache_fd: 32
84
+ max_cache_size: 0.0
85
+ max_epoch: 1000
86
+ model_conf: {}
87
+ multi_task_dataset: false
88
+ multiple_iterator: false
89
+ multiprocessing_distributed: true
90
+ nbest_averaging_interval: 0
91
+ ngpu: 1
92
+ no_forward_run: false
93
+ non_linguistic_symbols: null
94
+ normalize: global_mvn
95
+ normalize_conf:
96
+ stats_file: /home/speech/Suji/FS2/Fastspeech2_HS/Models_ph3/Dogri_male_mono/feats_stats.npz
97
+ num_att_plot: 3
98
+ num_cache_chunks: 1024
99
+ num_iters_per_epoch: 800
100
+ num_workers: 1
101
+ odim: null
102
+ optim: adam
103
+ optim_conf:
104
+ lr: 1.0
105
+ output_dir: exp/tts_train_fastspeech2_raw_char_None
106
+ patience: null
107
+ pitch_extract: dio
108
+ pitch_extract_conf:
109
+ f0max: 350
110
+ f0min: 40
111
+ fs: 48000
112
+ hop_length: 1024
113
+ n_fft: 8192
114
+ reduction_factor: 1
115
+ pitch_normalize: global_mvn
116
+ pitch_normalize_conf:
117
+ stats_file: /home/speech/Suji/FS2/Fastspeech2_HS/Models_ph3/Dogri_male_mono/pitch_stats.npz
118
+ pretrain_path: null
119
+ print_config: false
120
+ required:
121
+ - output_dir
122
+ - token_list
123
+ resume: true
124
+ save_strategy: all
125
+ scheduler: noamlr
126
+ scheduler_conf:
127
+ model_size: 384
128
+ warmup_steps: 4000
129
+ seed: 0
130
+ sharded_ddp: false
131
+ shuffle_within_batch: false
132
+ sort_batch: descending
133
+ sort_in_batch: descending
134
+ token_list:
135
+ - <blank>
136
+ - <unk>
137
+ - <space>
138
+ - $
139
+ - ','
140
+ - .
141
+ - M
142
+ - q
143
+ - H
144
+ - k
145
+ - "\u0916"
146
+ - g
147
+ - "\u0918"
148
+ - "\u0919"
149
+ - c
150
+ - C
151
+ - j
152
+ - J
153
+ - "\u091E"
154
+ - "\u091F"
155
+ - "\u0920"
156
+ - "\u0921"
157
+ - "\u0922"
158
+ - "\u0923"
159
+ - t
160
+ - "\u0925"
161
+ - d
162
+ - "\u0927"
163
+ - n
164
+ - "\u0929"
165
+ - p
166
+ - P
167
+ - b
168
+ - B
169
+ - m
170
+ - y
171
+ - r
172
+ - "\u0931"
173
+ - l
174
+ - "\u0D33"
175
+ - Z
176
+ - w
177
+ - "\u0936"
178
+ - "\u0937"
179
+ - s
180
+ - h
181
+ - Y
182
+ - "\u093D"
183
+ - "\u0915"
184
+ - K
185
+ - G
186
+ - z
187
+ - D
188
+ - T
189
+ - f
190
+ - "\u0960"
191
+ - "\u0D7A"
192
+ - N
193
+ - "\u0D7C"
194
+ - "\u0D7D"
195
+ - "\u0D7E"
196
+ - a
197
+ - A
198
+ - i
199
+ - I
200
+ - u
201
+ - U
202
+ - R
203
+ - "\u090D"
204
+ - e
205
+ - E
206
+ - "\u0910"
207
+ - "\u0911"
208
+ - o
209
+ - O
210
+ - "\u0914"
211
+ - "\u0B89"
212
+ - <sos/eos>
213
+ token_type: char
214
+ train_data_path_and_name_and_type:
215
+ - - dump/raw/tr_no_dev/text
216
+ - text
217
+ - text
218
+ - - duration_info/tr_no_dev/durations
219
+ - durations
220
+ - text_int
221
+ - - dump/raw/tr_no_dev/wav.scp
222
+ - speech
223
+ - sound
224
+ - - exp/tts_stats_raw_char_None/train/collect_feats/pitch.scp
225
+ - pitch
226
+ - npy
227
+ - - exp/tts_stats_raw_char_None/train/collect_feats/energy.scp
228
+ - energy
229
+ - npy
230
+ train_dtype: float32
231
+ train_shape_file:
232
+ - exp/tts_stats_raw_char_None/train/text_shape.char
233
+ - exp/tts_stats_raw_char_None/train/speech_shape
234
+ tts: fastspeech2
235
+ tts_conf:
236
+ adim: 384
237
+ aheads: 2
238
+ decoder_normalize_before: true
239
+ dlayers: 4
240
+ dunits: 1536
241
+ duration_predictor_chans: 256
242
+ duration_predictor_kernel_size: 3
243
+ duration_predictor_layers: 2
244
+ elayers: 4
245
+ encoder_normalize_before: true
246
+ energy_embed_dropout: 0.0
247
+ energy_embed_kernel_size: 1
248
+ energy_predictor_chans: 256
249
+ energy_predictor_dropout: 0.5
250
+ energy_predictor_kernel_size: 3
251
+ energy_predictor_layers: 2
252
+ eunits: 1536
253
+ init_dec_alpha: 1.0
254
+ init_enc_alpha: 1.0
255
+ init_type: xavier_uniform
256
+ pitch_embed_dropout: 0.0
257
+ pitch_embed_kernel_size: 1
258
+ pitch_predictor_chans: 256
259
+ pitch_predictor_dropout: 0.5
260
+ pitch_predictor_kernel_size: 5
261
+ pitch_predictor_layers: 5
262
+ positionwise_conv_kernel_size: 3
263
+ positionwise_layer_type: conv1d
264
+ postnet_chans: 256
265
+ postnet_filts: 5
266
+ postnet_layers: 5
267
+ reduction_factor: 1
268
+ stop_gradient_from_energy_predictor: false
269
+ stop_gradient_from_pitch_predictor: true
270
+ transformer_dec_attn_dropout_rate: 0.2
271
+ transformer_dec_dropout_rate: 0.2
272
+ transformer_dec_positional_dropout_rate: 0.2
273
+ transformer_enc_attn_dropout_rate: 0.2
274
+ transformer_enc_dropout_rate: 0.2
275
+ transformer_enc_positional_dropout_rate: 0.2
276
+ use_masking: true
277
+ use_scaled_pos_enc: true
278
+ unused_parameters: false
279
+ use_adapter: false
280
+ use_amp: false
281
+ use_deepspeed: false
282
+ use_matplotlib: true
283
+ use_preprocessor: true
284
+ use_tensorboard: true
285
+ use_tf32: false
286
+ use_wandb: false
287
+ val_scheduler_criterion:
288
+ - valid
289
+ - loss
290
+ valid_batch_bins: null
291
+ valid_batch_size: null
292
+ valid_batch_type: null
293
+ valid_data_path_and_name_and_type:
294
+ - - dump/raw/dev/text
295
+ - text
296
+ - text
297
+ - - duration_info/dev/durations
298
+ - durations
299
+ - text_int
300
+ - - dump/raw/dev/wav.scp
301
+ - speech
302
+ - sound
303
+ - - exp/tts_stats_raw_char_None/valid/collect_feats/pitch.scp
304
+ - pitch
305
+ - npy
306
+ - - exp/tts_stats_raw_char_None/valid/collect_feats/energy.scp
307
+ - energy
308
+ - npy
309
+ valid_iterator_type: null
310
+ valid_max_cache_size: null
311
+ valid_shape_file:
312
+ - exp/tts_stats_raw_char_None/valid/text_shape.char
313
+ - exp/tts_stats_raw_char_None/valid/speech_shape
314
+ version: '202412'
315
+ wandb_entity: null
316
+ wandb_id: null
317
+ wandb_model_log_interval: -1
318
+ wandb_name: null
319
+ wandb_project: null
320
+ write_collected_feats: false
dogri_latest/male/model/energy_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:bf371757b778f3ccea34a9adec8f3780b3860417b136feaa9434825875086f82
3
+ size 770
dogri_latest/male/model/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:67483f7d4ad1b4b5f2b2644d47ef258e583c24c7f379fba419facb0c19794b4d
3
+ size 2042
dogri_latest/male/model/feats_type ADDED
@@ -0,0 +1 @@
 
 
1
+ raw
dogri_latest/male/model/model.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:389206bad90f4c7c6cc542950a37c23934db715ce250bf187c8dbfd84423336f
3
+ size 152129434
dogri_latest/male/model/pitch_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0fc70a7bb02172ba14cd289c83ab8b24d8e5e2f8ab2b12a1d1a9cd66b008e2e3
3
+ size 770
gujarati_latest/female/model/config.yaml ADDED
@@ -0,0 +1,319 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ config: conf/tuning/train_fastspeech2.yaml
2
+ print_config: false
3
+ log_level: INFO
4
+ drop_last_iter: false
5
+ dry_run: false
6
+ iterator_type: sequence
7
+ valid_iterator_type: null
8
+ output_dir: exp/tts_train_fastspeech2_raw_char_None
9
+ ngpu: 1
10
+ seed: 0
11
+ num_workers: 1
12
+ num_att_plot: 3
13
+ dist_backend: nccl
14
+ dist_init_method: env://
15
+ dist_world_size: 2
16
+ dist_rank: 0
17
+ local_rank: 0
18
+ dist_master_addr: localhost
19
+ dist_master_port: 45101
20
+ dist_launcher: null
21
+ multiprocessing_distributed: true
22
+ unused_parameters: false
23
+ sharded_ddp: false
24
+ use_deepspeed: false
25
+ deepspeed_config: null
26
+ cudnn_enabled: true
27
+ cudnn_benchmark: false
28
+ cudnn_deterministic: true
29
+ use_tf32: false
30
+ collect_stats: false
31
+ write_collected_feats: false
32
+ max_epoch: 1000
33
+ patience: null
34
+ val_scheduler_criterion:
35
+ - valid
36
+ - loss
37
+ early_stopping_criterion:
38
+ - valid
39
+ - loss
40
+ - min
41
+ best_model_criterion:
42
+ - - valid
43
+ - loss
44
+ - min
45
+ - - train
46
+ - loss
47
+ - min
48
+ keep_nbest_models: 5
49
+ nbest_averaging_interval: 0
50
+ grad_clip: 1.0
51
+ grad_clip_type: 2.0
52
+ grad_noise: false
53
+ accum_grad: 8
54
+ no_forward_run: false
55
+ resume: true
56
+ train_dtype: float32
57
+ use_amp: false
58
+ log_interval: null
59
+ use_matplotlib: true
60
+ use_tensorboard: true
61
+ create_graph_in_tensorboard: false
62
+ use_wandb: false
63
+ wandb_project: null
64
+ wandb_id: null
65
+ wandb_entity: null
66
+ wandb_name: null
67
+ wandb_model_log_interval: -1
68
+ detect_anomaly: false
69
+ use_adapter: false
70
+ adapter: lora
71
+ save_strategy: all
72
+ adapter_conf: {}
73
+ pretrain_path: null
74
+ init_param: []
75
+ ignore_init_mismatch: false
76
+ freeze_param: []
77
+ num_iters_per_epoch: 800
78
+ batch_size: 20
79
+ valid_batch_size: null
80
+ batch_bins: 3000000
81
+ valid_batch_bins: null
82
+ train_shape_file:
83
+ - exp/tts_stats_raw_char_None/train/text_shape.char
84
+ - exp/tts_stats_raw_char_None/train/speech_shape
85
+ valid_shape_file:
86
+ - exp/tts_stats_raw_char_None/valid/text_shape.char
87
+ - exp/tts_stats_raw_char_None/valid/speech_shape
88
+ batch_type: numel
89
+ valid_batch_type: null
90
+ fold_length:
91
+ - 150
92
+ - 819200
93
+ sort_in_batch: descending
94
+ shuffle_within_batch: false
95
+ sort_batch: descending
96
+ multiple_iterator: false
97
+ chunk_length: 500
98
+ chunk_shift_ratio: 0.5
99
+ num_cache_chunks: 1024
100
+ chunk_excluded_key_prefixes: []
101
+ chunk_default_fs: null
102
+ chunk_max_abs_length: null
103
+ chunk_discard_short_samples: true
104
+ train_data_path_and_name_and_type:
105
+ - - dump/raw/tr_no_dev/text
106
+ - text
107
+ - text
108
+ - - duration_info/tr_no_dev/durations
109
+ - durations
110
+ - text_int
111
+ - - dump/raw/tr_no_dev/wav.scp
112
+ - speech
113
+ - sound
114
+ - - exp/tts_stats_raw_char_None/train/collect_feats/pitch.scp
115
+ - pitch
116
+ - npy
117
+ - - exp/tts_stats_raw_char_None/train/collect_feats/energy.scp
118
+ - energy
119
+ - npy
120
+ valid_data_path_and_name_and_type:
121
+ - - dump/raw/dev/text
122
+ - text
123
+ - text
124
+ - - duration_info/dev/durations
125
+ - durations
126
+ - text_int
127
+ - - dump/raw/dev/wav.scp
128
+ - speech
129
+ - sound
130
+ - - exp/tts_stats_raw_char_None/valid/collect_feats/pitch.scp
131
+ - pitch
132
+ - npy
133
+ - - exp/tts_stats_raw_char_None/valid/collect_feats/energy.scp
134
+ - energy
135
+ - npy
136
+ multi_task_dataset: false
137
+ allow_variable_data_keys: false
138
+ max_cache_size: 0.0
139
+ max_cache_fd: 32
140
+ allow_multi_rates: false
141
+ valid_max_cache_size: null
142
+ exclude_weight_decay: false
143
+ exclude_weight_decay_conf: {}
144
+ optim: adam
145
+ optim_conf:
146
+ lr: 1.0
147
+ scheduler: noamlr
148
+ scheduler_conf:
149
+ model_size: 384
150
+ warmup_steps: 4000
151
+ token_list:
152
+ - <blank>
153
+ - <unk>
154
+ - <space>
155
+ - $
156
+ - ','
157
+ - .
158
+ - M
159
+ - q
160
+ - H
161
+ - k
162
+ - ख
163
+ - g
164
+ - घ
165
+ - ङ
166
+ - c
167
+ - C
168
+ - j
169
+ - J
170
+ - ञ
171
+ - ट
172
+ - ठ
173
+ - ड
174
+ - ढ
175
+ - ण
176
+ - t
177
+ - थ
178
+ - d
179
+ - ध
180
+ - n
181
+ - ऩ
182
+ - p
183
+ - P
184
+ - b
185
+ - B
186
+ - m
187
+ - y
188
+ - r
189
+ - ऱ
190
+ - l
191
+ - ള
192
+ - Z
193
+ - w
194
+ - श
195
+ - ष
196
+ - s
197
+ - h
198
+ - Y
199
+ - ऽ
200
+ - क
201
+ - K
202
+ - G
203
+ - z
204
+ - D
205
+ - T
206
+ - f
207
+ - ॠ
208
+ - ൺ
209
+ - N
210
+ - ർ
211
+ - ൽ
212
+ - ൾ
213
+ - a
214
+ - A
215
+ - i
216
+ - I
217
+ - u
218
+ - U
219
+ - R
220
+ - ऍ
221
+ - e
222
+ - E
223
+ - ऐ
224
+ - ऑ
225
+ - o
226
+ - O
227
+ - औ
228
+ - உ
229
+ - <sos/eos>
230
+ odim: null
231
+ model_conf: {}
232
+ use_preprocessor: true
233
+ token_type: char
234
+ bpemodel: null
235
+ non_linguistic_symbols: null
236
+ cleaner: null
237
+ g2p: null
238
+ feats_extract: fbank
239
+ feats_extract_conf:
240
+ n_fft: 8192
241
+ hop_length: 1024
242
+ win_length: 4096
243
+ fs: 48000
244
+ fmin: 0
245
+ fmax: 24000
246
+ n_mels: 160
247
+ normalize: global_mvn
248
+ normalize_conf:
249
+ stats_file: exp/tts_stats_raw_char_None/train/feats_stats.npz
250
+ tts: fastspeech2
251
+ tts_conf:
252
+ adim: 384
253
+ aheads: 2
254
+ elayers: 4
255
+ eunits: 1536
256
+ dlayers: 4
257
+ dunits: 1536
258
+ positionwise_layer_type: conv1d
259
+ positionwise_conv_kernel_size: 3
260
+ duration_predictor_layers: 2
261
+ duration_predictor_chans: 256
262
+ duration_predictor_kernel_size: 3
263
+ postnet_layers: 5
264
+ postnet_filts: 5
265
+ postnet_chans: 256
266
+ use_masking: true
267
+ use_scaled_pos_enc: true
268
+ encoder_normalize_before: true
269
+ decoder_normalize_before: true
270
+ reduction_factor: 1
271
+ init_type: xavier_uniform
272
+ init_enc_alpha: 1.0
273
+ init_dec_alpha: 1.0
274
+ transformer_enc_dropout_rate: 0.2
275
+ transformer_enc_positional_dropout_rate: 0.2
276
+ transformer_enc_attn_dropout_rate: 0.2
277
+ transformer_dec_dropout_rate: 0.2
278
+ transformer_dec_positional_dropout_rate: 0.2
279
+ transformer_dec_attn_dropout_rate: 0.2
280
+ pitch_predictor_layers: 5
281
+ pitch_predictor_chans: 256
282
+ pitch_predictor_kernel_size: 5
283
+ pitch_predictor_dropout: 0.5
284
+ pitch_embed_kernel_size: 1
285
+ pitch_embed_dropout: 0.0
286
+ stop_gradient_from_pitch_predictor: true
287
+ energy_predictor_layers: 2
288
+ energy_predictor_chans: 256
289
+ energy_predictor_kernel_size: 3
290
+ energy_predictor_dropout: 0.5
291
+ energy_embed_kernel_size: 1
292
+ energy_embed_dropout: 0.0
293
+ stop_gradient_from_energy_predictor: false
294
+ pitch_extract: dio
295
+ pitch_extract_conf:
296
+ fs: 48000
297
+ n_fft: 8192
298
+ hop_length: 1024
299
+ f0max: 400
300
+ f0min: 80
301
+ reduction_factor: 1
302
+ pitch_normalize: global_mvn
303
+ pitch_normalize_conf:
304
+ stats_file: exp/tts_stats_raw_char_None/train/pitch_stats.npz
305
+ energy_extract: energy
306
+ energy_extract_conf:
307
+ fs: 48000
308
+ n_fft: 8192
309
+ hop_length: 1024
310
+ win_length: 4096
311
+ reduction_factor: 1
312
+ energy_normalize: global_mvn
313
+ energy_normalize_conf:
314
+ stats_file: exp/tts_stats_raw_char_None/train/energy_stats.npz
315
+ required:
316
+ - output_dir
317
+ - token_list
318
+ version: '202402'
319
+ distributed: true
gujarati_latest/female/model/energy_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:be2ea6e9579de7746a9588fcb0249c877ba18eaf1863d1b25eb3094e8e2de62c
3
+ size 770
gujarati_latest/female/model/feats_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:eb5bf1c538d541e7f8256e58d24491c5a228af2b031c707021dcd292ecf72744
3
+ size 2042
gujarati_latest/female/model/feats_type ADDED
@@ -0,0 +1 @@
 
 
1
+ raw
gujarati_latest/female/model/model.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dac3898f5b249ffeb4329a33f64137e565ead4cb70e0883b3a818e62ee28d3b2
3
+ size 152129434
gujarati_latest/female/model/pitch_stats.npz ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e97e4ca2a7f442888eb353665a1481c82e8517de9bf907f85cf4c315e4446648
3
+ size 770