thewh1teagle commited on
Commit
fdd064f
·
unverified ·
1 Parent(s): 949d638

Update .gitignore, add piper.py for audio generation, and enhance todo list

Browse files
.gitignore CHANGED
@@ -2,4 +2,6 @@
2
  .venv/
3
  venv/
4
  .env
5
- .DS_Store
 
 
 
2
  .venv/
3
  venv/
4
  .env
5
+ .DS_Store
6
+ *.onnx
7
+ ilspeech*.json
comparison/audio/piper_phonikud_report.json ADDED
@@ -0,0 +1,307 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "mean_wer": 0.2257326458848646,
3
+ "mean_cer": 0.060650522835911304,
4
+ "transcripts": {
5
+ "gold_000_line_012": "החברה האם זו שמחזיקה או החזיקה אז בבלה?",
6
+ "gold_000_line_035": "אבל חלק מזה זה גם מעבר לזה זאת אומרת, הם יודעים שאם המתחרה שלהם...",
7
+ "gold_000_line_037": "על שיתוף פעולה עם איזשהו עיתון או טלוויזיה, כי ראינו את הכנסים האלה קורים גם בטלוויזיות.",
8
+ "gold_000_line_089": "נכון, הם לא מודעים לזה בכלל, ואגב,",
9
+ "gold_000_line_101": "‫אז זה די מתהים לראות את זה לאור יום.",
10
+ "gold_000_line_145": "הנה לגבי מה שהולך בישראל ובעולם, ואיך נראים החיים הסיכוי שזה הוא יותר גדול.",
11
+ "gold_000_line_148": "ולכן, אם נצרוך כמה שיותר נצליח לקבל תמונה כמה שיותר טובה.",
12
+ "gold_000_line_155": "הנמצאים בבעיה אחרת כי יש לנו לחצים של פוליטיקאים כי הפוליטיקאים ברצותם הם יכולים לסגור את תאגיד השידור הציבורי.",
13
+ "gold_001_line_022": "אבל באמת נוגעים מפעילים את זה משהו בפנים.",
14
+ "gold_001_line_035": "ובעצם זה כל מה שנשאר רק הזיכרונות וגם הם כבר די דויים.",
15
+ "gold_001_line_052": "ליד אחת החנויות הסמוכות היו המון דברים על הרצפה הפסקיות, בלי שקיות מה שאתם רוצים.",
16
+ "gold_001_line_069": "לפני שנתחיל, דיקשתי ממנו שיציג את עצמו.",
17
+ "gold_001_line_100": "אדם שלח לי סרטון של הדירה הזאת.",
18
+ "gold_001_line_120": "והנה אנחנו מגיעים לאחד החלקים המסובכים בסיפור הזה.",
19
+ "gold_001_line_182": "ובעזרת מתנדבים התחילו לפזר את התרומות האלה בין המחסנים.",
20
+ "gold_001_line_186": "הררים הררים של חולצות ומכנסיים ובגדים אחרים.",
21
+ "gold_001_line_223": "ואת זה שאחת הדרכים שלו להתחרות הייתה להציע חצי שנה של תשלומי שכר דירה מראש.",
22
+ "gold_001_line_243": "זה לקח לא מעט אייטמים בתקשורת גם אצלנו.",
23
+ "gold_001_line_251": "קצת לחץ בתקשורת, וחברות הביטוח הבינו שעדיף להן לא להתעסק יותר מדי עם הדבר הזה.",
24
+ "gold_001_line_290": "כלומר, וכאחד הבניינים קרה סביר מאוד להניח שהם כבר לא יחזרו לגור בבניינים שעדיין נותרו לעמוד ושמיטה שהוא יהרסו גם אותם.",
25
+ "gold_001_line_348": "עוד שנייה יהיה לה מקום חדש לקרוא לו בית.",
26
+ "gold_001_line_362": "כלל ומגדל עדיין עשו בעיות גם חברת איילון.",
27
+ "gold_001_line_443": "עמוק בתוך הידיעה הנכתב שבמקום הבעת הבניינים.",
28
+ "gold_002_line_024": "לפני שלוש שנים הוא בכלל היה בצד השני של העולם בבית שלא בפבר של פידפיה.",
29
+ "gold_002_line_075": "והשאלה הזו מטרידה לא רק אותו, אלא את הנגידים של בנקים מרכזיים ברחבי העולם כולו, והיא צריכה להטריד מאוד גם אותנו.",
30
+ "gold_002_line_103": "אז זה קורה מכל מיני סיבות שקשורות לאתושות הכלכלית, ובפרט לצורה מאוד ספציפית של האתושות הכלכלית מהשנה הקודמת.",
31
+ "gold_002_line_271": "ועצם ההחלטה שלו עצמו להזין את הציפיות לאינפלציה עוד יותר.",
32
+ "gold_002_line_279": "כלומר שאנחנו הולכים לאינפלציה שהיא בסדר מבחינת היעד של בנק ישראל.",
33
+ "gold_002_line_310": "פשוט כי האינפלציה כאן היא עדיין נמוכה ביחס למדינות אחרות.",
34
+ "gold_002_line_311": "בשביל לסבר לכם את האוזן, מדינות רבות סובלות עכשיו מאינפלציה.",
35
+ "gold_002_line_316": "במדינות אחרות זה טיפה רגועה יותר ועדיין קבוע.",
36
+ "gold_002_line_356": "בארצות הברית, בין פעמים מכאן שהאינפלציה השנתית כבר חצתה את השישה אחוזים.",
37
+ "gold_002_line_364": "הוא כתב שם שאינפלציה שנובעת מתחמות יתר של הכלכלה היא אומנן בעיה שמתגמדת אל מול מגיפה עולמית.",
38
+ "gold_002_line_371": "אם יש לכם שאלות או מחשבות בעקבות הפרק הזה,",
39
+ "gold_003_line_008": "בזמן שהיה כאן הוא ניפגש עם ראש הממשלה.",
40
+ "gold_003_line_011": "מפגשתי עם קורמן בבוקר ירושלמי קריר באמצע שבוע שווה.",
41
+ "gold_004_line_002": "כי בכל זאת אנחנו פודקאסט ישראלי שקורא בישראל.",
42
+ "gold_005_line_033": "המוצרים הראשונים שראינו ושאתם רואים בסופרלו נמצאים שם במקרה.",
43
+ "gold_005_line_035": "יש לא מעט מחקרים בעדויות של בעלי חנויות שמראים שיש סיכוי לא רע שתשימו בעגלה את הדבר הראשון שראיתם גם אם אפילו לא תכננתם לקנות אותו.",
44
+ "gold_005_line_072": "גם הרגע שבו הסופרמרקט הגיע לישראל שיקף את המערכה התרבותית שהמדינה הצעירה ענדה לעבור.",
45
+ "gold_005_line_081": "‫האוכל לא הגיע אז באריזות אישיות ‫לשימוש ביתי.",
46
+ "gold_005_line_133": "זה אומר את זה כי הם בוחרים לדחוף לנו בעיקר מזון לא בריא.",
47
+ "gold_005_line_150": "דבר ראשון, סופרמרקטים דווקא כן דוחפים במבצעים נוצרים שהם לא ריחים להם כמו חתולים.",
48
+ "gold_005_line_151": "זו הדרך שלהם למשוך עליהם קהל של הורים צעירים, למשל שיבואו לקנות את החיתולים אולי במחיר הפסד, אבל כבר יעשו את כל הקניות שלהם על הדרך ויקנו גם את המוצרים הרווחיים יותר סופר.",
49
+ "gold_005_line_193": "זו בדיוק העבודה של דריה, מנובים ממרכז המידע לבריאות הציבור.",
50
+ "gold_005_line_197": "אבל אפילו בלי הממשלה ובלי המדינה יש עוד משהו שיכול לגרום לבעלי הסופרים להתחיל לשנות את מה שהם מוכרים ואת מה שהם מציגים בשביל שנקנה לו.",
51
+ "gold_006_line_060": "הבורסות בכל העולם התחילו לקרוס באחוזים ניכרים.",
52
+ "gold_007_line_013": "אז השנה נוספו לכבישים עוד רבע מיליון כאלה שזה קצב שיא.",
53
+ "gold_007_line_046": "בן מאיר הגיע לתפקיד הזה אחרי ששימש כסמנכ\"ל הכספים והמשנה למנכ\"ל של חברת מוריה.",
54
+ "gold_007_line_087": "או ליתר דיוקי לא רואה משבר דיור אלא כי רואה מאות אלפי זוגות צעירים שעוד שנייה עלולים לצעוק עליה שוב שמחירי הדיור גבוהים מדי.",
55
+ "gold_007_line_094": "זה לא הכיוון הנכון ללכת בו, אבל זה מה שהממשלות עושות.",
56
+ "gold_007_line_108": "ואז שרת התחבורה ריגב החליטה שהיא עוצרת את התקציבים.",
57
+ "gold_007_line_145": "במהלך השבוע עצמו אני רוכב לעבודה באופנועים הלוך חז בסך הכל 10 דקות לכל כיוון.",
58
+ "gold_007_line_150": "נמאס לי לחלוטין לעמוד בפקקים, נמאס לי מהלחץ, נמאס לי מחיפושי החניה, פשוט נמאס לי.",
59
+ "gold_007_line_152": "לעתים חוקות אני משתמש באותו, ובכל פעם שאני עושה את זה אני מתחרט ומקלל.",
60
+ "gold_007_line_155": "האם אני מטיף לכל מי שאני רק יכול בעבודה שנסעו את התחבורה הציבורית?",
61
+ "gold_008_line_036": "היום כבר כמעט שאין בישראל בית ספר כמו זה ששמעון נשלח אליו בשנות ה-80 לימוד נגרות.",
62
+ "gold_008_line_068": "ולכן הוא הציע לממשלה לדון ברצינות בהקמה לדחייה של מערך החינוך המקצועי, וההצעה הזאת לא עברה כל כך טוב.",
63
+ "gold_008_line_091": "הנה אני אגיד שוב את השני משפטים האחרונים.",
64
+ "gold_008_line_100": "אני באופן אישי אחרי איזושהי תקופה, עם גוגל פודקאסטס עברתי לאחרונה לספוטיפיי לא לגמרי בטוח למה אבל האמת היא שאנחנו בכל מקום בכל מקום.",
65
+ "gold_009_line_022": "אם תעברו אותו תוכלו ללכת לתיכון עיוני, כלומר ללמוד מתמטיקה ואנגלית ועוד מקצועות לבגרות.",
66
+ "gold_009_line_091": "ושלכן הוא יגדיל את המוביליות החברתית של אותו נוער וגם את ההכנסה העתידית שלו, כלומר שחינוך מקצועי מסייע לצמצום פערים.",
67
+ "gold_009_line_103": "שרק אדרי כתב את החינוך של הארץ. המון תודה שיזנת את הפרק הזה ושעשית אותו איתנו תמיד כיף לארח אותך אצלנו.",
68
+ "gold_010_line_023": "וגם אצלנו בישראל לשכת התעסוקה דיווחה על עלייה במספר המתפטרים.",
69
+ "gold_010_line_045": "אתה שוב אמרת אמור לחשוב שעבודה מג��יבה שהיא משנה את העולם להרגיש שהיא חלק מהזהות שלך.",
70
+ "gold_010_line_063": "זה הרבה יותר חשוב מאשר לשמור דביעות, זה הרבה יותר חשוב מאשר לשמור על הבריאות שלהם.",
71
+ "gold_010_line_095": "האמת שהרבה פעמים נראה לי שלגומים לא כל כך אכפת שהעובדים נשחקים.",
72
+ "gold_010_line_102": "ככה שתוכל להתעדכן כי אתה בטח נורא סקרן לדעת מה הולך בזמן שאתה לא נמצא, ואתה בחופש איפושהו על הים ובמשף.",
73
+ "gold_011_line_083": "אין לי מוסד אם זה בכלל אפשרי משפטית.",
74
+ "gold_011_line_095": "בשנים האחרונות, כשמדברים על כלכלה ועל המגזר העסקי.",
75
+ "gold_011_line_114": "במערכת חיות כיס חברות גם דנה פרנקו ציל אברהם.",
76
+ "gold_012_line_055": "אבל בין היתר גם סיבות כלכליות ותערותיות.",
77
+ "gold_012_line_060": "אתר הטבילה הפך להיות בבת אחת חלק משטח צבאי סגור.",
78
+ "gold_012_line_119": "ומתרגזת בכל פעם, ומתרגזת מאוד בכל פעם שישראל טוענת אחרת.",
79
+ "gold_012_line_124": "למה הם לא ממסרים את אתר הטילה? כי זה מקום קדוש. הם אומרים, זה לא מתאים, זה כמו למסחרת הכותל.",
80
+ "gold_012_line_133": "עושר עילאי שאין שני לא כאלה מין דברים.",
81
+ "gold_012_line_136": "ואפילו איזה דג שמישהו סיפר שישו פעם אחת.",
82
+ "gold_013_line_002": "והסיפור על איך המקור הגיע לבורסה ולמ\"ס האודים החליטו למכור בכלל כמה אחוזים מהבומנזה הכלכלית שלהם הוא סיפור מרתק.",
83
+ "gold_014_line_008": "אחרי שהפרק ההוא שודר עוד ספתי בתגובות שלכם, באמת המון המון תגובות המון אנשים אמרו שהם רוצים עוד מזה.",
84
+ "gold_015_line_015": "האם זה משהו פלילי המדינה? טוענת שכן.",
85
+ "gold_015_line_068": "לרמה הזאת שעיתונאים התחילו להפעיל על עצמם צמזורה עצמית, פעם שמעתי את אילנה דיין מדברת, אז זה, בהת...",
86
+ "gold_015_line_071": "כי הם מבינים שיש איזושהי רוח מפקד ושאם הם יכתבו אחרת הידיעה פשוט לא תעבור.",
87
+ "gold_016_line_021": "איך אנחנו יכולים להאמין למילה ממה שאתה אומר.",
88
+ "gold_016_line_076": "זה פשוט משחית את התקשורת, כי התמונה שהקורות קוראים צופות צופים מקבלים,",
89
+ "gold_017_line_041": "אם תשאלנו את ההנחות של המודל, תשאלנו גם את התוצאות.",
90
+ "gold_017_line_099": "הם כמו למשל במספר מכונות ההנשמה שהוזנו הרבה הרבה הרבה מעבר ליעד שנקבע הובלות של מיירדים.",
91
+ "gold_017_line_144": "ניסינו ששני הרעיונות יכללו קטעים אחרים לגמרי.",
92
+ "gold_020_line_002": "אוקיי, אז בוא נלך מהקל אל הכבד בחלק הקל על אף שכבר עכשיו הטכנולוגיה מאוד מאוד מרשימה.",
93
+ "gold_020_line_006": "אבל לא, היא עדיין בוסרית זה בחלק, הקלעה בחלק, היותר מתקדם מאחר שכבר היום, כבר בשלב הזה, הטכנולוגיה הזאת של הבינה המלאכותית בתחום עיבוד השפה.",
94
+ "gold_020_line_033": "ככל שהדבר הזה ישתכלל ויהיו על זה, אתה יודע, יבנו על זה אפליקציות מסחריות באותו אופן שבו הבאבט תורה של אפל או בגוגל, בחנות אפליקציות של גוגל.",
95
+ "gold_020_line_038": "אני לא חושב שאנחנו צריכים לחשוש למקום העבודה שלנו, אני כן חושב שהטכנולוגיה הזו, כמו כל טכנולוגיה מוצלחת, בסופו של דבר תשנה את שוק העבודה או תלתל ענפים שלמים.",
96
+ "gold_020_line_046": "אם אתה עכשיו תחשוב שאתה העורך דין או עורכת דין שעובדים על איזה שהוא כס הנורא סבוך ואתה מחפש התקדימים או מחפש הכל מיני תובנות מפסיקות קודמות או משהו כזה,",
97
+ "gold_020_line_056": "היא תגביר במקום לצמצם, אני אתחיל שנייה מהחלק של הזרועות היוצרים.",
98
+ "gold_021_line_003": "כשנשארים לי מטבעות אחרי שהסתבבתי בשוק ביום שישי, אני ישר נותן אותן לילדים שישימו בקופת החיסכון שלהם.",
99
+ "gold_021_line_014": "אולי הוא ישכנע גם אתכם להצטרף לעיגול לטובה?",
100
+ "gold_021_line_040": "הוא אחד מיזמי ההייטק הוותיקים שיש לנו.",
101
+ "gold_021_line_057": "והוא משמש בתור יושב הראש שלה עד היום.",
102
+ "gold_021_line_078": "הנגזר השלישי בישראל מגלגל מיליארדי שקלים בשנה.",
103
+ "gold_021_line_079": "לפי הערכת ארגון מידות שהוא חברה לתועלת הציבור שנסה לקדם פילנתרופיה אפקטיבית,"
104
+ },
105
+ "individual_wer": {
106
+ "gold_000_line_012": 0.125,
107
+ "gold_000_line_035": 0.14285714285714285,
108
+ "gold_000_line_037": 0.125,
109
+ "gold_000_line_089": 0.42857142857142855,
110
+ "gold_000_line_101": 0.4,
111
+ "gold_000_line_145": 0.3333333333333333,
112
+ "gold_000_line_148": 0.18181818181818182,
113
+ "gold_000_line_155": 0.15,
114
+ "gold_001_line_022": 0.125,
115
+ "gold_001_line_035": 0.3076923076923077,
116
+ "gold_001_line_052": 0.2,
117
+ "gold_001_line_069": 0.42857142857142855,
118
+ "gold_001_line_100": 0.14285714285714285,
119
+ "gold_001_line_120": 0.125,
120
+ "gold_001_line_182": 0.1111111111111111,
121
+ "gold_001_line_186": 0.14285714285714285,
122
+ "gold_001_line_223": 0.06666666666666667,
123
+ "gold_001_line_243": 0.25,
124
+ "gold_001_line_251": 0.26666666666666666,
125
+ "gold_001_line_290": 0.3333333333333333,
126
+ "gold_001_line_348": 0.1111111111111111,
127
+ "gold_001_line_362": 0.25,
128
+ "gold_001_line_443": 0.42857142857142855,
129
+ "gold_002_line_024": 0.2,
130
+ "gold_002_line_075": 0.14285714285714285,
131
+ "gold_002_line_103": 0.2777777777777778,
132
+ "gold_002_line_271": 0.18181818181818182,
133
+ "gold_002_line_279": 0.16666666666666666,
134
+ "gold_002_line_310": 0.1,
135
+ "gold_002_line_311": 0.2,
136
+ "gold_002_line_316": 0.25,
137
+ "gold_002_line_356": 0.45454545454545453,
138
+ "gold_002_line_364": 0.23529411764705882,
139
+ "gold_002_line_371": 0.1111111111111111,
140
+ "gold_003_line_008": 0.125,
141
+ "gold_003_line_011": 0.3333333333333333,
142
+ "gold_004_line_002": 0.25,
143
+ "gold_005_line_033": 0.3,
144
+ "gold_005_line_035": 0.07692307692307693,
145
+ "gold_005_line_072": 0.21428571428571427,
146
+ "gold_005_line_081": 0.375,
147
+ "gold_005_line_133": 0.07692307692307693,
148
+ "gold_005_line_150": 0.35714285714285715,
149
+ "gold_005_line_151": 0.12121212121212122,
150
+ "gold_005_line_193": 0.3,
151
+ "gold_005_line_197": 0.07692307692307693,
152
+ "gold_006_line_060": 0.2857142857142857,
153
+ "gold_007_line_013": 0.09090909090909091,
154
+ "gold_007_line_046": 0.2857142857142857,
155
+ "gold_007_line_087": 0.16,
156
+ "gold_007_line_094": 0.18181818181818182,
157
+ "gold_007_line_108": 0.2222222222222222,
158
+ "gold_007_line_145": 0.3333333333333333,
159
+ "gold_007_line_150": 0.26666666666666666,
160
+ "gold_007_line_152": 0.35714285714285715,
161
+ "gold_007_line_155": 0.15384615384615385,
162
+ "gold_008_line_036": 0.25,
163
+ "gold_008_line_068": 0.21052631578947367,
164
+ "gold_008_line_091": 0.125,
165
+ "gold_008_line_100": 0.125,
166
+ "gold_009_line_022": 0.14285714285714285,
167
+ "gold_009_line_091": 0.15,
168
+ "gold_009_line_103": 0.35,
169
+ "gold_010_line_023": 0.2727272727272727,
170
+ "gold_010_line_045": 0.29411764705882354,
171
+ "gold_010_line_063": 0.17647058823529413,
172
+ "gold_010_line_095": 0.16666666666666666,
173
+ "gold_010_line_102": 0.18181818181818182,
174
+ "gold_011_line_083": 0.25,
175
+ "gold_011_line_095": 0.25,
176
+ "gold_011_line_114": 0.3333333333333333,
177
+ "gold_012_line_055": 0.14285714285714285,
178
+ "gold_012_line_060": 0.1,
179
+ "gold_012_line_119": 0.2,
180
+ "gold_012_line_124": 0.38095238095238093,
181
+ "gold_012_line_133": 0.375,
182
+ "gold_012_line_136": 0.125,
183
+ "gold_013_line_002": 0.3157894736842105,
184
+ "gold_014_line_008": 0.2222222222222222,
185
+ "gold_015_line_015": 0.2857142857142857,
186
+ "gold_015_line_068": 0.3888888888888889,
187
+ "gold_015_line_071": 0.06666666666666667,
188
+ "gold_016_line_021": 0.125,
189
+ "gold_016_line_076": 0.25,
190
+ "gold_017_line_041": 0.4,
191
+ "gold_017_line_099": 0.3125,
192
+ "gold_017_line_144": 0.14285714285714285,
193
+ "gold_020_line_002": 0.11764705882352941,
194
+ "gold_020_line_006": 0.3076923076923077,
195
+ "gold_020_line_033": 0.3,
196
+ "gold_020_line_038": 0.21428571428571427,
197
+ "gold_020_line_046": 0.3333333333333333,
198
+ "gold_020_line_056": 0.3333333333333333,
199
+ "gold_021_line_003": 0.11764705882352941,
200
+ "gold_021_line_014": 0.125,
201
+ "gold_021_line_040": 0.2857142857142857,
202
+ "gold_021_line_057": 0.125,
203
+ "gold_021_line_078": 0.2857142857142857,
204
+ "gold_021_line_079": 0.25
205
+ },
206
+ "individual_cer": {
207
+ "gold_000_line_012": 0.1,
208
+ "gold_000_line_035": 0.06451612903225806,
209
+ "gold_000_line_037": 0.023255813953488372,
210
+ "gold_000_line_089": 0.0967741935483871,
211
+ "gold_000_line_101": 0.24390243902439024,
212
+ "gold_000_line_145": 0.09090909090909091,
213
+ "gold_000_line_148": 0.03636363636363636,
214
+ "gold_000_line_155": 0.026785714285714284,
215
+ "gold_001_line_022": 0.025,
216
+ "gold_001_line_035": 0.08771929824561403,
217
+ "gold_001_line_052": 0.0759493670886076,
218
+ "gold_001_line_069": 0.08108108108108109,
219
+ "gold_001_line_100": 0.03333333333333333,
220
+ "gold_001_line_120": 0.02040816326530612,
221
+ "gold_001_line_182": 0.018518518518518517,
222
+ "gold_001_line_186": 0.023255813953488372,
223
+ "gold_001_line_223": 0.013513513513513514,
224
+ "gold_001_line_243": 0.05128205128205128,
225
+ "gold_001_line_251": 0.06329113924050633,
226
+ "gold_001_line_290": 0.1111111111111111,
227
+ "gold_001_line_348": 0.02564102564102564,
228
+ "gold_001_line_362": 0.04878048780487805,
229
+ "gold_001_line_443": 0.09302325581395349,
230
+ "gold_002_line_024": 0.06944444444444445,
231
+ "gold_002_line_075": 0.027522935779816515,
232
+ "gold_002_line_103": 0.09734513274336283,
233
+ "gold_002_line_271": 0.11290322580645161,
234
+ "gold_002_line_279": 0.07352941176470588,
235
+ "gold_002_line_310": 0.017857142857142856,
236
+ "gold_002_line_311": 0.034482758620689655,
237
+ "gold_002_line_316": 0.09302325581395349,
238
+ "gold_002_line_356": 0.14705882352941177,
239
+ "gold_002_line_364": 0.04395604395604396,
240
+ "gold_002_line_371": 0.024390243902439025,
241
+ "gold_003_line_008": 0.02702702702702703,
242
+ "gold_003_line_011": 0.11764705882352941,
243
+ "gold_004_line_002": 0.045454545454545456,
244
+ "gold_005_line_033": 0.05,
245
+ "gold_005_line_035": 0.015384615384615385,
246
+ "gold_005_line_072": 0.04819277108433735,
247
+ "gold_005_line_081": 0.06976744186046512,
248
+ "gold_005_line_133": 0.01818181818181818,
249
+ "gold_005_line_150": 0.09523809523809523,
250
+ "gold_005_line_151": 0.029585798816568046,
251
+ "gold_005_line_193": 0.07017543859649122,
252
+ "gold_005_line_197": 0.022388059701492536,
253
+ "gold_006_line_060": 0.043478260869565216,
254
+ "gold_007_line_013": 0.018867924528301886,
255
+ "gold_007_line_046": 0.05263157894736842,
256
+ "gold_007_line_087": 0.047244094488188976,
257
+ "gold_007_line_094": 0.0392156862745098,
258
+ "gold_007_line_108": 0.04081632653061224,
259
+ "gold_007_line_145": 0.11392405063291139,
260
+ "gold_007_line_150": 0.0641025641025641,
261
+ "gold_007_line_152": 0.08450704225352113,
262
+ "gold_007_line_155": 0.046153846153846156,
263
+ "gold_008_line_036": 0.10714285714285714,
264
+ "gold_008_line_068": 0.04,
265
+ "gold_008_line_091": 0.025,
266
+ "gold_008_line_100": 0.023076923076923078,
267
+ "gold_009_line_022": 0.023529411764705882,
268
+ "gold_009_line_091": 0.02608695652173913,
269
+ "gold_009_line_103": 0.08,
270
+ "gold_010_line_023": 0.07692307692307693,
271
+ "gold_010_line_045": 0.07954545454545454,
272
+ "gold_010_line_063": 0.09411764705882353,
273
+ "gold_010_line_095": 0.0625,
274
+ "gold_010_line_102": 0.058823529411764705,
275
+ "gold_011_line_083": 0.08571428571428572,
276
+ "gold_011_line_095": 0.041666666666666664,
277
+ "gold_011_line_114": 0.08888888888888889,
278
+ "gold_012_line_055": 0.075,
279
+ "gold_012_line_060": 0.02127659574468085,
280
+ "gold_012_line_119": 0.037037037037037035,
281
+ "gold_012_line_124": 0.10989010989010989,
282
+ "gold_012_line_133": 0.08108108108108109,
283
+ "gold_012_line_136": 0.07692307692307693,
284
+ "gold_013_line_002": 0.08928571428571429,
285
+ "gold_014_line_008": 0.0625,
286
+ "gold_015_line_015": 0.058823529411764705,
287
+ "gold_015_line_068": 0.125,
288
+ "gold_015_line_071": 0.0136986301369863,
289
+ "gold_016_line_021": 0.023255813953488372,
290
+ "gold_016_line_076": 0.043478260869565216,
291
+ "gold_017_line_041": 0.13333333333333333,
292
+ "gold_017_line_099": 0.09782608695652174,
293
+ "gold_017_line_144": 0.022727272727272728,
294
+ "gold_020_line_002": 0.024096385542168676,
295
+ "gold_020_line_006": 0.05925925925925926,
296
+ "gold_020_line_033": 0.1103448275862069,
297
+ "gold_020_line_038": 0.05263157894736842,
298
+ "gold_020_line_046": 0.0949367088607595,
299
+ "gold_020_line_056": 0.09375,
300
+ "gold_021_line_003": 0.02040816326530612,
301
+ "gold_021_line_014": 0.023809523809523808,
302
+ "gold_021_line_040": 0.05263157894736842,
303
+ "gold_021_line_057": 0.027777777777777776,
304
+ "gold_021_line_078": 0.06521739130434782,
305
+ "gold_021_line_079": 0.039473684210526314
306
+ }
307
+ }
comparison/todo.txt CHANGED
@@ -4,6 +4,7 @@
4
  Audio files for comparison:
5
  Lothm + Unvocalized
6
  HebTTS + Unvocalized
 
7
  Ours + Phonikud
8
 
9
  MMS + Nakdimon
 
4
  Audio files for comparison:
5
  Lothm + Unvocalized
6
  HebTTS + Unvocalized
7
+ Saspeech + Nakdimon
8
  Ours + Phonikud
9
 
10
  MMS + Nakdimon
comparison/tts_gen/piper.py ADDED
@@ -0,0 +1,34 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ """
2
+ uv pip install piper-onnx phonikud
3
+ wget https://huggingface.co/thewh1teagle/phonikud-tts-checkpoints/resolve/main/model.onnx -O ilspeech.onnx
4
+ wget https://huggingface.co/thewh1teagle/phonikud-tts-checkpoints/resolve/main/model.config.json -O ilspeech.onnx.json
5
+ """
6
+ import pandas as pd
7
+ from pathlib import Path
8
+ import soundfile as sf
9
+ from piper_onnx import Piper
10
+ import phonikud
11
+
12
+ # Set up paths
13
+ csv_path = Path("/Volumes/Internal/audio/phonikud-experiments/comparison/sentences/saspeech_male_phonikud.csv")
14
+ output_dir = Path("./saspeech_male_phonikud_wav1")
15
+ output_dir.mkdir(parents=True, exist_ok=True)
16
+
17
+ # Load Piper model
18
+ piper = Piper('ilspeech.onnx', 'ilspeech.onnx.json')
19
+
20
+ # Load CSV
21
+ df = pd.read_csv(csv_path, sep=',', header=None, names=['file_id', 'text'], index_col=False)
22
+
23
+ # Generate audio
24
+ for _, row in df.iterrows():
25
+ file_id = row['file_id']
26
+ text = row['text']
27
+
28
+ phonemes = phonikud.phonemize(text)
29
+ samples, sample_rate = piper.create(phonemes, is_phonemes = True)
30
+ out_path = output_dir / f"{file_id}.wav"
31
+ sf.write(out_path, samples, sample_rate)
32
+ print(f"Saved {out_path} ({len(samples)/sample_rate:.2f}s)")
33
+
34
+ print("Done.")