thewh1teagle commited on
Commit
74029f0
·
unverified ·
1 Parent(s): b7715c8

Update file paths for CSV and model in Piper TTS script

Browse files

- Changed CSV path to point to the new dataset location:
/Users/user/Documents/audio/phonikud-experiments/comparison/sentences/saspeech_male_phonikud.csv
- Updated model path to use the new ONNX model:
/Users/user/Documents/audio/phonikud-experiments/comparison/model (4).onnx

comparison/audio/ilspeech_male_phonikud_piper_report.json CHANGED
@@ -1,307 +1,307 @@
1
  {
2
- "mean_wer": 0.23787531296819214,
3
- "mean_cer": 0.06460739615612632,
4
  "transcripts": {
5
- "gold_000_line_035": "אבל חלק מזה זה גם מעבר לזה זאת אומרת, הם יודעים שעם המתחרה שלהם.",
6
- "gold_000_line_037": "השיתוף פעולה עם איזשהו עיתון או טלוויזיה, כי ראינו את הכנסים האלה קורים גם בטלוויזיות.",
7
  "gold_000_line_089": "נכון, הם לא מודעים לזה בכלל ואגב.",
8
- "gold_000_line_101": "אז זה די מתאים לראות, לראות את זה לאור יום.",
9
  "gold_000_line_145": "המלאה לגבי מה שהולך בישראל ובעולם ואיך נראים החיים הסיכוי שזה הוא יותר גדול.",
10
- "gold_000_line_148": "ולכן, אם נצרוך כמה שיותר נצליח, לקבל תמונה כמה שיותר טובה.",
11
- "gold_000_line_155": "אה נמצאים בבעיה אחרת כי יש לנו לחצים של פוליטיקאים כי הפוליטיקאים ברצותם הם יכולים לסגור את תאגיד השידור הציבורי.",
12
- "gold_001_line_022": "אבל באמת נוגים מפיעים את זה משהו בפנים.",
13
- "gold_001_line_035": "או בעצם זה כל מה שנשאר רק הזיכרונות וגם הם כבר די ידועים.",
14
  "gold_001_line_052": "ליד אחת החנויות הסמוכות היו המון דברים על הרצפה, פסקיות, בלי שקיות מה שאתם רוצים.",
15
  "gold_001_line_069": "לפני שנתחיל ביקשתי ממנו שיציג את עצמו.",
16
  "gold_001_line_100": "אדם שלח לי סרטון של הדירה הזאת.",
17
  "gold_001_line_120": "והנה אנחנו מגיעים לאחד החלקים המסובכים בסיפור הזה.",
18
  "gold_001_line_182": "ובעזרת מתנדבים התחילו לפזר את התרומות האלה בין המחסנים.",
19
- "gold_001_line_186": "הררים הררים של חולצות ומכנסאים ובגדים אחרים.",
20
  "gold_001_line_223": "ואת זה שאחת הדרכים שלא להתחרות הייתה להציע חצי שנה של תשלומי שכר דירה מראש.",
21
- "gold_001_line_243": "זה לקח לא מעט אייטמים בתקשורת גם אצלהם.",
22
  "gold_001_line_251": "קצת לחץ בתקשורת וחברות הביטוח הבינו שעדיף להן לא להתעסק יותר מדי עם הדבר הזה.",
23
- "gold_001_line_290": "כלומר, רוקי אחד הבניינים קרא סביר מאוד להניח שהנבר לא יחזרו לגור בבניינים שעדיין נותרו לעמוד ושמתאישרו יהרסו גם אותה.",
24
  "gold_001_line_348": "עוד שנייה היא העלה מקום חדש לקרוא לו בית.",
25
- "gold_001_line_362": "כלל ומגדל עדיין עשו בעיות גם חברת האלו.",
26
  "gold_001_line_443": "עמוק בתוך הידיעה נכתב שבמקום ארבעת הבניינים.",
27
  "gold_002_line_024": "לפני שלוש שנים הוא בכלל היה בצד השני של העולם, בבית שלא בפרבר של פידל פיה.",
28
- "gold_002_line_075": "השאלה הזו מטרידה לא רק אותו, אלא את הנגידים של בנקים מרכזיים ברחבי העולם כולו, ��היא צריכה להטריד מאוד גם אותה.",
29
- "gold_002_line_103": "אז זה קורה מכל מיני סיבות שקשורות לאיתושות הכלכלית, ובפרט לצורה מאוד ספציפית של האיתושות הכלכלית מהשנה הקודמת.",
30
  "gold_002_line_271": "ועצם ההחלטה שלו עצמו עלולה להזין את הציפיות לאינפלציה עוד יותר.",
31
  "gold_002_line_279": "כלומר שעור שאנחנו הולכים לאינפלציה שהיא בסדר מבחינת היעד של בנק ישראל.",
32
- "gold_002_line_310": "פשוט כי האינפלציה כאן היא עדיין נמוכה ביחס למדינות אחר.",
33
  "gold_002_line_311": "בשביל לסבר לכם את האוזן, מדינות רבות סובלות עכשיו מאינפלציה.",
34
- "gold_002_line_316": "במדינות אחרות זה טיפה רגוע יותר ועדיין גבוה.",
35
- "gold_002_line_356": "בארצות הברית, בינתיים מכאן שהאינפלציה השנתית כבר חצתה את השישה אחוזים.",
36
  "gold_002_line_364": "הוא כתב שם שאינפלציה שנובעת מתחממות יתר של הכלכלה יונן בעיה שמתגמדת אל מול מגפה עולמית.",
37
  "gold_002_line_371": "אם יש לכם שאלות או מחשבות בעקבות הפרק הזה.",
38
- "gold_003_line_008": "בזמן שהיה כאן הוא מפגש עם ראש הממשלה.",
39
- "gold_003_line_011": "נפגשתי עם קורמן בבוקר ירושלמי קרייר באמצע שבוע שעבר.",
40
- "gold_004_line_002": "כי בכל זאת אנחנו פודקאסט ישראלי שקורה בישראל.",
41
  "gold_005_line_033": "המוצרים הראשונים שראינו ושאתם רואים בסופר לא נמצאים שם במקרה.",
42
- "gold_005_line_035": "יש לא מעט מחקרים ועדויות של בעלי חנויות שמראים שיש סיכוי לא רע שתשימו בעגלה את הדבר הראשון שיריתם גם אם אפילו לא תכננתם לקנות אותו.",
43
- "gold_005_line_072": "גם הרגע שבו הסוטרמרקט הגיע לישראל שיקף את המהפכה התרבותית שהמדינה הצעירה עמדה לעבור.",
44
- "gold_005_line_081": "האוכל לא הגיע אז באריזות אישיות לשימוש ביתי.",
45
  "gold_005_line_133": "זה אומר את זה כי הם בוחרים לדחוף לנו בעיקר מזון לא בריא.",
46
- "gold_005_line_150": "דבר ראשון סופרמרקטים דווקא כן נוחפים במבצעים נוצרים שהם לא ריחים להם כמו חיתולים.",
47
- "gold_005_line_151": "זו הדרך שלהם, ימשוך עליהם קהל של הורים צעירים, למשל, שיבואו לקנות את החתומים אולי במחיר הפסד, אבל כבר יעשו את כל הקניות שלהם על הדרך ויקנו גם את המוצרים הרווחיים יותר סופר.",
48
- "gold_005_line_193": "זו בדיוק העבודה של דריאמינו וימי מרכז המידע לבריאות הציבור.",
49
- "gold_005_line_197": "אבל אפילו בלי הממשלה ובלי המדינה יש עוד משהו שיכול לגרום לב��לי הסופרים להתחיל לשנות את מה שהם נוחים ואת מה שהם מציגים בשביל שנקנה לו.",
50
  "gold_006_line_060": "הבוסות בכל העולם התחילו לקרוס באחוזים ניכרים.",
51
- "gold_007_line_013": "אז השנה נוספו הכבישים עוד רבע מיליון כאלה שזה קצב שיא.",
52
- "gold_007_line_046": "בן מאיר הגיע לתפקיד הזכרי ששימש כסמנכ\"ל הכספים והמשנה למנכ\"ל של חברת מוריה.",
53
  "gold_007_line_087": "או ליתר דיוקי לא רואה משבר דיור אלא היא רואה מות אלפי זוגות צעירים שעוד שנייה עלולים לצעוק עליה שוב שמחירי הדיור גבוהים מדי.",
54
  "gold_007_line_094": "זה לא הכיוון הנכון ללכת בו, אבל זה מה שהממשלות עושות.",
55
- "gold_007_line_108": "ואז שרת התחבורה רגב החליטה שהיא רוצה לתת את התקציבים.",
56
- "gold_007_line_145": "במהלך השבוע עצמו אני רוכב לעבודה באופניים הלא חז, בסך הכל 10 דקות לכל כיוון.",
57
- "gold_007_line_150": "נמאס לי לחלוטין לעמוד בפקקים, נמאס לי מהלחץ, נמאס לי מחיפושי החניה, פשוט נמאס לי.",
58
- "gold_007_line_152": "לעתים מחוקות אני משתמש באותו ובכל פעם שאני עושה את זה, אני מתחרט ומקלה.",
59
- "gold_007_line_155": "האם אני מטיף לכל מי שאני רק יכול בעבודה, שנסעו את התחבורה הציבורית?",
60
- "gold_008_line_036": "היום כבר כמעט שאין בישראל בית ספר כמו זה ששמעון נשלח אליו בשנות ה-80 ללמוד נגרות.",
61
  "gold_008_line_068": "ולכן הוא הציע לממשלה לדון ברצינות בהקמה לדחייה של מערך החינוך המקצועי, וההצעה הזאת לא עברה כל כך טוב.",
62
  "gold_008_line_091": "הנה אני אגיד שוב את השני משפטים האחרונים.",
63
- "gold_008_line_100": "אני באופן אישי אחרי איזושהי תקופה, אם גוגב פודקאסטס, עברתי לאחרונה לספוטיפיי לא לגמרי בטוח למה, אבל האמת היא שאנחנו בכל מקום, בכל מקום.",
64
  "gold_009_line_022": "אם תעברו אותו תוכלו ללכת לתיכון עיוני, כלומר ללמוד מתמטיקה ואנגלית ועוד מקצועות לבגרות.",
65
- "gold_009_line_091": "ושלכן הוא ידיל את המוביליות החברתית של אוטונוב וגם את ההכנסה העתידית שלו, כלומר שחינוך מקצועי מסייע לצמצום תערים.",
66
- "gold_009_line_103": "שהיא רק עדלי כתב את החינוך של הארץ. המון תודה שיזנת את הפרק הזה ושעשית אותו איתנו תמיד כיף לארח אותך אצלנו.",
67
- "gold_010_line_023": "וגם אצלנו בישראל, לשכת התעסוקה דיווחה על עלייה במספר המתפטרים.",
68
- "gold_010_line_045": "אתה לשוב אם אתה אמור לחשוב שהעבודה מגניבה שהיא משנה את העולם, להרגיש שהיא חלק מהזהות שלך.",
69
- "gold_010_line_063": "זה הרבה יותר חשוב מאשר לשמור על הבריאות שלהם.",
70
- "gold_010_line_095": "האמת שהרבה פעמים נראה לי שריגונים לא כל כך אכפת שהעובדים נשחקים.",
71
- "gold_010_line_102": "ככה שתוכל להתעדכן כי אתה בטח נורא סקרן לדעת מה הולך בזמן שאתה לא נמצא ואתה חופש איפו שבוע לים או משף.",
72
- "gold_011_line_083": "אין לי מושג אם זה בכלל אפשרי משפטית.",
73
- "gold_011_line_095": "בשנים האחרונות, שמדברים על כלכלה ועל המגזר העסקי.",
74
- "gold_011_line_114": "במערכת חיות כיס חברות גם דנה פרנק וצהיל אברהם.",
75
  "gold_012_line_055": "אבל בין היתר גם סיבות כלכליות ותיירותיות.",
76
- "gold_012_line_060": "אתר התבילה הפך להיות בבת אחת חלק משטח צבאי סגור.",
77
- "gold_012_line_119": "מתרגזת בכל פעם ומתרגזת מאוד בכל פעם שישראל טוענת אחרת.",
78
- "gold_012_line_124": "למה הם לא ממסחרים את אתר הטבילה? כי זה מקום קדוש, הם אומרים, זה לא מתאים, זה כמו מסחרת הכותל.",
79
  "gold_012_line_133": "עושר עילאי שאין שני לא כאלה מין דברים.",
80
  "gold_012_line_136": "ואפילו איזה דג שמישהו סיפר שישו פעם אחת.",
81
- "gold_013_line_002": "והסיפור על איך המקור הגיע לבורסה ולמה סעודים החליטו למכור בכלל כמה אחוזים מהבולנזה הכלכלית שלהם הוא סיפור מרתק.",
82
- "gold_014_line_008": "אחרי שהפרק ההוא שודר הוצפתי בתגובות שלכם, באמת המון המון תגובות המון אנשים אמרו שהם רוצים עוד מזה.",
83
- "gold_015_line_015": "האם זה משהו כללי המדינה? טוענת שכן.",
84
- "gold_015_line_068": "לרמה הזאת שהעיתונאים התחילו להפעיל על עצמם צמזורה עצמית, פעם שמעתי את אילנה דן מדברת, הזווי.",
85
- "gold_015_line_071": "כי הם מבינים שיש איזושהי רוח מפקד ושאם הם יכתבו אחרת הידיעה פשוט לא תעבור.",
86
  "gold_016_line_021": "איך אנחנו יכולים להאמין למילה ממה שאתה אומר?",
87
- "gold_016_line_076": "זה פשוט משחית את התקשורת, כי התמונה שהקורות קוראים צופות צופים מקבים.",
88
  "gold_017_line_041": "אם תשנו את ההנחות של המודל, תשנו גם את התוצאות.",
89
- "gold_017_line_048": "בעקבות הישיבה, הוחלט על הטלת סגר על ישראל.",
90
- "gold_017_line_099": "הם כמו למשל במספר מכונות ההנשמה שהוזנו הרבה הרבה הרבה מעבר ליעד שנקבע הובלות של מיליארדים.",
91
- "gold_017_line_144": "ניסינו ששני הרעיונות יכללו קטעים אחרים לגמרי.",
92
- "gold_020_line_002": "וכי אז בוא נלך מהקל אל הכבד בחלק הקל על אף שכבר עכשיו הטכנולוגיה מאוד מאוד מרשימה.",
93
- "gold_020_line_006": "אבל לא היא עדיין מוסרית זה בחלק, הקלע בחלק היותר מתקדם מאחר שכבר היום כבר בשלב הזה הטכנולוגיה הזאת של הבינה המלאכותית בתחום עיבוד השפה.",
94
- "gold_020_line_033": "ככל שהדבר הזה ישתכלל ויהיו על זה, אתה יודע, יבנו על זה אפליקציות מסחריות באותו אופן שבו הבאבסטורה של אפל או בגוגל אפל בחנות אפליקציות של רובי.",
95
- "gold_020_line_038": "אני לא חושב שאנחנו צריכים לחשוש למקום העבודה שלנו, אני כן חושב שהטכנולוגיה הזו, כמו כל טכנולוגיה מוצלחת בסופו של דבר, תשנה את שוק העבודה או תלתל ענפים שלמים.",
96
- "gold_020_line_046": "אם אתה עכשיו תחשוב שאתה העורך דין או עורכת דין שעובדים על איזשהו קיס הנורא סבוך ואתה מחפש התקדימים או מחפש הכל מיני תובנות מציקות קודמות או משהו כזה.",
97
- "gold_020_line_056": "היא תגביר במקום לצמצם. אני אתחיל לשנייה מהחלק של הזכויות היוצרים.",
98
- "gold_021_line_003": "כשנשארים לי מטבעות אחרי שהסתבסתי בשוק ביום ששייני ישר נותן אותן לילדים שישימו בקופת החיסכון שלהם.",
99
  "gold_021_line_014": "אולי הוא ישכנע גם אתכם להצטרף לעיגול לטובה.",
100
- "gold_021_line_040": "הוא אחד מיזמי ההייטק הוותיקים שיש לנו.",
101
  "gold_021_line_057": "והוא משמש בתור יושב הראש שלה עד היום.",
102
- "gold_021_line_078": "המגזר השלישי בישראל מגגל מיליארדי שקלים בשנה.",
103
- "gold_021_line_079": "לפי הערכת ארגון מידות שהוא חברה לתועלת הציבור שנסה לקדם פילנתרופיה אפקטיבית."
104
  },
105
  "individual_wer": {
106
- "gold_000_line_035": 0.21428571428571427,
107
- "gold_000_line_037": 0.25,
108
  "gold_000_line_089": 0.2857142857142857,
109
- "gold_000_line_101": 0.5,
110
  "gold_000_line_145": 0.2,
111
- "gold_000_line_148": 0.2727272727272727,
112
- "gold_000_line_155": 0.05,
113
- "gold_001_line_022": 0.375,
114
- "gold_001_line_035": 0.15384615384615385,
115
  "gold_001_line_052": 0.2,
116
  "gold_001_line_069": 0.14285714285714285,
117
  "gold_001_line_100": 0.14285714285714285,
118
  "gold_001_line_120": 0.125,
119
  "gold_001_line_182": 0.1111111111111111,
120
- "gold_001_line_186": 0.2857142857142857,
121
  "gold_001_line_223": 0.13333333333333333,
122
- "gold_001_line_243": 0.25,
123
  "gold_001_line_251": 0.26666666666666666,
124
- "gold_001_line_290": 0.3333333333333333,
125
  "gold_001_line_348": 0.3333333333333333,
126
- "gold_001_line_362": 0.25,
127
  "gold_001_line_443": 0.14285714285714285,
128
  "gold_002_line_024": 0.26666666666666666,
129
- "gold_002_line_075": 0.19047619047619047,
130
  "gold_002_line_103": 0.2777777777777778,
131
  "gold_002_line_271": 0.09090909090909091,
132
  "gold_002_line_279": 0.16666666666666666,
133
  "gold_002_line_310": 0.1,
134
  "gold_002_line_311": 0.2,
135
- "gold_002_line_316": 0.125,
136
- "gold_002_line_356": 0.2727272727272727,
137
  "gold_002_line_364": 0.17647058823529413,
138
  "gold_002_line_371": 0.1111111111111111,
139
  "gold_003_line_008": 0.25,
140
- "gold_003_line_011": 0.3333333333333333,
141
- "gold_004_line_002": 0.125,
142
  "gold_005_line_033": 0.1,
143
- "gold_005_line_035": 0.07692307692307693,
144
- "gold_005_line_072": 0.14285714285714285,
145
- "gold_005_line_081": 0.375,
146
  "gold_005_line_133": 0.07692307692307693,
147
- "gold_005_line_150": 0.35714285714285715,
148
- "gold_005_line_151": 0.24242424242424243,
149
- "gold_005_line_193": 0.4,
150
- "gold_005_line_197": 0.11538461538461539,
151
  "gold_006_line_060": 0.42857142857142855,
152
  "gold_007_line_013": 0.18181818181818182,
153
- "gold_007_line_046": 0.42857142857142855,
154
  "gold_007_line_087": 0.16,
155
  "gold_007_line_094": 0.18181818181818182,
156
- "gold_007_line_108": 0.3333333333333333,
157
  "gold_007_line_145": 0.3333333333333333,
158
- "gold_007_line_150": 0.26666666666666666,
159
- "gold_007_line_152": 0.42857142857142855,
160
- "gold_007_line_155": 0.23076923076923078,
161
- "gold_008_line_036": 0.1875,
162
  "gold_008_line_068": 0.21052631578947367,
163
  "gold_008_line_091": 0.125,
164
  "gold_008_line_100": 0.3333333333333333,
165
  "gold_009_line_022": 0.14285714285714285,
166
  "gold_009_line_091": 0.3,
167
- "gold_009_line_103": 0.4,
168
- "gold_010_line_023": 0.36363636363636365,
169
- "gold_010_line_045": 0.17647058823529413,
170
- "gold_010_line_063": 0.5294117647058824,
171
- "gold_010_line_095": 0.16666666666666666,
172
- "gold_010_line_102": 0.22727272727272727,
173
- "gold_011_line_083": 0.125,
174
- "gold_011_line_095": 0.375,
175
- "gold_011_line_114": 0.2222222222222222,
176
  "gold_012_line_055": 0.14285714285714285,
177
- "gold_012_line_060": 0.2,
178
  "gold_012_line_119": 0.2,
179
  "gold_012_line_124": 0.3333333333333333,
180
  "gold_012_line_133": 0.375,
181
  "gold_012_line_136": 0.125,
182
  "gold_013_line_002": 0.2631578947368421,
183
- "gold_014_line_008": 0.1111111111111111,
184
- "gold_015_line_015": 0.42857142857142855,
185
- "gold_015_line_068": 0.3888888888888889,
186
- "gold_015_line_071": 0.06666666666666667,
187
  "gold_016_line_021": 0.125,
188
- "gold_016_line_076": 0.25,
189
  "gold_017_line_041": 0.2,
190
- "gold_017_line_048": 0.4444444444444444,
191
- "gold_017_line_099": 0.3125,
192
- "gold_017_line_144": 0.14285714285714285,
193
- "gold_020_line_002": 0.11764705882352941,
194
- "gold_020_line_006": 0.19230769230769232,
195
  "gold_020_line_033": 0.26666666666666666,
196
- "gold_020_line_038": 0.21428571428571427,
197
- "gold_020_line_046": 0.3333333333333333,
198
- "gold_020_line_056": 0.4166666666666667,
199
- "gold_021_line_003": 0.23529411764705882,
200
  "gold_021_line_014": 0.125,
201
  "gold_021_line_040": 0.2857142857142857,
202
  "gold_021_line_057": 0.125,
203
- "gold_021_line_078": 0.42857142857142855,
204
- "gold_021_line_079": 0.25
205
  },
206
  "individual_cer": {
207
- "gold_000_line_035": 0.04838709677419355,
208
- "gold_000_line_037": 0.05813953488372093,
209
  "gold_000_line_089": 0.06451612903225806,
210
- "gold_000_line_101": 0.17073170731707318,
211
  "gold_000_line_145": 0.03896103896103896,
212
- "gold_000_line_148": 0.05454545454545454,
213
- "gold_000_line_155": 0.008928571428571428,
214
- "gold_001_line_022": 0.1,
215
- "gold_001_line_035": 0.08771929824561403,
216
  "gold_001_line_052": 0.0759493670886076,
217
  "gold_001_line_069": 0.02702702702702703,
218
  "gold_001_line_100": 0.03333333333333333,
219
  "gold_001_line_120": 0.02040816326530612,
220
  "gold_001_line_182": 0.018518518518518517,
221
- "gold_001_line_186": 0.046511627906976744,
222
  "gold_001_line_223": 0.02702702702702703,
223
- "gold_001_line_243": 0.10256410256410256,
224
  "gold_001_line_251": 0.05063291139240506,
225
- "gold_001_line_290": 0.09401709401709402,
226
  "gold_001_line_348": 0.1282051282051282,
227
- "gold_001_line_362": 0.12195121951219512,
228
  "gold_001_line_443": 0.023255813953488372,
229
  "gold_002_line_024": 0.06944444444444445,
230
- "gold_002_line_075": 0.045871559633027525,
231
- "gold_002_line_103": 0.07964601769911504,
232
  "gold_002_line_271": 0.016129032258064516,
233
  "gold_002_line_279": 0.04411764705882353,
234
- "gold_002_line_310": 0.03571428571428571,
235
  "gold_002_line_311": 0.034482758620689655,
236
- "gold_002_line_316": 0.023255813953488372,
237
- "gold_002_line_356": 0.07352941176470588,
238
  "gold_002_line_364": 0.07692307692307693,
239
  "gold_002_line_371": 0.024390243902439025,
240
- "gold_003_line_008": 0.08108108108108109,
241
- "gold_003_line_011": 0.058823529411764705,
242
- "gold_004_line_002": 0.022727272727272728,
243
  "gold_005_line_033": 0.016666666666666666,
244
- "gold_005_line_035": 0.023076923076923078,
245
- "gold_005_line_072": 0.024096385542168676,
246
- "gold_005_line_081": 0.06976744186046512,
247
  "gold_005_line_133": 0.01818181818181818,
248
- "gold_005_line_150": 0.08333333333333333,
249
- "gold_005_line_151": 0.05917159763313609,
250
- "gold_005_line_193": 0.14035087719298245,
251
- "gold_005_line_197": 0.04477611940298507,
252
  "gold_006_line_060": 0.06521739130434782,
253
- "gold_007_line_013": 0.03773584905660377,
254
- "gold_007_line_046": 0.10526315789473684,
255
  "gold_007_line_087": 0.03937007874015748,
256
  "gold_007_line_094": 0.0392156862745098,
257
- "gold_007_line_108": 0.12244897959183673,
258
  "gold_007_line_145": 0.11392405063291139,
259
- "gold_007_line_150": 0.0641025641025641,
260
  "gold_007_line_152": 0.09859154929577464,
261
- "gold_007_line_155": 0.06153846153846154,
262
- "gold_008_line_036": 0.09523809523809523,
263
  "gold_008_line_068": 0.04,
264
  "gold_008_line_091": 0.025,
265
  "gold_008_line_100": 0.06153846153846154,
266
  "gold_009_line_022": 0.023529411764705882,
267
- "gold_009_line_091": 0.0782608695652174,
268
  "gold_009_line_103": 0.11,
269
- "gold_010_line_023": 0.09230769230769231,
270
- "gold_010_line_045": 0.045454545454545456,
271
- "gold_010_line_063": 0.49411764705882355,
272
- "gold_010_line_095": 0.0625,
273
- "gold_010_line_102": 0.08823529411764706,
274
- "gold_011_line_083": 0.02857142857142857,
275
- "gold_011_line_095": 0.0625,
276
- "gold_011_line_114": 0.044444444444444446,
277
  "gold_012_line_055": 0.025,
278
- "gold_012_line_060": 0.0425531914893617,
279
  "gold_012_line_119": 0.037037037037037035,
280
- "gold_012_line_124": 0.0989010989010989,
281
  "gold_012_line_133": 0.08108108108108109,
282
  "gold_012_line_136": 0.07692307692307693,
283
  "gold_013_line_002": 0.0625,
284
- "gold_014_line_008": 0.020833333333333332,
285
- "gold_015_line_015": 0.11764705882352941,
286
- "gold_015_line_068": 0.11458333333333333,
287
- "gold_015_line_071": 0.0136986301369863,
288
  "gold_016_line_021": 0.023255813953488372,
289
  "gold_016_line_076": 0.057971014492753624,
290
  "gold_017_line_041": 0.044444444444444446,
291
- "gold_017_line_048": 0.15217391304347827,
292
- "gold_017_line_099": 0.07608695652173914,
293
- "gold_017_line_144": 0.022727272727272728,
294
- "gold_020_line_002": 0.04819277108433735,
295
- "gold_020_line_006": 0.044444444444444446,
296
- "gold_020_line_033": 0.10344827586206896,
297
- "gold_020_line_038": 0.05263157894736842,
298
  "gold_020_line_046": 0.0759493670886076,
299
- "gold_020_line_056": 0.078125,
300
- "gold_021_line_003": 0.05102040816326531,
301
  "gold_021_line_014": 0.023809523809523808,
302
- "gold_021_line_040": 0.05263157894736842,
303
  "gold_021_line_057": 0.027777777777777776,
304
- "gold_021_line_078": 0.06521739130434782,
305
- "gold_021_line_079": 0.039473684210526314
306
  }
307
  }
 
1
  {
2
+ "mean_wer": 0.22984472699642972,
3
+ "mean_cer": 0.061462013831295466,
4
  "transcripts": {
5
+ "gold_000_line_035": "אבל חלק מזה זה גם מעבר לזה, זאת אומרת, הם יודעים שעם המתחרה שלהם.",
6
+ "gold_000_line_037": "על שיתוף פעולה עם איזשהו עיתון או טלוויזיה, כי ראינו את הכנסים האלה קורים גם בטלוויזיות.",
7
  "gold_000_line_089": "נכון, הם לא מודעים לזה בכלל ואגב.",
8
+ "gold_000_line_101": "אז זה די מתאים לראות, לראות את זה לאור יום.",
9
  "gold_000_line_145": "המלאה לגבי מה שהולך בישראל ובעולם ואיך נראים החיים הסיכוי שזה הוא יותר גדול.",
10
+ "gold_000_line_148": "ולכן אם נצרוך כמה שיותר נצליח לקבל תמונה כמה שיותר טובה.",
11
+ "gold_000_line_155": "הנמצאים בבעיה אחרת כי יש לנו לחצים של פוליטיקאים כי הפוליטיקאים ברצותם הם יכולים לסגור את תאגיד השידור הציבורי.",
12
+ "gold_001_line_022": "אבל באמת נוגעים מפעילים את זה משהו בפנים.",
13
+ "gold_001_line_035": "או בעצם זה כל מה שנשאר רק הזיכרונות, וגם הם כבר די ידועים.",
14
  "gold_001_line_052": "ליד אחת החנויות הסמוכות היו המון דברים על הרצפה, פסקיות, בלי שקיות מה שאתם רוצים.",
15
  "gold_001_line_069": "לפני שנתחיל ביקשתי ממנו שיציג את עצמו.",
16
  "gold_001_line_100": "אדם שלח לי סרטון של הדירה הזאת.",
17
  "gold_001_line_120": "והנה אנחנו מגיעים לאחד החלקים המסובכים בסיפור הזה.",
18
  "gold_001_line_182": "ובעזרת מתנדבים התחילו לפזר את התרומות האלה בין המחסנים.",
19
+ "gold_001_line_186": "הררים הררים של חולצות ומכנסיים ובגדים אחרים.",
20
  "gold_001_line_223": "ואת זה שאחת הדרכים שלא להתחרות הייתה להציע חצי שנה של תשלומי שכר דירה מראש.",
21
+ "gold_001_line_243": "זה לקח לא מעט איטמים בתקשורת גם אצלנו.",
22
  "gold_001_line_251": "קצת לחץ בתקשורת וחברות הביטוח הבינו שעדיף להן לא להתעסק יותר מדי עם הדבר הזה.",
23
+ "gold_001_line_290": "כלומר, וכאחד הבניינים קרה סביר מאוד להניח שענבר לא יחזרו לגור בבניינים שעדיין נותרו לעמוד ושמיתה שהוא יעשו גם אותה.",
24
  "gold_001_line_348": "עוד שנייה היא העלה מקום חדש לקרוא לו בית.",
25
+ "gold_001_line_362": "כלל ומגדל עדיין עשו בעיות גם בחברת איילון.",
26
  "gold_001_line_443": "עמוק בתוך הידיעה נכתב שבמקום ארבעת הבניינים.",
27
  "gold_002_line_024": "לפני שלוש שנים הוא בכלל היה בצד השני של העולם, בבית שלא בפרבר של פידל פיה.",
28
+ "gold_002_line_075": "והשאלה הזו מטרידה לא רק אותו, אלא את הנגידים של בנקים מרכזיים ברחבי העולם כולו, והיא צריכה להטריד מאוד גם אותה.",
29
+ "gold_002_line_103": "אז זה קורה מכל מיני סיבות שקשורות להתרשות הכלכלית, ובפרט לצורה מאוד ספציפית של ההתרשות הכלכלית מהשנה הקודמת.",
30
  "gold_002_line_271": "ועצם ההחלטה שלו עצמו עלולה להזין את הציפיות לאינפלציה עוד יותר.",
31
  "gold_002_line_279": "כלומר שעור שאנחנו הולכים לאינפלציה שהיא בסדר מבחינת היעד של בנק ישראל.",
32
+ "gold_002_line_310": "פשוט כי האינפלציה כאן היא עדיין נמוכה ביחס למדינות אחרות.",
33
  "gold_002_line_311": "בשביל לסבר לכם את האוזן, מדינות רבות סובלות עכשיו מאינפלציה.",
34
+ "gold_002_line_316": "במדינות אחרות זה טיפה רגועה יותר ועדיין גבוה.",
35
+ "gold_002_line_356": "בארה״ב, בנתאים מכאן שהאינפלציה השנתית כבר חצתה את השישה אחוזים.",
36
  "gold_002_line_364": "הוא כתב שם שאינפלציה שנובעת מתחממות יתר של הכלכלה יונן בעיה שמתגמדת אל מול מגפה עולמית.",
37
  "gold_002_line_371": "אם יש לכם שאלות או מחשבות בעקבות הפרק הזה.",
38
+ "gold_003_line_008": "בזמן שהיה כאן, הוא ניפגש עם ראש הממשלה.",
39
+ "gold_003_line_011": "נפגשתי עם קורמן בבוקר ירושלמי קריר באמצע השבוע שעבר.",
40
+ "gold_004_line_002": "כי בכל זאת אנחנו פופקאסט ישראלי שקורה בישראל.",
41
  "gold_005_line_033": "המוצרים הראשונים שראינו ושאתם רואים בסופר לא נמצאים שם במקרה.",
42
+ "gold_005_line_035": "יש לא מעט מחקרים ועדויות של בעלי חנויות שמראים שיש סיכוי לא רע שתשימו בעגלה את הדבר הראשון שראיתם גם אם אפילו לא תכננתם לקנות אותו.",
43
+ "gold_005_line_072": "גם הרגע שבו אסוטו מרקט הגיע לישראל שיקף את המהפכה התרבותית שהמדינה הצעירה עמדה לעבור.",
44
+ "gold_005_line_081": "האוכל לא הגיע אז בעריזות אישיות לשימוש ב-T.",
45
  "gold_005_line_133": "זה אומר את זה כי הם בוחרים לדחוף לנו בעיקר מזון לא בריא.",
46
+ "gold_005_line_150": "דבר ראשון, סופרמרקטים דווקא כן דוחפים במבצעים מוצרים שהם לא ריחיים להם כמו חיתולים.",
47
+ "gold_005_line_151": "זו הדרך שלהם למשוך אליהם קהל של הורים צעירים, למשל, שיבואו לקנות את החיתולים אולי במחיר הפסד, אבל כבר יעשו את כל הקניות שלהם על הדרך ויקנו גם את המוצרים הרווחיים יותר סופר.",
48
+ "gold_005_line_193": "זו בדיוק העבודה של דריעי המינווים ממרכז המידע לבריאות הציבור.",
49
+ "gold_005_line_197": "אבל אפילו בלי הממשלה ובלי המדינה יש עוד משהו שיכול לגרום לבעלי הסופרים להתחיל לשנות את מה שהם מוכרים ואת מה שהם מציגים בשביל שנקנה לו.",
50
  "gold_006_line_060": "הבוסות בכל העולם התחילו לקרוס באחוזים ניכרים.",
51
+ "gold_007_line_013": "אז השנה נוספו לכבישים עוד רבע מיליון כאלה שזה כצל-סי.",
52
+ "gold_007_line_046": "בן מאיר הגיע לתפקיד הזה אחרי ששימש כסמנכ\"ל הכספים והמשנה למנכ\"ל של חברת מוריה.",
53
  "gold_007_line_087": "או ליתר דיוקי לא רואה משבר דיור אלא היא רואה מות אלפי זוגות צעירים שעוד שנייה עלולים לצעוק עליה שוב שמחירי הדיור גבוהים מדי.",
54
  "gold_007_line_094": "זה לא הכיוון הנכון ללכת בו, אבל זה מה שהממשלות עושות.",
55
+ "gold_007_line_108": "ואז שרת התחבורה רגב החליטה שהיא עוצרת את התקציבים.",
56
+ "gold_007_line_145": "במהלך השבוע עצמו אני רוכב לעבודה באופנועים הלוך חז בסך הכל 10 דקות לכל כיוון.",
57
+ "gold_007_line_150": "נמאס לי לחלוטין לעמוד בפקקים, נמאס לי מהלחץ, נמאס לי מחיפוש שיח חנייה, פשוט נמאס לי.",
58
+ "gold_007_line_152": "לעתים חוקות אני משתמש באותו ובכל פעם שאני עושה את זה אני מתחרט ומכלה.",
59
+ "gold_007_line_155": "האם אני מטיף לכל מי שאני רק יכול בעבודה שנסעו את התחבורה הציבורית?",
60
+ "gold_008_line_036": "היום כבר כמעט שאין בישראל בית ספר כמו זה ששמעון נשלח אליו בשנות ה-80 לימוד נגרות.",
61
  "gold_008_line_068": "ולכן הוא הציע לממשלה לדון ברצינות בהקמה לדחייה של מערך החינוך המקצועי, וההצעה הזאת לא עברה כל כך טוב.",
62
  "gold_008_line_091": "הנה אני אגיד שוב את השני משפטים האחרונים.",
63
+ "gold_008_line_100": "אני באופן אישי, אחרי איזושהי תקופה, עם גוגל פודקאסטס, עברתי לאחרונה לספוטיפיי לו לגמרי בטוח למה, אבל האמת היא שאנחנו בכל מקום, בכל מקום.",
64
  "gold_009_line_022": "אם תעברו אותו תוכלו ללכת לתיכון עיוני, כלומר ללמוד מתמטיקה ואנגלית ועוד מקצועות לבגרות.",
65
+ "gold_009_line_091": "ושלכן הוא ידדיל את המוביליות החברתית של אוטונור וגם את ההכנסה העתידית שלו, כלומר שחינוך מקצועי מסייע לצמצום פערי.",
66
+ "gold_009_line_103": "שרק כדי להיכתב את החינוך של הארץ, המון תודה שיזמת את הפרק הזה ושעשית אותו איתנו תמיד כיף לארח אותך אצלנו.",
67
+ "gold_010_line_023": "וגם אצלנו בישראל לשכת התעסוקה דיווחה על עלייה במספר המתפטרים.",
68
+ "gold_010_line_045": "אתה לשוב אם אתה אמור לחשוב שעבודה מגניבה, שהיא משנה את העולם, להרגיש שהיא חלק מהזהות שלך.",
69
+ "gold_010_line_063": "זה הרבה יותר חשוב מאשר לשמור לבריאות, זה הרבה יותר חשוב מאשר לשמור על הבריאות שלהם.",
70
+ "gold_010_line_095": "האמת שהרבה פעמים נראה לי של ארגומים לא כל כך אכפת שהעובדים נשחקים.",
71
+ "gold_010_line_102": "ככה שתוכל להתעדכם כי אתה בטח נורא סקרן לדעת מה הולך בזמן שאתה לא נמצא ואתה בחופש איפושרו על הים או משף.",
72
+ "gold_011_line_083": "אין לי מושג אם זה בכלל שרים משפטית.",
73
+ "gold_011_line_095": "בשנים האחרונות, כשמדברים על כלכלה ועל המגזר העסקי.",
74
+ "gold_011_line_114": "במערכת חיות כחברות גם דנה פרנקו צהיל אברהה.",
75
  "gold_012_line_055": "אבל בין היתר גם סיבות כלכליות ותיירותיות.",
76
+ "gold_012_line_060": "התבילה הפך להיות בבת אחת חלק משטח צבאי סגור.",
77
+ "gold_012_line_119": "ומתרגזת בכל פעם, ומתרגזת מאוד בכל פעם שישראל טוענת אחרת.",
78
+ "gold_012_line_124": "למה הם לא ממסחרים את אתר התבילה? כי זה מקום קדוש, הם אומרים, זה לא מתאים, זה כמו מסחרת הכותל.",
79
  "gold_012_line_133": "עושר עילאי שאין שני לא כאלה מין דברים.",
80
  "gold_012_line_136": "ואפילו איזה דג שמישהו סיפר שישו פעם אחת.",
81
+ "gold_013_line_002": "והסיפור על איך המקור הגיע לבורסה ולמה הסעודים החליטו למכור בפלל כמה אחוזים מהבומנזה הכלכלית שלהם הוא סיפור מרתק.",
82
+ "gold_014_line_008": "אחרי שהפרק ההוא שודר עוד ספתי בתגובות שלכם, באמת המון המון תגובות, המון אנשים אמרו שהם רוצים עוד מזה.",
83
+ "gold_015_line_015": "האם זה משהו פלי המדינה טוענת שכן?",
84
+ "gold_015_line_068": "לרמה הזאת שהעיתונאים התחילו להפעיל על עצמם צנזורה עצמית, פעם שמעתי את אילנה דן מדברת, אז זה והיא...",
85
+ "gold_015_line_071": "כי הם מבינים שיש איזושהי רוח מפקד ושימן יכתבו אחרת, הידיעה פשוט לא תעבור.",
86
  "gold_016_line_021": "איך אנחנו יכולים להאמין למילה ממה שאתה אומר?",
87
+ "gold_016_line_076": "זה פשוט משחית את התקשורת, כי התמונה שהקורות קוראים צופות, צופים מקבלים.",
88
  "gold_017_line_041": "אם תשנו את ההנחות של המודל, תשנו גם את התוצאות.",
89
+ "gold_017_line_048": "בעקבות הישיבה היא הוחלט על הטלת סגר על ישראל.",
90
+ "gold_017_line_099": "הם כמו למשל במספר מכונות ההנשמה שהוזנו הרבה הרבה הרבה מעבר ליד שנקבע הובלות של ירדים.",
91
+ "gold_017_line_144": "ניסינו ששני הרעיונות יכילו קטעים אחרים לגמרי.",
92
+ "gold_020_line_002": "אוקיי, אז בוא נלך מהקל אל הכבד בחלק הקל, על אף שכבר עכשיו הטכנולוגיה מאוד מאוד מרשימה.",
93
+ "gold_020_line_006": "אבל לא היא עדיין מוסרית זה בחלק, הקל עד החלק, היותר מתקדם מאחר שדבר היום כבר בשלב הזה הטכנולוגיה הזאת של הבינה המאוחרפית בתחום עיבוד השפה.",
94
+ "gold_020_line_033": "ככל שהדבר הזה ישתכלל ויהיו על זה האטה, יודע יבנו על זה אפליקציות מסחריות באותו אופן שבו הבאבסטורה של אפל או בגוגל אבחנות אפליקציות של גוגל.",
95
+ "gold_020_line_038": "אני לא חושב שאנחנו צריכים לחשוש למקום העבודה שלנו, אני כן חושב שהטכנולוגיה הזו, כמו כל טכנולוגיה מוצלחת, בסופו של דבר תשנה את שוק העבודה ותלתל ענפים שלמים.",
96
+ "gold_020_line_046": "אם אתה עכשיו תחשוב שאתה העורך דין או עורכת דין שעובדים על איזשהו קיס הנורא סבוך ואתה מחפש התגימים או מחפש הכל מיני תובנות מפסיקות קודמות או משהו כזה.",
97
+ "gold_020_line_056": "היא תגביר במקום לצמצם אני אתחיל שנייה מהחלק של אז זכויות היוצרים.",
98
+ "gold_021_line_003": "כשנשארים לי מטבעות אחרי שהסתבבתי בשוק ביון, שאני ישר נותן אותן לילדים שישימו בקופת הכיסכון שלהם.",
99
  "gold_021_line_014": "אולי הוא ישכנע גם אתכם להצטרף לעיגול לטובה.",
100
+ "gold_021_line_040": "הוא אחד מזמיעי ההייטק הוותיקים שיש לנו.",
101
  "gold_021_line_057": "והוא משמש בתור יושב הראש שלה עד היום.",
102
+ "gold_021_line_078": "המגזר השלישי בישראל מגלגל מיליארדי שקלים בשנה.",
103
+ "gold_021_line_079": "לפי הערכת ארגון מידות שהוא חברה לתועלת הציבור שנסה לקדם פילנטרופיה אפקטיבית."
104
  },
105
  "individual_wer": {
106
+ "gold_000_line_035": 0.2857142857142857,
107
+ "gold_000_line_037": 0.125,
108
  "gold_000_line_089": 0.2857142857142857,
109
+ "gold_000_line_101": 0.4,
110
  "gold_000_line_145": 0.2,
111
+ "gold_000_line_148": 0.09090909090909091,
112
+ "gold_000_line_155": 0.15,
113
+ "gold_001_line_022": 0.125,
114
+ "gold_001_line_035": 0.23076923076923078,
115
  "gold_001_line_052": 0.2,
116
  "gold_001_line_069": 0.14285714285714285,
117
  "gold_001_line_100": 0.14285714285714285,
118
  "gold_001_line_120": 0.125,
119
  "gold_001_line_182": 0.1111111111111111,
120
+ "gold_001_line_186": 0.14285714285714285,
121
  "gold_001_line_223": 0.13333333333333333,
122
+ "gold_001_line_243": 0.375,
123
  "gold_001_line_251": 0.26666666666666666,
124
+ "gold_001_line_290": 0.47619047619047616,
125
  "gold_001_line_348": 0.3333333333333333,
126
+ "gold_001_line_362": 0.375,
127
  "gold_001_line_443": 0.14285714285714285,
128
  "gold_002_line_024": 0.26666666666666666,
129
+ "gold_002_line_075": 0.14285714285714285,
130
  "gold_002_line_103": 0.2777777777777778,
131
  "gold_002_line_271": 0.09090909090909091,
132
  "gold_002_line_279": 0.16666666666666666,
133
  "gold_002_line_310": 0.1,
134
  "gold_002_line_311": 0.2,
135
+ "gold_002_line_316": 0.25,
136
+ "gold_002_line_356": 0.45454545454545453,
137
  "gold_002_line_364": 0.17647058823529413,
138
  "gold_002_line_371": 0.1111111111111111,
139
  "gold_003_line_008": 0.25,
140
+ "gold_003_line_011": 0.1111111111111111,
141
+ "gold_004_line_002": 0.25,
142
  "gold_005_line_033": 0.1,
143
+ "gold_005_line_035": 0.038461538461538464,
144
+ "gold_005_line_072": 0.21428571428571427,
145
+ "gold_005_line_081": 0.25,
146
  "gold_005_line_133": 0.07692307692307693,
147
+ "gold_005_line_150": 0.2857142857142857,
148
+ "gold_005_line_151": 0.12121212121212122,
149
+ "gold_005_line_193": 0.3,
150
+ "gold_005_line_197": 0.07692307692307693,
151
  "gold_006_line_060": 0.42857142857142855,
152
  "gold_007_line_013": 0.18181818181818182,
153
+ "gold_007_line_046": 0.2857142857142857,
154
  "gold_007_line_087": 0.16,
155
  "gold_007_line_094": 0.18181818181818182,
156
+ "gold_007_line_108": 0.1111111111111111,
157
  "gold_007_line_145": 0.3333333333333333,
158
+ "gold_007_line_150": 0.4,
159
+ "gold_007_line_152": 0.35714285714285715,
160
+ "gold_007_line_155": 0.15384615384615385,
161
+ "gold_008_line_036": 0.25,
162
  "gold_008_line_068": 0.21052631578947367,
163
  "gold_008_line_091": 0.125,
164
  "gold_008_line_100": 0.3333333333333333,
165
  "gold_009_line_022": 0.14285714285714285,
166
  "gold_009_line_091": 0.3,
167
+ "gold_009_line_103": 0.3,
168
+ "gold_010_line_023": 0.2727272727272727,
169
+ "gold_010_line_045": 0.29411764705882354,
170
+ "gold_010_line_063": 0.17647058823529413,
171
+ "gold_010_line_095": 0.25,
172
+ "gold_010_line_102": 0.13636363636363635,
173
+ "gold_011_line_083": 0.25,
174
+ "gold_011_line_095": 0.25,
175
+ "gold_011_line_114": 0.5555555555555556,
176
  "gold_012_line_055": 0.14285714285714285,
177
+ "gold_012_line_060": 0.3,
178
  "gold_012_line_119": 0.2,
179
  "gold_012_line_124": 0.3333333333333333,
180
  "gold_012_line_133": 0.375,
181
  "gold_012_line_136": 0.125,
182
  "gold_013_line_002": 0.2631578947368421,
183
+ "gold_014_line_008": 0.2777777777777778,
184
+ "gold_015_line_015": 0.2857142857142857,
185
+ "gold_015_line_068": 0.2777777777777778,
186
+ "gold_015_line_071": 0.26666666666666666,
187
  "gold_016_line_021": 0.125,
188
+ "gold_016_line_076": 0.3333333333333333,
189
  "gold_017_line_041": 0.2,
190
+ "gold_017_line_048": 0.3333333333333333,
191
+ "gold_017_line_099": 0.375,
192
+ "gold_017_line_144": 0.2857142857142857,
193
+ "gold_020_line_002": 0.17647058823529413,
194
+ "gold_020_line_006": 0.2692307692307692,
195
  "gold_020_line_033": 0.26666666666666666,
196
+ "gold_020_line_038": 0.17857142857142858,
197
+ "gold_020_line_046": 0.30303030303030304,
198
+ "gold_020_line_056": 0.16666666666666666,
199
+ "gold_021_line_003": 0.29411764705882354,
200
  "gold_021_line_014": 0.125,
201
  "gold_021_line_040": 0.2857142857142857,
202
  "gold_021_line_057": 0.125,
203
+ "gold_021_line_078": 0.2857142857142857,
204
+ "gold_021_line_079": 0.16666666666666666
205
  },
206
  "individual_cer": {
207
+ "gold_000_line_035": 0.06451612903225806,
208
+ "gold_000_line_037": 0.023255813953488372,
209
  "gold_000_line_089": 0.06451612903225806,
210
+ "gold_000_line_101": 0.12195121951219512,
211
  "gold_000_line_145": 0.03896103896103896,
212
+ "gold_000_line_148": 0.01818181818181818,
213
+ "gold_000_line_155": 0.026785714285714284,
214
+ "gold_001_line_022": 0.025,
215
+ "gold_001_line_035": 0.10526315789473684,
216
  "gold_001_line_052": 0.0759493670886076,
217
  "gold_001_line_069": 0.02702702702702703,
218
  "gold_001_line_100": 0.03333333333333333,
219
  "gold_001_line_120": 0.02040816326530612,
220
  "gold_001_line_182": 0.018518518518518517,
221
+ "gold_001_line_186": 0.023255813953488372,
222
  "gold_001_line_223": 0.02702702702702703,
223
+ "gold_001_line_243": 0.07692307692307693,
224
  "gold_001_line_251": 0.05063291139240506,
225
+ "gold_001_line_290": 0.17094017094017094,
226
  "gold_001_line_348": 0.1282051282051282,
227
+ "gold_001_line_362": 0.07317073170731707,
228
  "gold_001_line_443": 0.023255813953488372,
229
  "gold_002_line_024": 0.06944444444444445,
230
+ "gold_002_line_075": 0.03669724770642202,
231
+ "gold_002_line_103": 0.09734513274336283,
232
  "gold_002_line_271": 0.016129032258064516,
233
  "gold_002_line_279": 0.04411764705882353,
234
+ "gold_002_line_310": 0.017857142857142856,
235
  "gold_002_line_311": 0.034482758620689655,
236
+ "gold_002_line_316": 0.046511627906976744,
237
+ "gold_002_line_356": 0.20588235294117646,
238
  "gold_002_line_364": 0.07692307692307693,
239
  "gold_002_line_371": 0.024390243902439025,
240
+ "gold_003_line_008": 0.05405405405405406,
241
+ "gold_003_line_011": 0.0196078431372549,
242
+ "gold_004_line_002": 0.045454545454545456,
243
  "gold_005_line_033": 0.016666666666666666,
244
+ "gold_005_line_035": 0.007692307692307693,
245
+ "gold_005_line_072": 0.060240963855421686,
246
+ "gold_005_line_081": 0.09302325581395349,
247
  "gold_005_line_133": 0.01818181818181818,
248
+ "gold_005_line_150": 0.05952380952380952,
249
+ "gold_005_line_151": 0.029585798816568046,
250
+ "gold_005_line_193": 0.10526315789473684,
251
+ "gold_005_line_197": 0.022388059701492536,
252
  "gold_006_line_060": 0.06521739130434782,
253
+ "gold_007_line_013": 0.09433962264150944,
254
+ "gold_007_line_046": 0.05263157894736842,
255
  "gold_007_line_087": 0.03937007874015748,
256
  "gold_007_line_094": 0.0392156862745098,
257
+ "gold_007_line_108": 0.02040816326530612,
258
  "gold_007_line_145": 0.11392405063291139,
259
+ "gold_007_line_150": 0.10256410256410256,
260
  "gold_007_line_152": 0.09859154929577464,
261
+ "gold_007_line_155": 0.046153846153846156,
262
+ "gold_008_line_036": 0.10714285714285714,
263
  "gold_008_line_068": 0.04,
264
  "gold_008_line_091": 0.025,
265
  "gold_008_line_100": 0.06153846153846154,
266
  "gold_009_line_022": 0.023529411764705882,
267
+ "gold_009_line_091": 0.06086956521739131,
268
  "gold_009_line_103": 0.11,
269
+ "gold_010_line_023": 0.07692307692307693,
270
+ "gold_010_line_045": 0.06818181818181818,
271
+ "gold_010_line_063": 0.058823529411764705,
272
+ "gold_010_line_095": 0.046875,
273
+ "gold_010_line_102": 0.049019607843137254,
274
+ "gold_011_line_083": 0.11428571428571428,
275
+ "gold_011_line_095": 0.041666666666666664,
276
+ "gold_011_line_114": 0.17777777777777778,
277
  "gold_012_line_055": 0.025,
278
+ "gold_012_line_060": 0.1276595744680851,
279
  "gold_012_line_119": 0.037037037037037035,
280
+ "gold_012_line_124": 0.08791208791208792,
281
  "gold_012_line_133": 0.08108108108108109,
282
  "gold_012_line_136": 0.07692307692307693,
283
  "gold_013_line_002": 0.0625,
284
+ "gold_014_line_008": 0.07291666666666667,
285
+ "gold_015_line_015": 0.08823529411764706,
286
+ "gold_015_line_068": 0.09375,
287
+ "gold_015_line_071": 0.0958904109589041,
288
  "gold_016_line_021": 0.023255813953488372,
289
  "gold_016_line_076": 0.057971014492753624,
290
  "gold_017_line_041": 0.044444444444444446,
291
+ "gold_017_line_048": 0.06521739130434782,
292
+ "gold_017_line_099": 0.13043478260869565,
293
+ "gold_017_line_144": 0.045454545454545456,
294
+ "gold_020_line_002": 0.03614457831325301,
295
+ "gold_020_line_006": 0.0962962962962963,
296
+ "gold_020_line_033": 0.08275862068965517,
297
+ "gold_020_line_038": 0.039473684210526314,
298
  "gold_020_line_046": 0.0759493670886076,
299
+ "gold_020_line_056": 0.03125,
300
+ "gold_021_line_003": 0.08163265306122448,
301
  "gold_021_line_014": 0.023809523809523808,
302
+ "gold_021_line_040": 0.13157894736842105,
303
  "gold_021_line_057": 0.027777777777777776,
304
+ "gold_021_line_078": 0.043478260869565216,
305
+ "gold_021_line_079": 0.02631578947368421
306
  }
307
  }
comparison/tts_gen/piper.py CHANGED
@@ -10,12 +10,12 @@ from piper_onnx import Piper
10
  import phonikud
11
 
12
  # Set up paths
13
- csv_path = Path("/Volumes/Internal/audio/phonikud-experiments/uset-study/study_phonikud.csv")
14
  output_dir = Path("./ilspeech_male_phonikud_piper")
15
  output_dir.mkdir(parents=True, exist_ok=True)
16
 
17
  # Load Piper model
18
- piper = Piper('ilspeech.onnx', 'ilspeech.onnx.json')
19
 
20
  # Load CSV
21
  df = pd.read_csv(csv_path, sep=',', header=None, names=['file_id', 'text', 'phonemes'], index_col=False)
 
10
  import phonikud
11
 
12
  # Set up paths
13
+ csv_path = Path("/Users/user/Documents/audio/phonikud-experiments/comparison/sentences/saspeech_male_phonikud.csv")
14
  output_dir = Path("./ilspeech_male_phonikud_piper")
15
  output_dir.mkdir(parents=True, exist_ok=True)
16
 
17
  # Load Piper model
18
+ piper = Piper('/Users/user/Documents/audio/phonikud-experiments/comparison/model (4).onnx', 'ilspeech.onnx.json')
19
 
20
  # Load CSV
21
  df = pd.read_csv(csv_path, sep=',', header=None, names=['file_id', 'text', 'phonemes'], index_col=False)