Buckets:

rtrm's picture
download
raw
5.77 kB
import{s as Q,n as V,o as O}from"../chunks/scheduler.a045fce0.js";import{S as K,i as ee,e as o,s as i,c as P,h as te,a as r,d as s,b as a,f as X,g as E,j as $,k as Y,l as se,m as n,n as B,t as W,o as A,p as N}from"../chunks/index.5135b896.js";import{C as ne,H as ie,E as ae}from"../chunks/MermaidChart.svelte_svelte_type_style_lang.d4d0e89a.js";import{C as le}from"../chunks/CodeBlock.95a7ff30.js";function oe(S){let l,g,q,w,u,y,m,M,p,k=`Dans cette unité, nous avons exploré les défis du <em>finetuning</em> des modèles d’ASR, en mettant en avant le temps et les ressources nécessaires pour <em>finetuner</em> un modèle comme Whisper (même un petit <em>checkpoint</em>) sur une nouvelle langue.
Afin de fournir une expérience pratique, nous avons conçu un exercice qui vous permet de naviguer dans le processus de <em>finetuning</em> d’un modèle d’ASR tout en utilisant un jeu de données plus petit.
L’objectif principal de cet exercice est de vous familiariser avec le processus plutôt que de vous attendre à des résultats de niveau production.
Nous avons délibérément fixé une métrique basse pour que vous puissiez l’atteindre, même avec des ressources limitées.`,_,c,F="Voici les instructions :",I,d,G="<li><em>Finetuner</em> le modèle <code>&quot;openai/whisper-tiny&quot;</code> en utilisant le sous-échantillon anglais américain (“en-US”) du jeu de données <code>&quot;PolyAI/minds14&quot;</code>.</li> <li>Utilisez les premiers <strong>450 exemples pour l’entraînement</strong>, et le reste pour l’évaluation. Assurez-vous de mettre <code>num_proc=1</code> lors du pré-traitement du jeu de données en utilisant la méthode <code>.map</code> (ceci assurera que votre modèle est soumis correctement lors de l’évaluation).</li> <li>Pour évaluer le modèle, utilisez les métriques <code>wer</code> et <code>wer_ortho</code> comme décrit dans cette unité. Cependant, <em>ne convertissez pas</em> la métrique en pourcentages en la multipliant par 100 (par exemple, si WER est de 42%, nous nous attendons à voir la valeur de 0,42 dans cet exercice).</li>",b,f,R="Une fois que vous avez <em>finetuné</em> un modèle, assurez-vous de le télécharger sur le 🤗 <em>Hub</em> avec les <code>kwargs</code> suivants :",C,v,j,T,Z="Nous considérons cet exercice réussi si le WER normalisé (<code>wer</code>) de votre modèle est inférieur à <strong>0.37</strong>.",L,J,D="N’hésitez pas à construire une démo de votre modèle obtenu et à la partager sur Discord ! Si vous avez des questions, posez-les dans le canal `<code>#audio-study-group</code>.",z,h,U,x,H;return u=new ne({props:{containerStyle:"float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"}}),m=new ie({props:{title:"Exercice pratique",local:"exercice-pratique",headingTag:"h1"}}),v=new le({props:{code:"a3dhcmdzJTIwJTNEJTIwJTdCJTBBJTIwJTIwJTIwJTIwJTIyZGF0YXNldF90YWdzJTIyJTIwJTNBJTIwJTIyUG9seUFJJTJGbWluZHMxNCUyMiUyQyUwQSUyMCUyMCUyMCUyMCUyMmZpbmV0dW5lZF9mcm9tJTIyJTIwJTNBJTIwJTIyb3BlbmFpJTJGd2hpc3Blci10aW55JTIyJTJDJTBBJTIwJTIwJTIwJTIwJTIydGFza3MlMjIlMjAlM0ElMjAlMjJhdXRvbWF0aWMtc3BlZWNoLXJlY29nbml0aW9uJTIyJTJDJTBBJTdE",highlighted:`<span class="hljs-attribute">kwargs</span> = {
<span class="hljs-string">&quot;dataset_tags&quot;</span> : <span class="hljs-string">&quot;PolyAI/minds14&quot;</span>,
<span class="hljs-string">&quot;finetuned_from&quot;</span> : <span class="hljs-string">&quot;openai/whisper-tiny&quot;</span>,
<span class="hljs-string">&quot;tasks&quot;</span> : <span class="hljs-string">&quot;automatic-speech-recognition&quot;</span>,
}`,wrap:!1}}),h=new ae({props:{source:"https://github.com/huggingface/audio-transformers-course/blob/main/chapters/fr/chapter5/hands_on.mdx"}}),{c(){l=o("meta"),g=i(),q=o("p"),w=i(),P(u.$$.fragment),y=i(),P(m.$$.fragment),M=i(),p=o("p"),p.innerHTML=k,_=i(),c=o("p"),c.textContent=F,I=i(),d=o("ul"),d.innerHTML=G,b=i(),f=o("p"),f.innerHTML=R,C=i(),P(v.$$.fragment),j=i(),T=o("p"),T.innerHTML=Z,L=i(),J=o("p"),J.innerHTML=D,z=i(),P(h.$$.fragment),U=i(),x=o("p"),this.h()},l(e){const t=te("svelte-u9bgzb",document.head);l=r(t,"META",{name:!0,content:!0}),t.forEach(s),g=a(e),q=r(e,"P",{}),X(q).forEach(s),w=a(e),E(u.$$.fragment,e),y=a(e),E(m.$$.fragment,e),M=a(e),p=r(e,"P",{"data-svelte-h":!0}),$(p)!=="svelte-1xtndrf"&&(p.innerHTML=k),_=a(e),c=r(e,"P",{"data-svelte-h":!0}),$(c)!=="svelte-j0rkl3"&&(c.textContent=F),I=a(e),d=r(e,"UL",{"data-svelte-h":!0}),$(d)!=="svelte-318qhp"&&(d.innerHTML=G),b=a(e),f=r(e,"P",{"data-svelte-h":!0}),$(f)!=="svelte-yy83eb"&&(f.innerHTML=R),C=a(e),E(v.$$.fragment,e),j=a(e),T=r(e,"P",{"data-svelte-h":!0}),$(T)!=="svelte-1m5l0ic"&&(T.innerHTML=Z),L=a(e),J=r(e,"P",{"data-svelte-h":!0}),$(J)!=="svelte-7mima"&&(J.innerHTML=D),z=a(e),E(h.$$.fragment,e),U=a(e),x=r(e,"P",{}),X(x).forEach(s),this.h()},h(){Y(l,"name","hf:doc:metadata"),Y(l,"content",re)},m(e,t){se(document.head,l),n(e,g,t),n(e,q,t),n(e,w,t),B(u,e,t),n(e,y,t),B(m,e,t),n(e,M,t),n(e,p,t),n(e,_,t),n(e,c,t),n(e,I,t),n(e,d,t),n(e,b,t),n(e,f,t),n(e,C,t),B(v,e,t),n(e,j,t),n(e,T,t),n(e,L,t),n(e,J,t),n(e,z,t),B(h,e,t),n(e,U,t),n(e,x,t),H=!0},p:V,i(e){H||(W(u.$$.fragment,e),W(m.$$.fragment,e),W(v.$$.fragment,e),W(h.$$.fragment,e),H=!0)},o(e){A(u.$$.fragment,e),A(m.$$.fragment,e),A(v.$$.fragment,e),A(h.$$.fragment,e),H=!1},d(e){e&&(s(g),s(q),s(w),s(y),s(M),s(p),s(_),s(c),s(I),s(d),s(b),s(f),s(C),s(j),s(T),s(L),s(J),s(z),s(U),s(x)),s(l),N(u,e),N(m,e),N(v,e),N(h,e)}}}const re='{"title":"Exercice pratique","local":"exercice-pratique","sections":[],"depth":1}';function ue(S){return O(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class fe extends K{constructor(l){super(),ee(this,l,ue,oe,Q,{})}}export{fe as component};

Xet Storage Details

Size:
5.77 kB
·
Xet hash:
de42656ac910c9f08581be5d35a846ba60a6cde3c8b3ddecade238b352f01c74

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.