Buckets:

rtrm's picture
download
raw
16.7 kB
<meta charset="utf-8" /><meta name="hf:doc:metadata" content="{&quot;title&quot;:&quot;Bienvenue dans le cours d’audio d’Hugging Face !&quot;,&quot;local&quot;:&quot;bienvenue-dans-le-cours-daudio-dhugging-face-&quot;,&quot;sections&quot;:[{&quot;title&quot;:&quot;Rencontrer l’équipe du cours&quot;,&quot;local&quot;:&quot;rencontrer-léquipe-du-cours&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Structure du cours&quot;,&quot;local&quot;:&quot;structure-du-cours&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Parcours d’apprentissage&quot;,&quot;local&quot;:&quot;parcours-dapprentissage&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2}],&quot;depth&quot;:1}">
<link href="/docs/audio-course/pr_239/fr/_app/immutable/assets/0.e3b0c442.css" rel="modulepreload">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/entry/start.48d22ca3.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/scheduler.a045fce0.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/singletons.932e46dd.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/index.2447c7d9.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/paths.50fd3c21.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/entry/app.4e1ef9b0.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/preload-helper.aa8f5fd5.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/index.5135b896.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/nodes/0.00a7cda2.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/each.e59479a4.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/nodes/4.6353acd5.js">
<link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/MermaidChart.svelte_svelte_type_style_lang.59591d32.js"><!-- HEAD_svelte-u9bgzb_START --><meta name="hf:doc:metadata" content="{&quot;title&quot;:&quot;Bienvenue dans le cours d’audio d’Hugging Face !&quot;,&quot;local&quot;:&quot;bienvenue-dans-le-cours-daudio-dhugging-face-&quot;,&quot;sections&quot;:[{&quot;title&quot;:&quot;Rencontrer l’équipe du cours&quot;,&quot;local&quot;:&quot;rencontrer-léquipe-du-cours&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Structure du cours&quot;,&quot;local&quot;:&quot;structure-du-cours&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Parcours d’apprentissage&quot;,&quot;local&quot;:&quot;parcours-dapprentissage&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2}],&quot;depth&quot;:1}"><!-- HEAD_svelte-u9bgzb_END --> <p></p> <div class="items-center shrink-0 min-w-[100px] max-sm:min-w-[50px] justify-end ml-auto flex" style="float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"><div class="inline-flex rounded-md max-sm:rounded-sm"><button class="inline-flex items-center gap-1 h-7 max-sm:h-7 px-2 max-sm:px-1.5 text-sm font-medium text-gray-800 border border-r-0 rounded-l-md max-sm:rounded-l-sm border-gray-200 bg-white hover:shadow-inner dark:border-gray-850 dark:bg-gray-950 dark:text-gray-200 dark:hover:bg-gray-800" aria-live="polite"><span class="inline-flex items-center justify-center rounded-md p-0.5 max-sm:p-0 hover:text-gray-800 dark:hover:text-gray-200"><svg class="sm:size-3.5 size-3" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg></span> <span>Copy page</span></button> <button class="inline-flex items-center justify-center w-6 max-sm:w-5 h-7 max-sm:h-7 disabled:pointer-events-none text-sm text-gray-500 hover:text-gray-700 dark:hover:text-white rounded-r-md max-sm:rounded-r-sm border border-l transition border-gray-200 bg-white hover:shadow-inner dark:border-gray-850 dark:bg-gray-950 dark:text-gray-200 dark:hover:bg-gray-800" aria-haspopup="menu" aria-expanded="false" aria-label="Open copy menu"><svg class="transition-transform text-gray-400 overflow-visible sm:size-3.5 size-3 rotate-0" width="1em" height="1em" viewBox="0 0 12 7" fill="none" xmlns="http://www.w3.org/2000/svg"><path d="M1 1L6 6L11 1" stroke="currentColor"></path></svg></button></div> </div> <h1 class="relative group"><a id="bienvenue-dans-le-cours-daudio-dhugging-face-" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#bienvenue-dans-le-cours-daudio-dhugging-face-"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Bienvenue dans le cours d’audio d’Hugging Face !</span></h1> <p data-svelte-h="svelte-8hocbf">Cher apprenant, bienvenue dans ce cours sur l’utilisation des <em>transformers</em> pour l’audio, À maintes reprises, les <em>transformers</em> se sont révélés être l’une des architectures d’apprentissage profond les plus puissantes et les plus polyvalentes, capables d’obtenir des résultats de pointe dans un large éventail de tâches, y compris le traitement du langage naturel, la vision par ordinateur et, plus récemment, le traitement audio.</p> <p data-svelte-h="svelte-temfzp">Dans ce cours, nous allons explorer comment ces modèles peuvent être appliqués à une série de tâches et de données audio. Que vous soyez intéressé par la reconnaissance vocale, la classification audio ou la synthèse vocale, les <em>transformers</em> et ce cours vous le permettront.</p> <p data-svelte-h="svelte-1xs0h03">Pour vous donner un avant-goût de ce que ces modèles peuvent faire, prononcez quelques mots dans la démo ci-dessous et regardez le modèle les transcrire en temps réel !</p> <iframe src="https://openai-whisper.hf.space" frameborder="0" width="850" height="450" data-svelte-h="svelte-sv748y"></iframe> <p data-svelte-h="svelte-y60v95">Tout au long du cours, vous comprendrez les spécificités du travail avec des données audio, vous découvrirez différentes architectures de <em>transformers</em>, et <em>finetunerez</em> vos propres modèles audio en tirant parti de puissants modèles pré-entraînés.</p> <p data-svelte-h="svelte-37wfo2">Ce cours est conçu pour les personnes ayant des connaissances en apprentissage profond et une connaissance générale des <em>transformers</em>.
Aucune expertise en traitement de données audio n’est requise. Si vous avez besoin de rafraîchir vos connaissances sur les <em>transformers</em>, consultez notre <a href="https://huggingface.co/course/fr/chapter1/1" rel="nofollow">cours de NLP</a> qui aborde en détail les principes de base de cette architecture.</p> <h2 class="relative group"><a id="rencontrer-léquipe-du-cours" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#rencontrer-léquipe-du-cours"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Rencontrer l’équipe du cours</span></h2> <p data-svelte-h="svelte-r96n6"><strong>Sanchit Gandhi, ingénieur de recherche en apprentissage automatique chez Hugging Face</strong></p> <p data-svelte-h="svelte-h43m28">Bonjour, je m’appelle Sanchit et je suis ingénieur de recherche en apprentissage automatique pour l’audio dans l’équipe <em>open-source</em> de Hugging Face 🤗.
Je me concentre principalement sur la reconnaissance automatique de la parole et la traduction, avec l’objectif actuel de rendre les modèles de parole plus rapides, plus légers et plus faciles à utiliser.</p> <p data-svelte-h="svelte-1nvziv8"><strong>Matthijs Hollemans, ingénieur en apprentissage automatique chez Hugging Face</strong>.</p> <p data-svelte-h="svelte-13tdkqi">Je m’appelle Matthijs et je suis ingénieur en apprentissage automatique en audio dans l’équipe <em>open source</em> de Hugging Face. Je suis également l’auteur d’un livre sur l’écriture de sons de synthétiseurs, et je crée des <em>plugins</em> audio pendant mon temps libre.</p> <p data-svelte-h="svelte-13qyqxa"><strong>Maria Khalusova, Documentation et cours chez Hugging Face</strong>.</p> <p data-svelte-h="svelte-1yy6wx2">Je m’appelle Maria et je crée du contenu éducatif et de la documentation pour rendre <em>Transformers</em> et d’autres outils <em>open-source</em> encore plus accessibles. Je décompose des concepts techniques complexes et j’aide les gens à démarrer avec des technologies de pointe.</p> <p data-svelte-h="svelte-v6qwul"><strong>Vaibhav Srivastav, ingénieur <em>advocate</em> et développeur en apprentissage automatique chez Hugging Face</strong>.</p> <p data-svelte-h="svelte-y6gp7f">Je m’appelle Vaibhav (VB) et je suis ingénieur <em>advocate</em> en audio au sein de l’équipe <em>open source</em> de Hugging Face. Je fais des recherches sur la synthèse vocale sur els lagnues à faibles ressources et j’aide à mettre l’état de l’art de la recherche sur la parole à la portée du plus grand nombre.</p> <h2 class="relative group"><a id="structure-du-cours" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#structure-du-cours"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Structure du cours</span></h2> <p data-svelte-h="svelte-isih1d">Le cours est structuré en plusieurs unités qui couvrent différents sujets en profondeur :</p> <ul data-svelte-h="svelte-10q6q8o"><li>Unité 1 : apprendre les spécificités du travail avec des données audio, y compris les techniques de traitement audio et la préparation des données.</li> <li>Unité 2 : connaître les applications audio et apprendre comment utiliser les pipelines de 🤗 <em>Transformers</em> pour différentes tâches, telles que la classification audio et la reconnaissance vocale.</li> <li>Unité 3 : explorer les architectures de <em>transformers</em> audio, apprendre comment ils diffèrent, et quelles sont les tâches pour lesquelles ils sont les mieux adaptés.</li> <li>Unité 4 : Apprenez à construire votre propre classifieur de genre musical.</li> <li>Unité 5 : approfondissement de la reconnaissance vocale</li> <li>Unité 6 : apprendre à générer de la parole à partir d’un texte.</li> <li>Unité 7 : apprendre à construire des applications audio réelles (traducteur parole-à-parole, assistant vocal et transcription de réunions).</li></ul> <p data-svelte-h="svelte-1e3gvzp">Chaque unité comprend un volet théorique qui vous permettra d’acquérir une compréhension approfondie des concepts et des techniques sous-jacents. Tout au long du cours, des quiz vous permettent de tester vos connaissances et de renforcer votre apprentissage.
Certains chapitres comprennent également des exercices pratiques qui vous permettront d’appliquer ce que vous avez appris.</p> <p data-svelte-h="svelte-iper0u">À la fin du cours, vous aurez acquis de solides bases dans l’utilisation des <em>transformers</em> pour les données audio et serez bien équipé pour appliquer ces techniques à un large éventail de tâches.</p> <h2 class="relative group"><a id="parcours-dapprentissage" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#parcours-dapprentissage"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Parcours d’apprentissage</span></h2> <p data-svelte-h="svelte-nd7bus">Il n’y a pas de bonne ou de mauvaise façon de suivre ce cours. Tout le matériel contenu dans ce cours est 100% gratuit, public et <em>open-source</em>.
Vous pouvez le suivre à votre propre rythme, mais nous vous recommandons de suivre les unités dans l’ordre.</p> <p data-svelte-h="svelte-1b62gyi">Bon cours !</p> <a class="!text-gray-400 !no-underline text-sm flex items-center not-prose mt-4" href="https://github.com/huggingface/audio-transformers-course/blob/main/chapters/fr/chapter0/introduction.mdx" target="_blank"><svg class="mr-1" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M31,16l-7,7l-1.41-1.41L28.17,16l-5.58-5.59L24,9l7,7z"></path><path d="M1,16l7-7l1.41,1.41L3.83,16l5.58,5.59L8,23l-7-7z"></path><path d="M12.419,25.484L17.639,6.552l1.932,0.518L14.351,26.002z"></path></svg> <span data-svelte-h="svelte-zjs2n5"><span class="underline">Update</span> on GitHub</span></a> <p></p>
<script>
{
__sveltekit_oc6cu6 = {
assets: "/docs/audio-course/pr_239/fr",
base: "/docs/audio-course/pr_239/fr",
env: {}
};
const element = document.currentScript.parentElement;
const data = [null,null];
Promise.all([
import("/docs/audio-course/pr_239/fr/_app/immutable/entry/start.48d22ca3.js"),
import("/docs/audio-course/pr_239/fr/_app/immutable/entry/app.4e1ef9b0.js")
]).then(([kit, app]) => {
kit.start(app, element, {
node_ids: [0, 4],
data,
form: null,
error: null
});
});
}
</script>

Xet Storage Details

Size:
16.7 kB
·
Xet hash:
b08efe046bca5049ca5681078077939bf16b62026b69e02d360d0dbc67f870b0

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.