Buckets:
| <meta charset="utf-8" /><meta name="hf:doc:metadata" content="{"title":"Streaming de données audio","local":"streaming-de-données-audio","sections":[],"depth":1}"> | |
| <link href="/docs/audio-course/pr_239/fr/_app/immutable/assets/0.e3b0c442.css" rel="modulepreload"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/entry/start.48d22ca3.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/scheduler.a045fce0.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/singletons.932e46dd.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/index.2447c7d9.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/paths.50fd3c21.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/entry/app.4e1ef9b0.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/preload-helper.aa8f5fd5.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/index.5135b896.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/nodes/0.00a7cda2.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/each.e59479a4.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/nodes/10.9fc543d0.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/MermaidChart.svelte_svelte_type_style_lang.59591d32.js"> | |
| <link rel="modulepreload" href="/docs/audio-course/pr_239/fr/_app/immutable/chunks/CodeBlock.1d730892.js"><!-- HEAD_svelte-u9bgzb_START --><meta name="hf:doc:metadata" content="{"title":"Streaming de données audio","local":"streaming-de-données-audio","sections":[],"depth":1}"><!-- HEAD_svelte-u9bgzb_END --> <p></p> <div class="items-center shrink-0 min-w-[100px] max-sm:min-w-[50px] justify-end ml-auto flex" style="float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"><div class="inline-flex rounded-md max-sm:rounded-sm"><button class="inline-flex items-center gap-1 h-7 max-sm:h-7 px-2 max-sm:px-1.5 text-sm font-medium text-gray-800 border border-r-0 rounded-l-md max-sm:rounded-l-sm border-gray-200 bg-white hover:shadow-inner dark:border-gray-850 dark:bg-gray-950 dark:text-gray-200 dark:hover:bg-gray-800" aria-live="polite"><span class="inline-flex items-center justify-center rounded-md p-0.5 max-sm:p-0 hover:text-gray-800 dark:hover:text-gray-200"><svg class="sm:size-3.5 size-3" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg></span> <span>Copy page</span></button> <button class="inline-flex items-center justify-center w-6 max-sm:w-5 h-7 max-sm:h-7 disabled:pointer-events-none text-sm text-gray-500 hover:text-gray-700 dark:hover:text-white rounded-r-md max-sm:rounded-r-sm border border-l transition border-gray-200 bg-white hover:shadow-inner dark:border-gray-850 dark:bg-gray-950 dark:text-gray-200 dark:hover:bg-gray-800" aria-haspopup="menu" aria-expanded="false" aria-label="Open copy menu"><svg class="transition-transform text-gray-400 overflow-visible sm:size-3.5 size-3 rotate-0" width="1em" height="1em" viewBox="0 0 12 7" fill="none" xmlns="http://www.w3.org/2000/svg"><path d="M1 1L6 6L11 1" stroke="currentColor"></path></svg></button></div> </div> <h1 class="relative group"><a id="streaming-de-données-audio" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#streaming-de-données-audio"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Streaming de données audio</span></h1> <p data-svelte-h="svelte-1xb8q90">L’un des plus grands défis auxquels sont confrontés les ensembles de données audio est leur taille. | |
| Une seule minute d’audio non compressé de qualité CD (44,1 kHz, 16 bits) occupe un peu plus de 5 Mo de stockage. En règle générale, un jeu de données audio contient des heures d’enregistrements. | |
| Dans les sections précédentes, nous avons utilisé un très petit sous-ensemble de jeux de données audio MINDS-14, mais les jeux de données audio typiques sont beaucoup plus volumineux. | |
| Par exemple, la configuration <code>xs</code> (la plus petite) de <a href="https://huggingface.co/datasets/speechcolab/gigaspeech" rel="nofollow">GigaSpeech de SpeechColab</a> ne contient que 10 heures de données d’entraînement, mais prend plus de 13 Go d’espace de stockage pour le téléchargement et la préparation. | |
| Alors, que se passe-t-il lorsque nous voulons nous entraîner sur un split plus grand ? | |
| La configuration <code>xl</code> complète du même jeu de données contient 10 000 heures de données d’entraînement, nécessitant plus de 1 To d’espace de stockage. | |
| Pour la plupart d’entre nous, cela dépasse largement les spécifications d’un disque dur typique. Devons-nous débourser et acheter du stockage supplémentaire ? Ou existe-t-il un moyen de nous entraîner sur ces ensembles de données sans contraintes d’espace disque ?</p> <p data-svelte-h="svelte-1xjhwjf">🤗 <em>Datasets</em> vient à la rescousse en proposant le mode <a href="https://huggingface.co/docs/datasets/stream" rel="nofollow">streaming</a>. | |
| Le streaming nous permet de charger les données progressivement au fur et à mesure que nous itérons sur le jeu de données. Plutôt que de télécharger l’ensemble du jeu de données en une seule fois, nous chargeons le jeu de données un exemple à la fois. | |
| Nous itérons sur le jeu de données, chargeant et préparant des exemples à la volée lorsqu’ils sont nécessaires. De cette façon, nous ne chargeons que les exemples que nous utilisons, et non ceux que nous ne sommes pas ! | |
| Une fois que nous avons terminé avec un exemple d’exemple, nous continuons à itérer sur le jeu de données et chargeons le suivant. | |
| Le mode streaming présente trois avantages principaux par rapport au téléchargement simultané de l’ensemble du jeu de données :</p> <ul data-svelte-h="svelte-kin8t"><li>Espace disque : les exemples sont chargés en mémoire un par un au fur et à mesure que nous itérons sur l’ensemble de données. Étant donné que les données ne sont pas téléchargées localement, il n’y a pas d’espace disque requis, vous pouvez donc utiliser des jeux de données de taille arbitraire.</li> <li>Temps de téléchargement et de traitement: les ensembles de données audio sont volumineux et nécessitent beaucoup de temps pour être téléchargés et traités. Avec le streaming, le chargement et le traitement se font à la volée, ce qui signifie que vous pouvez commencer à utiliser le jeu de données dès que le premier exemple est prêt.</li> <li>Expérimentation facile : vous pouvez expérimenter sur une poignée d’exemples pour vérifier que votre script fonctionne sans avoir à télécharger l’ensemble du jeu de données.</li></ul> <p data-svelte-h="svelte-19m2f15">Il y a une mise en garde au mode streaming. Lors du téléchargement d’un jeu de données complet sans streaming, les données brutes et les données traitées sont enregistrées localement sur le disque. | |
| Si nous voulons réutiliser ce jeu de données, nous pouvons charger directement les données traitées à partir du disque, en sautant les étapes de téléchargement et de traitement.<br> | |
| Par conséquent, nous ne devons effectuer les opérations de téléchargement et de traitement qu’une seule fois, après quoi nous pouvons réutiliser les données préparées.</p> <p data-svelte-h="svelte-8ytelj">Avec le mode streaming, les données ne sont pas téléchargées sur le disque. Ainsi, ni les données téléchargées ni les données prétraitées ne sont mises en cache. | |
| Si nous voulons réutiliser le jeu de données, les étapes de streaming doivent être répétées, avec les fichiers audio chargés et traités à nouveau à la volée. | |
| Pour cette raison, il est conseillé de télécharger des jeux de données que vous êtes susceptible d’utiliser plusieurs fois.</p> <p data-svelte-h="svelte-diojnx">Comment activer le mode streaming ? Facile! Il suffit de définir <code>streaming=True</code> lorsque vous chargez votre jeu de données. Le reste sera pris en charge pour vous :</p> <div class="code-block relative "><div class="absolute top-2.5 right-4"><button class="inline-flex items-center relative text-sm focus:text-green-500 cursor-pointer focus:outline-none transition duration-200 ease-in-out opacity-0 mx-0.5 text-gray-600 " title="code excerpt" type="button"><svg class="" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg> <div class="absolute pointer-events-none transition-opacity bg-black text-white py-1 px-2 leading-tight rounded font-normal shadow left-1/2 top-full transform -translate-x-1/2 translate-y-2 opacity-0"><div class="absolute bottom-full left-1/2 transform -translate-x-1/2 w-0 h-0 border-black border-4 border-t-0" style="border-left-color: transparent; border-right-color: transparent; "></div> Copied</div></button></div> <pre class=""><!-- HTML_TAG_START -->gigaspeech = load_dataset(<span class="hljs-string">"speechcolab/gigaspeech"</span>, <span class="hljs-string">"xs"</span>, streaming=<span class="hljs-literal">True</span>)<!-- HTML_TAG_END --></pre></div> <p data-svelte-h="svelte-1g75mi3">Tout comme nous avons appliqué des étapes de prétraitement à un sous-ensemble téléchargé de MINDS-14, vous pouvez effectuer le même prétraitement avec un jeu de données en streaming exactement de la même manière. | |
| La seule différence est que vous ne pouvez plus accéder à des échantillons individuels à l’aide de l’indexation Python (c’est-à-dire <code>gigaspeech["train"][sample_idx]</code>). | |
| Au lieu de cela, vous devez itérer sur le jeu de données. Voici comment accéder à un exemple lors de la diffusion en continu d’un jeu de données :</p> <div class="code-block relative "><div class="absolute top-2.5 right-4"><button class="inline-flex items-center relative text-sm focus:text-green-500 cursor-pointer focus:outline-none transition duration-200 ease-in-out opacity-0 mx-0.5 text-gray-600 " title="code excerpt" type="button"><svg class="" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg> <div class="absolute pointer-events-none transition-opacity bg-black text-white py-1 px-2 leading-tight rounded font-normal shadow left-1/2 top-full transform -translate-x-1/2 translate-y-2 opacity-0"><div class="absolute bottom-full left-1/2 transform -translate-x-1/2 w-0 h-0 border-black border-4 border-t-0" style="border-left-color: transparent; border-right-color: transparent; "></div> Copied</div></button></div> <pre class=""><!-- HTML_TAG_START --><span class="hljs-built_in">next</span>(<span class="hljs-built_in">iter</span>(gigaspeech[<span class="hljs-string">"train"</span>]))<!-- HTML_TAG_END --></pre></div> <p data-svelte-h="svelte-dbzevp"><strong>Sortie :</strong></p> <div class="code-block relative "><div class="absolute top-2.5 right-4"><button class="inline-flex items-center relative text-sm focus:text-green-500 cursor-pointer focus:outline-none transition duration-200 ease-in-out opacity-0 mx-0.5 text-gray-600 " title="code excerpt" type="button"><svg class="" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg> <div class="absolute pointer-events-none transition-opacity bg-black text-white py-1 px-2 leading-tight rounded font-normal shadow left-1/2 top-full transform -translate-x-1/2 translate-y-2 opacity-0"><div class="absolute bottom-full left-1/2 transform -translate-x-1/2 w-0 h-0 border-black border-4 border-t-0" style="border-left-color: transparent; border-right-color: transparent; "></div> Copied</div></button></div> <pre class=""><!-- HTML_TAG_START -->{ | |
| <span class="hljs-string">"segment_id"</span>: <span class="hljs-string">"YOU0000000315_S0000660"</span>, | |
| <span class="hljs-string">"speaker"</span>: <span class="hljs-string">"N/A"</span>, | |
| <span class="hljs-string">"text"</span>: <span class="hljs-string">"AS THEY'RE LEAVING <COMMA> CAN KASH PULL ZAHRA ASIDE REALLY QUICKLY <QUESTIONMARK>"</span>, | |
| <span class="hljs-string">"audio"</span>: { | |
| <span class="hljs-string">"path"</span>: <span class="hljs-string">"xs_chunks_0000/YOU0000000315_S0000660.wav"</span>, | |
| <span class="hljs-string">"array"</span>: <span class="hljs-built_in">array</span>( | |
| <span class="hljs-selector-attr">[0.0005188, 0.00085449, 0.00012207, ..., 0.00125122, 0.00076294, 0.00036621]</span> | |
| ), | |
| <span class="hljs-string">"sampling_rate"</span>: <span class="hljs-number">16000</span>, | |
| }, | |
| <span class="hljs-string">"begin_time"</span>: <span class="hljs-number">2941.89</span>, | |
| <span class="hljs-string">"end_time"</span>: <span class="hljs-number">2945.07</span>, | |
| <span class="hljs-string">"audio_id"</span>: <span class="hljs-string">"YOU0000000315"</span>, | |
| <span class="hljs-string">"title"</span>: <span class="hljs-string">"Return to Vasselheim | Critical Role: VOX MACHINA | Episode 43"</span>, | |
| <span class="hljs-string">"url"</span>: <span class="hljs-string">"https://www.youtube.com/watch?v=zr2n1fLVasU"</span>, | |
| <span class="hljs-string">"source"</span>: <span class="hljs-number">2</span>, | |
| <span class="hljs-string">"category"</span>: <span class="hljs-number">24</span>, | |
| <span class="hljs-string">"original_full_path"</span>: <span class="hljs-string">"audio/youtube/P0004/YOU0000000315.opus"</span>, | |
| }<!-- HTML_TAG_END --></pre></div> <p>Si vous souhaitez prévisualiser plusieurs exemples d’un grand jeu de données, utilisez <code data-svelte-h="svelte-kmf2t8">take()</code> pour obtenir les <!-- HTML_TAG_START --><span class="katex"><span class="katex-mathml"><math xmlns="http://www.w3.org/1998/Math/MathML"><semantics><mrow><mi>n</mi></mrow><annotation encoding="application/x-tex">n</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.4306em;"></span><span class="mord mathnormal">n</span></span></span></span><!-- HTML_TAG_END --> premiers éléments. Prenons les deux premiers exemples dans le jeu de données gigaspeech :</p> <div class="code-block relative "><div class="absolute top-2.5 right-4"><button class="inline-flex items-center relative text-sm focus:text-green-500 cursor-pointer focus:outline-none transition duration-200 ease-in-out opacity-0 mx-0.5 text-gray-600 " title="code excerpt" type="button"><svg class="" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg> <div class="absolute pointer-events-none transition-opacity bg-black text-white py-1 px-2 leading-tight rounded font-normal shadow left-1/2 top-full transform -translate-x-1/2 translate-y-2 opacity-0"><div class="absolute bottom-full left-1/2 transform -translate-x-1/2 w-0 h-0 border-black border-4 border-t-0" style="border-left-color: transparent; border-right-color: transparent; "></div> Copied</div></button></div> <pre class=""><!-- HTML_TAG_START -->gigaspeech_head = gigaspeech[<span class="hljs-string">"train"</span>].take(<span class="hljs-number">2</span>) | |
| <span class="hljs-built_in">list</span>(gigaspeech_head)<!-- HTML_TAG_END --></pre></div> <p data-svelte-h="svelte-dbzevp"><strong>Sortie :</strong></p> <div class="code-block relative "><div class="absolute top-2.5 right-4"><button class="inline-flex items-center relative text-sm focus:text-green-500 cursor-pointer focus:outline-none transition duration-200 ease-in-out opacity-0 mx-0.5 text-gray-600 " title="code excerpt" type="button"><svg class="" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg> <div class="absolute pointer-events-none transition-opacity bg-black text-white py-1 px-2 leading-tight rounded font-normal shadow left-1/2 top-full transform -translate-x-1/2 translate-y-2 opacity-0"><div class="absolute bottom-full left-1/2 transform -translate-x-1/2 w-0 h-0 border-black border-4 border-t-0" style="border-left-color: transparent; border-right-color: transparent; "></div> Copied</div></button></div> <pre class=""><!-- HTML_TAG_START -->[ | |
| { | |
| <span class="hljs-string">"segment_id"</span>: <span class="hljs-string">"YOU0000000315_S0000660"</span>, | |
| <span class="hljs-string">"speaker"</span>: <span class="hljs-string">"N/A"</span>, | |
| <span class="hljs-string">"text"</span>: <span class="hljs-string">"AS THEY'RE LEAVING <COMMA> CAN KASH PULL ZAHRA ASIDE REALLY QUICKLY <QUESTIONMARK>"</span>, | |
| <span class="hljs-string">"audio"</span>: { | |
| <span class="hljs-string">"path"</span>: <span class="hljs-string">"xs_chunks_0000/YOU0000000315_S0000660.wav"</span>, | |
| <span class="hljs-string">"array"</span>: array( | |
| [ | |
| <span class="hljs-number">0.0005188</span>, | |
| <span class="hljs-number">0.00085449</span>, | |
| <span class="hljs-number">0.00012207</span>, | |
| ..., | |
| <span class="hljs-number">0.00125122</span>, | |
| <span class="hljs-number">0.00076294</span>, | |
| <span class="hljs-number">0.00036621</span>, | |
| ] | |
| ), | |
| <span class="hljs-string">"sampling_rate"</span>: <span class="hljs-number">16000</span>, | |
| }, | |
| <span class="hljs-string">"begin_time"</span>: <span class="hljs-number">2941.89</span>, | |
| <span class="hljs-string">"end_time"</span>: <span class="hljs-number">2945.07</span>, | |
| <span class="hljs-string">"audio_id"</span>: <span class="hljs-string">"YOU0000000315"</span>, | |
| <span class="hljs-string">"title"</span>: <span class="hljs-string">"Return to Vasselheim | Critical Role: VOX MACHINA | Episode 43"</span>, | |
| <span class="hljs-string">"url"</span>: <span class="hljs-string">"https://www.youtube.com/watch?v=zr2n1fLVasU"</span>, | |
| <span class="hljs-string">"source"</span>: <span class="hljs-number">2</span>, | |
| <span class="hljs-string">"category"</span>: <span class="hljs-number">24</span>, | |
| <span class="hljs-string">"original_full_path"</span>: <span class="hljs-string">"audio/youtube/P0004/YOU0000000315.opus"</span>, | |
| }, | |
| { | |
| <span class="hljs-string">"segment_id"</span>: <span class="hljs-string">"AUD0000001043_S0000775"</span>, | |
| <span class="hljs-string">"speaker"</span>: <span class="hljs-string">"N/A"</span>, | |
| <span class="hljs-string">"text"</span>: <span class="hljs-string">"SIX TOMATOES <PERIOD>"</span>, | |
| <span class="hljs-string">"audio"</span>: { | |
| <span class="hljs-string">"path"</span>: <span class="hljs-string">"xs_chunks_0000/AUD0000001043_S0000775.wav"</span>, | |
| <span class="hljs-string">"array"</span>: array( | |
| [ | |
| <span class="hljs-number">1.43432617</span>e-03, | |
| <span class="hljs-number">1.37329102</span>e-03, | |
| <span class="hljs-number">1.31225586</span>e-03, | |
| ..., | |
| <span class="hljs-number">-6.10351562</span>e-05, | |
| <span class="hljs-number">-1.22070312</span>e-04, | |
| <span class="hljs-number">-1.83105469</span>e-04, | |
| ] | |
| ), | |
| <span class="hljs-string">"sampling_rate"</span>: <span class="hljs-number">16000</span>, | |
| }, | |
| <span class="hljs-string">"begin_time"</span>: <span class="hljs-number">3673.96</span>, | |
| <span class="hljs-string">"end_time"</span>: <span class="hljs-number">3675.26</span>, | |
| <span class="hljs-string">"audio_id"</span>: <span class="hljs-string">"AUD0000001043"</span>, | |
| <span class="hljs-string">"title"</span>: <span class="hljs-string">"Asteroid of Fear"</span>, | |
| <span class="hljs-string">"url"</span>: <span class="hljs-string">"http//www.archive.org/download/asteroid_of_fear_1012_librivox/asteroid_of_fear_1012_librivox_64kb_mp3.zip"</span>, | |
| <span class="hljs-string">"source"</span>: <span class="hljs-number">0</span>, | |
| <span class="hljs-string">"category"</span>: <span class="hljs-number">28</span>, | |
| <span class="hljs-string">"original_full_path"</span>: <span class="hljs-string">"audio/audiobook/P0011/AUD0000001043.opus"</span>, | |
| }, | |
| ]<!-- HTML_TAG_END --></pre></div> <p data-svelte-h="svelte-1gshfjf">Le mode streaming peut faire passer vos recherches au niveau supérieur : non seulement les plus grands jeux de données vous sont accessibles mais vous pouvez facilement évaluer les systèmes sur plusieurs jeux de données en une seule fois sans vous soucier de votre espace disque. | |
| Par rapport à l’évaluation sur un seul jeu de données, l’évaluation multi-jeux de données donne une meilleure mesure des capacités de généralisation d’un système de reconnaissance vocale (cf. <em>End-to-end Speech Benchmark</em> (ESB)).</p> <a class="!text-gray-400 !no-underline text-sm flex items-center not-prose mt-4" href="https://github.com/huggingface/audio-transformers-course/blob/main/chapters/fr/chapter1/streaming.mdx" target="_blank"><svg class="mr-1" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M31,16l-7,7l-1.41-1.41L28.17,16l-5.58-5.59L24,9l7,7z"></path><path d="M1,16l7-7l1.41,1.41L3.83,16l5.58,5.59L8,23l-7-7z"></path><path d="M12.419,25.484L17.639,6.552l1.932,0.518L14.351,26.002z"></path></svg> <span data-svelte-h="svelte-zjs2n5"><span class="underline">Update</span> on GitHub</span></a> <p></p> | |
| <script> | |
| { | |
| __sveltekit_oc6cu6 = { | |
| assets: "/docs/audio-course/pr_239/fr", | |
| base: "/docs/audio-course/pr_239/fr", | |
| env: {} | |
| }; | |
| const element = document.currentScript.parentElement; | |
| const data = [null,null]; | |
| Promise.all([ | |
| import("/docs/audio-course/pr_239/fr/_app/immutable/entry/start.48d22ca3.js"), | |
| import("/docs/audio-course/pr_239/fr/_app/immutable/entry/app.4e1ef9b0.js") | |
| ]).then(([kit, app]) => { | |
| kit.start(app, element, { | |
| node_ids: [0, 10], | |
| data, | |
| form: null, | |
| error: null | |
| }); | |
| }); | |
| } | |
| </script> | |
Xet Storage Details
- Size:
- 26.3 kB
- Xet hash:
- 39551b84af30e6b6c1d4ae85573d9d220b260359a607dda52a0b2a7ec366a265
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.