Buckets:

rtrm's picture
download
raw
3.73 kB
import{s as G,n as J,o as K}from"../chunks/scheduler.37c15a92.js";import{S as Q,i as V,g as i,s as n,r as A,A as W,h as l,f as a,c as s,j as U,u as E,x as _,k as B,y as X,a as o,v as z,d as O,t as y,w as k}from"../chunks/index.2bf4358c.js";import{C as Y}from"../chunks/CourseFloatingBanner.6add7356.js";import{H as Z,E as ee}from"../chunks/getInferenceSnippets.24b50994.js";function te(D){let r,b,$,C,u,q,p,H,m,N='No <a href="/course/chapter3">Capítulo 3</a> você teve seu primeiro gostinho da biblioteca 🤗 Datasets e viu que havia três passos principais quando se tratava de treinar para melhorar (fine-tuning) um modelo:',x,c,S="<li>Carregar um conjunto de dados (dataset) do Hugging Face Hub.</li> <li>Pré-processar os dados com <code>Dataset.map()</code>.</li> <li>Carregar e calcular as métricas.</li>",M,d,F="Mas isto está apenas arranhando a superfície do que 🤗 Dataset.map pode fazer! Neste capítulo, vamos dar um mergulho profundo na biblioteca. Ao longo do caminho, encontraremos respostas para as seguintes perguntas:",L,f,I="<li>O que você faz quando seu conjunto de dados não está no Hub?</li> <li>Como você pode separar um conjunto de dados? (E se você <em>necessário</em> usar Pandas?)</li> <li>O que você faz quando seu conjunto de dados é enorme e derreterá a RAM de seu laptop?</li> <li>O que diabos são “mapeamento de memória” e Apache Arrow?</li> <li>Como você pode criar seu próprio conjunto de dados e enviar para o Hub?</li>",P,h,R='As técnicas que você aprender aqui vão prepará-lo para as tarefas avançadas de tokenization e fine-tuning no <a href="/course/chapter6">Capítulo 6</a> e <a href="/course/chapter7">Capítulo 7</a> — então pegue um café e vamos começar!',w,v,T,g,j;return u=new Z({props:{title:"Introdução",local:"introdução",headingTag:"h1"}}),p=new Y({props:{chapter:5,classNames:"absolute z-10 right-0 top-0"}}),v=new ee({props:{source:"https://github.com/huggingface/course/blob/main/chapters/pt/chapter5/1.mdx"}}),{c(){r=i("meta"),b=n(),$=i("p"),C=n(),A(u.$$.fragment),q=n(),A(p.$$.fragment),H=n(),m=i("p"),m.innerHTML=N,x=n(),c=i("ol"),c.innerHTML=S,M=n(),d=i("p"),d.textContent=F,L=n(),f=i("ul"),f.innerHTML=I,P=n(),h=i("p"),h.innerHTML=R,w=n(),A(v.$$.fragment),T=n(),g=i("p"),this.h()},l(e){const t=W("svelte-u9bgzb",document.head);r=l(t,"META",{name:!0,content:!0}),t.forEach(a),b=s(e),$=l(e,"P",{}),U($).forEach(a),C=s(e),E(u.$$.fragment,e),q=s(e),E(p.$$.fragment,e),H=s(e),m=l(e,"P",{"data-svelte-h":!0}),_(m)!=="svelte-19qoe2w"&&(m.innerHTML=N),x=s(e),c=l(e,"OL",{"data-svelte-h":!0}),_(c)!=="svelte-oksl7q"&&(c.innerHTML=S),M=s(e),d=l(e,"P",{"data-svelte-h":!0}),_(d)!=="svelte-12pujcg"&&(d.textContent=F),L=s(e),f=l(e,"UL",{"data-svelte-h":!0}),_(f)!=="svelte-17hna07"&&(f.innerHTML=I),P=s(e),h=l(e,"P",{"data-svelte-h":!0}),_(h)!=="svelte-eoquca"&&(h.innerHTML=R),w=s(e),E(v.$$.fragment,e),T=s(e),g=l(e,"P",{}),U(g).forEach(a),this.h()},h(){B(r,"name","hf:doc:metadata"),B(r,"content",ae)},m(e,t){X(document.head,r),o(e,b,t),o(e,$,t),o(e,C,t),z(u,e,t),o(e,q,t),z(p,e,t),o(e,H,t),o(e,m,t),o(e,x,t),o(e,c,t),o(e,M,t),o(e,d,t),o(e,L,t),o(e,f,t),o(e,P,t),o(e,h,t),o(e,w,t),z(v,e,t),o(e,T,t),o(e,g,t),j=!0},p:J,i(e){j||(O(u.$$.fragment,e),O(p.$$.fragment,e),O(v.$$.fragment,e),j=!0)},o(e){y(u.$$.fragment,e),y(p.$$.fragment,e),y(v.$$.fragment,e),j=!1},d(e){e&&(a(b),a($),a(C),a(q),a(H),a(m),a(x),a(c),a(M),a(d),a(L),a(f),a(P),a(h),a(w),a(T),a(g)),a(r),k(u,e),k(p,e),k(v,e)}}}const ae='{"title":"Introdução","local":"introdução","sections":[],"depth":1}';function oe(D){return K(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class le extends Q{constructor(r){super(),V(this,r,oe,te,G,{})}}export{le as component};

Xet Storage Details

Size:
3.73 kB
·
Xet hash:
3641bd470a85777aead0caedb035d38ade4e6a82ff3435e8cf285a0ddbcdd2e9

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.