Buckets:
| import{s as B,n as I,o as J}from"../chunks/scheduler.37c15a92.js";import{S as K,i as N,g as r,s as i,r as q,A as Q,h as m,f as a,c as s,j as O,u as U,x as v,k,y as V,a as n,v as z,d as F,t as G,w as R}from"../chunks/index.2bf4358c.js";import{H as W,E as X}from"../chunks/getInferenceSnippets.ebf8be91.js";function Y(y){let l,H,d,b,p,x,o,E='В <a href="../chapter3/1">главе 3</a> вы поверхностно ознакомились с библиотекой 🤗 Datasets и увидели три главных шага для использования ее в процессе fine-tuning:',g,u,A="<li>Загрузить датасет из Hugging Face Hub.</li> <li>Произвести препроцессинг с помощью <code>Dataset.map()</code>.</li> <li>Загрузить и вычислить метрики.</li>",L,f,j="Но это лишь малая часть того, на что способна 🤗 Datasets! В этой главе мы углубимся в библиотеку и попутно мы найдем ответы на следующие вопросы:",M,c,D="<li>Что делать, когда нужного набора данных нет в Hub?</li> <li>Как вы можете разделиить датасет? (Что если вам <em>действительно</em> нужно использовать Pandas?)</li> <li>Что делать, когда ваш набор данных огромен и «расплавит» оперативную память вашего ноутбука?</li> <li>Что, черт возьми, такое «отображение памяти» (memory mapping) и Apache Arrow?</li> <li>Как вы можете создать свой собственный датасет и отправить его в Hub?</li>",P,h,S='Принципы, которые вы изучите в этой главе, подготовят вас к более глубокому использованию токенизации и fine-tuning’а моделей в <a href="../chapter6">главе 6</a> и <a href="../chapter7">главе 7</a> – заваривайте кофе и мы начинаем!',T,_,w,$,C;return p=new W({props:{title:"Введение",local:"введение",headingTag:"h1"}}),_=new X({props:{source:"https://github.com/huggingface/course/blob/main/chapters/ru/chapter5/1.mdx"}}),{c(){l=r("meta"),H=i(),d=r("p"),b=i(),q(p.$$.fragment),x=i(),o=r("p"),o.innerHTML=E,g=i(),u=r("ol"),u.innerHTML=A,L=i(),f=r("p"),f.textContent=j,M=i(),c=r("ul"),c.innerHTML=D,P=i(),h=r("p"),h.innerHTML=S,T=i(),q(_.$$.fragment),w=i(),$=r("p"),this.h()},l(t){const e=Q("svelte-u9bgzb",document.head);l=m(e,"META",{name:!0,content:!0}),e.forEach(a),H=s(t),d=m(t,"P",{}),O(d).forEach(a),b=s(t),U(p.$$.fragment,t),x=s(t),o=m(t,"P",{"data-svelte-h":!0}),v(o)!=="svelte-ypcwbb"&&(o.innerHTML=E),g=s(t),u=m(t,"OL",{"data-svelte-h":!0}),v(u)!=="svelte-1ordrnj"&&(u.innerHTML=A),L=s(t),f=m(t,"P",{"data-svelte-h":!0}),v(f)!=="svelte-1olp92q"&&(f.textContent=j),M=s(t),c=m(t,"UL",{"data-svelte-h":!0}),v(c)!=="svelte-1vn00s9"&&(c.innerHTML=D),P=s(t),h=m(t,"P",{"data-svelte-h":!0}),v(h)!=="svelte-gpjvn3"&&(h.innerHTML=S),T=s(t),U(_.$$.fragment,t),w=s(t),$=m(t,"P",{}),O($).forEach(a),this.h()},h(){k(l,"name","hf:doc:metadata"),k(l,"content",Z)},m(t,e){V(document.head,l),n(t,H,e),n(t,d,e),n(t,b,e),z(p,t,e),n(t,x,e),n(t,o,e),n(t,g,e),n(t,u,e),n(t,L,e),n(t,f,e),n(t,M,e),n(t,c,e),n(t,P,e),n(t,h,e),n(t,T,e),z(_,t,e),n(t,w,e),n(t,$,e),C=!0},p:I,i(t){C||(F(p.$$.fragment,t),F(_.$$.fragment,t),C=!0)},o(t){G(p.$$.fragment,t),G(_.$$.fragment,t),C=!1},d(t){t&&(a(H),a(d),a(b),a(x),a(o),a(g),a(u),a(L),a(f),a(M),a(c),a(P),a(h),a(T),a(w),a($)),a(l),R(p,t),R(_,t)}}}const Z='{"title":"Введение","local":"введение","sections":[],"depth":1}';function tt(y){return J(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class lt extends K{constructor(l){super(),N(this,l,tt,Y,B,{})}}export{lt as component}; | |
Xet Storage Details
- Size:
- 4.02 kB
- Xet hash:
- 8a9ab6d46e43163169d334bfcaa4ddf08643ce9941773445f76ce318301e9e4f
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.