Buckets:
| import{s as ql,o as Bl}from"../chunks/scheduler.505acc25.js";import{S as Al,i as Ll,e as M,s,c as i,h as Nl,a as f,d as l,b as a,f as Fl,g as r,j as d,k as y,l as Pl,m as n,n as p,t as o,o as c,p as m}from"../chunks/index.821724d0.js";import{C as Sl,H as T,E as Dl}from"../chunks/MermaidChart.svelte_svelte_type_style_lang.cee6bd49.js";import{Y as Ol}from"../chunks/Youtube.c5effbdd.js";import{C as u}from"../chunks/CodeBlock.9ca76b2e.js";import{C as Kl}from"../chunks/CourseFloatingBanner.415ffed3.js";import{Q as Xe}from"../chunks/Question.33cf0d1a.js";import{F as en}from"../chunks/FrameworkSwitchCourse.fd0863d0.js";function tn(rl){let $,Qe,g,Ve,J,Ye,k,Fe,v,qe,x,Be,R,Ae,H,pl='๐ค Transformers๋ <code>Trainer</code> ํด๋์ค๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ด ํด๋์ค๋ฅผ ์ฌ์ฉํ๋ฉด ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ฌ๋ฌ๋ถ์ ๋ฐ์ดํฐ์ ์ ๋ง์ถฐ ์ต์ ๊ธฐ๋ฒ์ผ๋ก ์ฝ๊ฒ ๋ฏธ์ธ ์กฐ์ ํ ์ ์์ต๋๋ค. ์ด์ ์น์ ์์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ์์ ์ ๋ชจ๋ ๋ง์ณค๋ค๋ฉด ์ด์ ๋ช ๋จ๊ณ๋ง ๊ฑฐ์น๋ฉด <code>Trainer</code>๋ฅผ ์ ์ํ ์ ์์ต๋๋ค. ๊ฐ์ฅ ์ด๋ ค์ด ๋ถ๋ถ์ <code>Trainer.train()</code>์ ์คํํ ํ๊ฒฝ์ ์ค๋นํ๋ ๊ณผ์ ์ผ ์ ์์ต๋๋ค. ์ด ์์ ์ CPU์์ ๋งค์ฐ ๋๋ฆฌ๊ฒ ์คํ๋๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ง์ฝ GPU๊ฐ ์๋ค๋ฉด <a href="https://colab.research.google.com/" rel="nofollow">Google Colab</a>์์ ๋ฌด๋ฃ๋ก ์ ๊ณตํ๋ GPU๋ TPU๋ฅผ ์ด์ฉํ ์ ์์ต๋๋ค.',Le,U,ol='<p>๐ <strong>ํ๋ จ ๋ฆฌ์์ค</strong>: ํ๋ จ์ ์์ํ๊ธฐ ์ ์ ํฌ๊ด์ ์ธ <a href="https://huggingface.co/docs/transformers/main/en/training" rel="nofollow">๐ค Transformers ํ๋ จ ๊ฐ์ด๋</a>๋ฅผ ์์งํ๊ณ <a href="https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu" rel="nofollow">๋ฏธ์ธ ์กฐ์ ์ฟก๋ถ</a>์ ์ค์ฉ์ ์ธ ์์ ๋ฅผ ์ดํด๋ณด์ธ์.</p>',Ne,W,cl="์๋ ์ฝ๋ ์์๋ ์ด์ ์น์ ์ ์ฝ๋๋ฅผ ๋ชจ๋ ์คํํ๋ค๋ ๊ฐ์ ํ์ ์๋ํฉ๋๋ค. ์ฆ, ๋ค์ ์ฌํญ๋ค์ด ํ์ํฉ๋๋ค.",Pe,G,Se,I,De,Z,ml="<code>Trainer</code>๋ฅผ ์ ์ํ๊ธฐ ์ ์ฒซ ๋ฒ์งธ ๋จ๊ณ๋ <code>Trainer</code>๊ฐ ํ๋ จ ๋ฐ ํ๊ฐ์ ์ฌ์ฉํ ๋ชจ๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋ด์<code>TrainingArguments</code> ํด๋์ค๋ฅผ ์ ์ํ๋ ๊ฒ์ ๋๋ค. ํ์๋ก ์ ๊ณตํด์ผ ํ๋ ์ ์ผํ ์ธ์๋ ํ๋ จ๋ ๋ชจ๋ธ๊ณผ ์ค๊ฐ ์ฒดํฌํฌ์ธํธ๊ฐ ์ ์ฅ๋ ๋๋ ํ ๋ฆฌ์ ๋๋ค. ๋๋จธ์ง๋ ๊ธฐ๋ณธ๊ฐ์ผ๋ก ๋ ์ ์์ผ๋ฉฐ, ๊ธฐ๋ณธ์ ์ธ ๋ฏธ์ธ ์กฐ์ ์์ ์๋ ์ถฉ๋ถํ ์ค์ ์ ๋๋ค.",Oe,E,Ke,Q,Ml='ํ๋ จ ์ค์ ๋ชจ๋ธ์ Hub์ ์๋์ผ๋ก ์ ๋ก๋ํ๋ ค๋ฉด <code>TrainingArguments</code>์์ <code>push_to_hub=True</code>๋ฅผ ์ ๋ฌํ์ธ์. ์ด ๊ธฐ๋ฅ์ ๋ํด์๋ <a href="/course/chapter4/3">Chapter 4</a>์์ ์์ธํ ์์๋ณด๊ฒ ์ต๋๋ค.',et,b,fl='<p>๐ <strong>๊ณ ๊ธ ์ค์ </strong>: ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ ํ๋ จ ์ธ์์ ์ต์ ํ ์ ๋ต์ ๋ํ ์์ธํ ์ ๋ณด๋ <a href="https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.TrainingArguments" rel="nofollow">TrainingArguments ๋ฌธ์</a>์ <a href="https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu" rel="nofollow">ํ๋ จ ๊ตฌ์ฑ ์ฟก๋ถ</a>์ ์ฐธ๊ณ ํ์ธ์.</p>',tt,V,dl='๋ ๋ฒ์งธ ๋จ๊ณ๋ ๋ชจ๋ธ์ ์ ์ํ๋ ๊ฒ์ ๋๋ค. <a href="/course/chapter2">์ด์ ์ฑํฐ</a>์์์ ๊ฐ์ด ๋ ๊ฐ์ ๋ผ๋ฒจ๊ณผ ํจ๊ป <code>AutoModelForSequenceClassification</code> ํด๋์ค๋ฅผ ์ฌ์ฉํ๊ฒ ์ต๋๋ค.',lt,X,nt,z,ul='<a href="/course/chapter2">Chapter 2</a>์ ๋ฌ๋ฆฌ ์ด ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ์ธ์คํด์คํํ๋ฉด ๊ฒฝ๊ณ ๋ฉ์์ง๊ฐ ๋ํ๋๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. ์ด๋ BERT๊ฐ ๋ฌธ์ฅ ์ ๋ถ๋ฅ๋ฅผ ์ํด ์ฌ์ ํ๋ จ๋์ง ์์๊ธฐ ๋๋ฌธ์, ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ํค๋๊ฐ ์ ๊ฑฐ๋๊ณ ์ํ์ค ๋ถ๋ฅ์ ์ ํฉํ ์๋ก์ด ํค๋๊ฐ ์ถ๊ฐ๋์๊ธฐ ๋๋ฌธ์ ๋๋ค. ๊ฒฝ๊ณ ๋ ์ผ๋ถ ๊ฐ์ค์น(์ ๊ฑฐ๋ ์ฌ์ ํ๋ จ ํค๋์ ํด๋นํ๋ ๊ฐ์ค์น)๊ฐ ์ฌ์ฉ๋์ง ์์๊ณ , ์ผ๋ถ ๋ค๋ฅธ ๊ฐ์ค์น(์๋ก์ด ํค๋์ฉ)๊ฐ ๋ฌด์์๋ก ์ด๊ธฐํ๋์๋ค๋ ๊ฒ์ ๋ํ๋ ๋๋ค. ๋ง์ง๋ง์ผ๋ก ๋ชจ๋ธ์ ํ๋ จ์ํค๋ผ๋ ๋ฉ์์ง๊ฐ ๋์ค๋๋ฐ, ๋ฐ๋ก ์ง๊ธ๋ถํฐ ๊ทธ ์์ ์ ์์ํ๊ฒ ์ต๋๋ค.',st,Y,Tl="๋ชจ๋ธ์ด ์ค๋น๋๋ฉด, ์ง๊ธ๊น์ง ๊ตฌ์ฑํ ๋ชจ๋ ๊ฐ์ฒด(<code>model</code>, <code>training_args</code>, ํ๋ จ ๋ฐ ๊ฒ์ฆ ๋ฐ์ดํฐ์ , <code>data_collator</code>, <code>processing_class</code>)๋ฅผ ์ ๋ฌํ์ฌ <code>Trainer</code>๋ฅผ ์ ์ํ ์ ์์ต๋๋ค. <code>processing_class</code> ๋งค๊ฐ๋ณ์๋ ๋น๊ต์ ์ต๊ทผ์ ์ถ๊ฐ๋ ๊ธฐ๋ฅ์ผ๋ก, <code>Trainer</code>์๊ฒ ์ด๋ค ํ ํฌ๋์ด์ ๋ฅผ ์ฌ์ฉํด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ์ง ์๋ ค์ค๋๋ค.",at,F,it,q,$l="<code>processing_class</code>์ ํ ํฌ๋์ด์ ๋ฅผ ์ ๋ฌํ๋ฉด, <code>Trainer</code>๊ฐ ๊ธฐ๋ณธ์ ์ผ๋ก <code>DataCollatorWithPadding</code>์ <code>data_collator</code>๋ก ์ฌ์ฉํฉ๋๋ค. ๋ฐ๋ผ์ ์ด ๊ฒฝ์ฐ์๋ <code>data_collator=data_collator</code> ์ค์ ์๋ตํ ์ ์์ง๋ง, ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ์ ์ค์ํ ๋ถ๋ถ์ ๋ณด์ฌ๋๋ฆฌ๊ธฐ ์ํด ์ฝ๋์ ํฌํจํ์ต๋๋ค.",rt,w,yl='<p>๐ <strong>๋ ์์ธํ ์์๋ณด๊ธฐ</strong>: Trainer ํด๋์ค์ ๊ทธ ๋งค๊ฐ๋ณ์์ ๋ํ ์์ธํ ๋ด์ฉ์ <a href="https://huggingface.co/docs/transformers/main/en/main_classes/trainer" rel="nofollow">Trainer API ๋ฌธ์</a>๋ฅผ ๋ฐฉ๋ฌธํ๊ณ <a href="https://huggingface.co/learn/cookbook/en/fine_tuning_code_llm_on_single_gpu" rel="nofollow">ํ๋ จ ์ฟก๋ถ ๋ ์ํผ</a>์์ ๊ณ ๊ธ ์ฌ์ฉ ํจํด์ ์ดํด๋ณด์ธ์.</p>',pt,B,gl="๋ฐ์ดํฐ์ ์์ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ค๋ฉด <code>Trainer</code>์ <code>train()</code> ๋ฉ์๋๋ฅผ ํธ์ถํ๊ธฐ๋ง ํ๋ฉด ๋ฉ๋๋ค.",ot,A,ct,L,Jl="์ด๋ ๊ฒ ํ๋ฉด ๋ฏธ์ธ ์กฐ์ ์ด ์์๋ฉ๋๋ค(GPU์์๋ ๋ช ๋ถ ์ ๋ ์์๋ฉ๋๋ค). 500๋จ๊ณ๋ง๋ค ํ๋ จ ์์ค์ด ์ถ๋ ฅ๋์ง๋ง, ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ผ๋ง๋ ์ข์์ง(๋๋ ๋์์ง)๋ ์๋ ค์ฃผ์ง ์์ต๋๋ค. ๊ทธ ์ด์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.",mt,N,Ul="<li><code>TrainingArguments</code>์์ <code>eval_strategy</code>๋ฅผ <code>"steps"</code> (๋งค <code>eval_steps</code>๋ง๋ค ํ๊ฐ) ๋๋ <code>"epoch"</code> (๊ฐ ์ํฌํฌ ์ข ๋ฃ ์ ํ๊ฐ)๋ก ์ค์ ํ์ง ์์์ต๋๋ค.</li> <li>ํ๊ฐ ์ค์ ๋ฉํธ๋ฆญ์ ๊ณ์ฐํ๊ธฐ ์ํ <code>compute_metrics()</code> ํจ์๋ฅผ <code>Trainer</code>์ ์ ๊ณตํ์ง ์์์ต๋๋ค. ์ด ํจ์๊ฐ ์์ผ๋ฉด ํ๊ฐ์์ ์์ค ๊ฐ๋ง ์ถ๋ ฅ๋๋๋ฐ, ์ด ๊ฐ๋ง์ผ๋ก๋ ์ฑ๋ฅ์ ํ์ ํ๊ธฐ ์ด๋ ต์ต๋๋ค.</li>",Mt,P,ft,S,bl="์ด์ ์ ์ฉํ <code>compute_metrics()</code> ํจ์๋ฅผ ์ด๋ป๊ฒ ๋ง๋ค๊ณ ๋ค์ ํ๋ จ ์ ์ฌ์ฉํ ์ ์๋์ง ์์๋ณด๊ฒ ์ต๋๋ค. ์ด ํจ์๋ <code>EvalPrediction</code> ๊ฐ์ฒด(<code>predictions</code> ํ๋์ <code>label_ids</code> ํ๋๋ฅผ ๊ฐ๋ ๋ช ๋ช ๋ ํํ)๋ฅผ ์ ๋ ฅ๋ฐ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ ๋ฉํธ๋ฆญ์ ์ด๋ฆ์ ํค(๋ฌธ์์ด)๋ก, ์ฑ๋ฅ์ ๊ฐ(๋ถ๋์์์ )์ผ๋ก ๊ฐ๋ ๋์ ๋๋ฆฌ๋ฅผ ๋ฐํํด์ผ ํฉ๋๋ค. ๋ชจ๋ธ์ ์์ธก๊ฐ์ ์ป๊ธฐ ์ํด <code>Trainer.predict()</code>๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค.",dt,D,ut,O,Tt,K,wl="<code>predict()</code> ๋ฉ์๋์ ์ถ๋ ฅ์ <code>predictions</code>, <code>label_ids</code>, <code>metrics</code> ์ธ ๊ฐ์ ํ๋๊ฐ ์๋ ๋ ๋ค๋ฅธ ๋ช ๋ช ๋ ํํ์ ๋๋ค. <code>metrics</code> ํ๋์๋ ์ ๋ฌ๋ ๋ฐ์ดํฐ์ ์ ๋ํ ์์ค ๊ฐ๊ณผ ์๊ฐ ๊ด๋ จ ๋ฉํธ๋ฆญ(์ด ์์ธก ์๊ฐ, ํ๊ท ์์ธก ์๊ฐ)๋ง ํฌํจ๋ฉ๋๋ค. ํ์ง๋ง <code>compute_metrics()</code> ํจ์๋ฅผ ์์ฑํ์ฌ <code>Trainer</code>์ ์ ๋ฌํ๋ฉด, ์ด ํ๋์ <code>compute_metrics()</code>๊ฐ ๋ฐํํ๋ ๋ฉํธ๋ฆญ๋ค๋ ํจ๊ป ํฌํจ๋ฉ๋๋ค.",$t,ee,hl='๋ณด์๋ค์ํผ, <code>predictions</code>๋ 408 x 2 ๋ชจ์์ 2์ฐจ์ ๋ฐฐ์ด์ ๋๋ค (408์ predict()์ ์ ๋ฌํ ๋ฐ์ดํฐ์ ์ ์ํ ๊ฐ์์ ๋๋ค). ์ด ๊ฐ๋ค์ <code>predict()</code>์ ์ ๋ฌํ ๋ฐ์ดํฐ์ ์ ๊ฐ ์ํ์ ๋ํ ๋ก์ง์ ๋๋ค (<a href="/course/chapter2">์ด์ ์ฑํฐ</a>์์ ๋ณด์๋ฏ์ด ๋ชจ๋ Transformer ๋ชจ๋ธ์ ๋ก์ง์ ๋ฐํํฉ๋๋ค). ์ด ๋ก์ง์ ์ฐ๋ฆฌ๊ฐ ๊ฐ์ง ๋ ์ด๋ธ๊ณผ ๋น๊ตํ ์ ์๋ ์์ธก๊ฐ์ผ๋ก ๋ณํํ๋ ค๋ฉด, ๋ ๋ฒ์งธ ์ถ์์ ์ต๋๊ฐ์ ๊ฐ์ง ์ธ๋ฑ์ค๋ฅผ ๊ตฌํด์ผ ํฉ๋๋ค.',yt,te,gt,le,jl='์ด์ ์ด <code>preds</code>๋ฅผ ๋ผ๋ฒจ๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค. <code>compute_metric()</code> ํจ์๋ฅผ ๋น๋ํ๊ธฐ ์ํด ๐ค <a href="https://github.com/huggingface/evaluate/" rel="nofollow">Evaluate</a> ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ฉํธ๋ฆญ์ ํ์ฉํ๊ฒ ์ต๋๋ค. ๋ฐ์ดํฐ์ ์ ๋ก๋ํ๋ ๊ฒ์ฒ๋ผ, MRPC ๋ฐ์ดํฐ์ ๊ณผ ๊ด๋ จ๋ ๋ฉํธ๋ฆญ๋ <code>evaluate.load()</code> ํจ์๋ก ์ฝ๊ฒ ๋ก๋ํ ์ ์์ต๋๋ค. ๋ฐํ๋ ๊ฐ์ฒด์ <code>compute()</code> ๋ฉ์๋๋ฅผ ์ฌ์ฉํด ๋ฉํธ๋ฆญ์ ๊ณ์ฐํ ์ ์์ต๋๋ค.',Jt,ne,Ut,se,bt,h,_l='<p>๋ค์ํ ํ๊ฐ ๋ฉํธ๋ฆญ๊ณผ ์ ๋ต์ ๋ํด ์์๋ณด๋ ค๋ฉด <a href="https://huggingface.co/docs/evaluate/" rel="nofollow">๐ค Evaluate ๋ฌธ์</a>๋ฅผ ์ฐธ๊ณ ํ์ธ์.</p>',wt,ae,Cl='๋ชจ๋ธ ํค๋์ ๊ฐ์ค์น๊ฐ ๋ฌด์์๋ก ์ด๊ธฐํ๋๊ธฐ ๋๋ฌธ์ ์ป๊ฒ ๋๋ ๊ฒฐ๊ณผ๋ ์กฐ๊ธ์ฉ ๋ค๋ฅผ ์ ์์ต๋๋ค. ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด ์ฐ๋ฆฌ ๋ชจ๋ธ์ด ๊ฒ์ฆ ์ธํธ์์ 85.78%์ ์ ํ๋์ 89.97%์ F1 ์ ์๋ฅผ ๋ฌ์ฑํ์์ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋ ๊ฐ์ง๋ GLUE ๋ฒค์น๋งํฌ์ MRPC ๋ฐ์ดํฐ์ ์์ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ฉํธ๋ฆญ์ ๋๋ค. <a href="https://arxiv.org/pdf/1810.04805.pdf" rel="nofollow">BERT ๋ ผ๋ฌธ</a>์์๋ ๊ธฐ๋ณธ ๋ชจ๋ธ์ F1 ์ ์๋ฅผ 88.9๋ก ๋ณด๊ณ ํ์์ต๋๋ค. ๋น์์๋ <code>uncased</code> ๋ชจ๋ธ์ ์ฌ์ฉํ์ง๋ง, ์ฐ๋ฆฌ๋ ํ์ฌ <code>cased</code> ๋ชจ๋ธ์ ์ฌ์ฉํ๊ณ ์๊ธฐ ๋๋ฌธ์ ๋ ๋์ ๊ฒฐ๊ณผ๊ฐ ๋์จ ๊ฒ์ ๋๋ค.',ht,ie,kl="์ด ๋ชจ๋ ๊ฒ์ ์ข ํฉํ๋ฉด, ๋ค์์ฒ๋ผ <code>compute_metrics()</code> ํจ์๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ ์ ์์ต๋๋ค.",jt,re,_t,pe,vl="๊ฐ ์ํญ์ด ๋๋ ๋๋ง๋ค ๋ฉํธ๋ฆญ์ด ์ถ๋ ฅ๋๋๋ก, ์ด <code>compute_metrics()</code> ํจ์๊ฐ ํฌํจํ์ฌ <code>Trainer</code>๋ฅผ ์๋ก ์ ์ํด ๋ณด๊ฒ ์ต๋๋ค.",Ct,oe,kt,ce,xl="์ฐธ๊ณ ๋ก, ์ฐ๋ฆฌ๋ <code>eval_strategy</code>๋ฅผ <code>"epoch"</code>์ผ๋ก ์ค์ ํ ์๋ก์ด <code>TrainingArguments</code>์ ์๋ก์ด ๋ชจ๋ธ์ ์์ฑํฉ๋๋ค. ์ด๋ ๊ฒ ํ์ง ์์ผ๋ฉด ์ด๋ฏธ ํ๋ จ๋ ๋ชจ๋ธ์ ํ๋ จ์ ๊ณ์ํ๊ฒ ๋ ๊ฒ๋๋ค. ์๋ก์ด ํ๋ จ์ ์์ํ๋ ค๋ฉด ๋ค์์ ์คํํ์ธ์.",vt,me,xt,Me,Rl="์ด๋ฒ์๋ ํ๋ จ ์์ค ์ธ์๋ ๊ฐ ์ํญ์ด ๋๋ ๋๋ง๋ค ๊ฒ์ฆ ์์ค๊ณผ ๋ฉํธ๋ฆญ์ด ํจ๊ป ์ถ๋ ฅ๋ ๊ฒ๋๋ค. ์์ ๋งํ๋ฏ์ด ๋ชจ๋ธ ํค๋์ ๋ฌด์์ ์ด๊ธฐํ ๋๋ฌธ์ ์ฌ๋ฌ๋ถ์ด ์ป๋ ์ ํ๋/F1 ์ ์๋ ์ฐ๋ฆฌ๊ฐ ์ป์ ๊ฒฐ๊ณผ์ ์ฝ๊ฐ ๋ค๋ฅผ ์ ์์ง๋ง, ๋น์ทํ ๋ฒ์์ ์์ ๊ฒ๋๋ค.",Rt,fe,Ht,de,Hl="<code>Trainer</code>๋ ํ๋ ๋ฅ๋ฌ๋์ ๋ชจ๋ฒ ์ฌ๋ก๋ค์ ์ฝ๊ฒ ํ์ฉํ ์ ์๋๋ก ๋ค์ํ ๋ด์ฅ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค.",Wt,ue,Wl="<strong>ํผํฉ ์ ๋ฐ๋ ํ๋ จ</strong>: ๋ ๋น ๋ฅธ ํ๋ จ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋ ๊ฐ์๋ฅผ ์ํด ํ๋ จ ์ธ์์์ <code>fp16=True</code>๋ฅผ ์ค์ ํ์ธ์.",Gt,Te,It,$e,Gl="<strong>๊ทธ๋ ์ด๋์ธํธ ๋์ </strong>: GPU ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ถ์กฑํ ๋ ๋ ํฐ ๋ฐฐ์น ํฌ๊ธฐ๋ก ํ์ตํ๋ ํจ๊ณผ๋ฅผ ๋ผ ์ ์์ต๋๋ค.",Zt,ye,Et,ge,Il="<strong>ํ์ต๋ฅ ์ค์ผ์ค๋ง</strong>: Trainer๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ ํ ๊ฐ์ ๋ฐฉ์์ ์ฌ์ฉํ์ง๋ง, ์ฌ์ฉ์ ๋ง์ถค ์ค์ ์ด ๊ฐ๋ฅํฉ๋๋ค.",Qt,Je,Vt,j,Zl='<p>๐ฏ <strong>์ฑ๋ฅ ์ต์ ํ</strong>: ๋ถ์ฐ ํ๋ จ, ๋ฉ๋ชจ๋ฆฌ ์ต์ ํ, ํ๋์จ์ด๋ณ ์ต์ ํ๋ฅผ ํฌํจํ ๊ณ ๊ธ ํ๋ จ ๊ธฐ์ ์ ๋ํด์๋ <a href="https://huggingface.co/docs/transformers/main/en/performance" rel="nofollow">๐ค Transformers ์ฑ๋ฅ ๊ฐ์ด๋</a>๋ฅผ ์ดํด๋ณด์ธ์.</p>',Xt,Ue,El="<code>Trainer</code>๋ ์ฌ๋ฌ GPU ๋๋ TPU์์ ์ฆ์ ์๋ํ๋ฉฐ ๋ถ์ฐ ํ๋ จ์ ์ํ ๋ง์ ์ต์ ์ ์ ๊ณตํฉ๋๋ค. ์ด์ ๊ด๋ จ๋ ๋ชจ๋ ๋ด์ฉ์ Chapter 10์์ ๋ค๋ฃจ๊ฒ ์ต๋๋ค.",zt,be,Ql='์ด๊ฒ์ผ๋ก <code>Trainer</code> API๋ฅผ ์ฌ์ฉํ ๋ฏธ์ธ ์กฐ์ ์๊ฐ๋ฅผ ๋ง์นฉ๋๋ค. ๋๋ถ๋ถ์ ์ผ๋ฐ์ ์ธ NLP ์์ ์ ๋ํ ์์ ๋ <a href="/course/chapter7">Chapter 7</a>์์ ๋ค๋ฃฐ ์์ ์ด๋ฉฐ, ๋ค์์ผ๋ก๋ ์์ PyTorch ์ฝ๋๋ก ๋์ผํ ์์ ์ ์ํํ๋ ๋ฐฉ๋ฒ์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.',Yt,_,Vl='<p>๐ <strong>๋ ๋ง์ ์์ </strong>: <a href="https://huggingface.co/docs/transformers/main/en/notebooks" rel="nofollow">๐ค Transformers ๋ ธํธ๋ถ</a>์ ์๋ ๋ฐฉ๋ํ ์๋ฃ๋ฅผ ํ์ธํด ๋ณด์ธ์.</p>',Ft,we,qt,he,Xl="Trainer API์ ๋ฏธ์ธ ์กฐ์ ๊ฐ๋ ์ ๋ํ ์ดํด๋ฅผ ํ ์คํธํด๋ณด์ธ์.",Bt,je,At,_e,Lt,Ce,Nt,ke,Pt,ve,St,xe,Dt,Re,Ot,He,Kt,We,el,Ge,tl,Ie,ll,Ze,nl,C,zl="<p>๐ก <strong>ํต์ฌ ์์ :</strong></p> <ul><li><code>Trainer</code> API๋ ๋๋ถ๋ถ์ ํ๋ จ ๋ณต์ก์ฑ์ ์ฒ๋ฆฌํ๋ ๋์ ์์ค์ ์ธํฐํ์ด์ค๋ฅผ ์ ๊ณตํฉ๋๋ค.</li> <li><code>processing_class</code>๋ ์ ์ ํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํด ํ ํฌ๋์ด์ ๋ฅผ ์ ์ฅํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.</li> <li><code>TrainingArguments</code>๋ ํ์ต๋ฅ , ๋ฐฐ์น ํฌ๊ธฐ, ํ๊ฐ ์ ๋ต, ์ต์ ํ ๋ฑ ํ๋ จ์ ๋ชจ๋ ์ธก๋ฉด์ ์ ์ดํฉ๋๋ค.</li> <li><code>compute_metrics</code>๋ฅผ ์ฌ์ฉํ๋ฉด ํ๋ จ ์์ค ์ธ์ ์ฌ์ฉ์ ์ ์ ํ๊ฐ ๋ฉํธ๋ฆญ์ ํ์ฉํ ์ ์์ต๋๋ค.</li> <li>ํผํฉ ์ ๋ฐ๋(<code>fp16=True</code>)์ ๊ทธ๋ ์ด๋์ธํธ ๋์ ๊ณผ ๊ฐ์ ์ต์ ๊ธฐ๋ฅ์ ํ๋ จ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์์ต๋๋ค.</li></ul>",sl,Ee,al,ze,il;return J=new en({props:{fw:rl[0]}}),k=new Sl({props:{containerStyle:"float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"}}),v=new T({props:{title:"Trainer API๋ก ๋ชจ๋ธ ๋ฏธ์ธ ์กฐ์ ํ๊ธฐ",local:"fine-tuning-a-model-with-the-trainer-api",headingTag:"h1"}}),x=new Kl({props:{chapter:3,classNames:"absolute z-10 right-0 top-0",notebooks:[{label:"Google Colab",value:"https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/ko/chapter3/section3.ipynb"},{label:"Aws Studio",value:"https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/ko/chapter3/section3.ipynb"}]}}),R=new Ol({props:{id:"nvBXf7s7vTI"}}),G=new u({props:{code:"ZnJvbSUyMGRhdGFzZXRzJTIwaW1wb3J0JTIwbG9hZF9kYXRhc2V0JTBBZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEF1dG9Ub2tlbml6ZXIlMkMlMjBEYXRhQ29sbGF0b3JXaXRoUGFkZGluZyUwQSUwQXJhd19kYXRhc2V0cyUyMCUzRCUyMGxvYWRfZGF0YXNldCglMjJnbHVlJTIyJTJDJTIwJTIybXJwYyUyMiklMEFjaGVja3BvaW50JTIwJTNEJTIwJTIyYmVydC1iYXNlLXVuY2FzZWQlMjIlMEF0b2tlbml6ZXIlMjAlM0QlMjBBdXRvVG9rZW5pemVyLmZyb21fcHJldHJhaW5lZChjaGVja3BvaW50KSUwQSUwQSUwQWRlZiUyMHRva2VuaXplX2Z1bmN0aW9uKGV4YW1wbGUpJTNBJTBBJTIwJTIwJTIwJTIwcmV0dXJuJTIwdG9rZW5pemVyKGV4YW1wbGUlNUIlMjJzZW50ZW5jZTElMjIlNUQlMkMlMjBleGFtcGxlJTVCJTIyc2VudGVuY2UyJTIyJTVEJTJDJTIwdHJ1bmNhdGlvbiUzRFRydWUpJTBBJTBBJTBBdG9rZW5pemVkX2RhdGFzZXRzJTIwJTNEJTIwcmF3X2RhdGFzZXRzLm1hcCh0b2tlbml6ZV9mdW5jdGlvbiUyQyUyMGJhdGNoZWQlM0RUcnVlKSUwQWRhdGFfY29sbGF0b3IlMjAlM0QlMjBEYXRhQ29sbGF0b3JXaXRoUGFkZGluZyh0b2tlbml6ZXIlM0R0b2tlbml6ZXIp",highlighted:`<span class="hljs-keyword">from</span> datasets <span class="hljs-keyword">import</span> load_dataset | |
| <span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoTokenizer, DataCollatorWithPadding | |
| raw_datasets = load_dataset(<span class="hljs-string">"glue"</span>, <span class="hljs-string">"mrpc"</span>) | |
| checkpoint = <span class="hljs-string">"bert-base-uncased"</span> | |
| tokenizer = AutoTokenizer.from_pretrained(checkpoint) | |
| <span class="hljs-keyword">def</span> <span class="hljs-title function_">tokenize_function</span>(<span class="hljs-params">example</span>): | |
| <span class="hljs-keyword">return</span> tokenizer(example[<span class="hljs-string">"sentence1"</span>], example[<span class="hljs-string">"sentence2"</span>], truncation=<span class="hljs-literal">True</span>) | |
| tokenized_datasets = raw_datasets.<span class="hljs-built_in">map</span>(tokenize_function, batched=<span class="hljs-literal">True</span>) | |
| data_collator = DataCollatorWithPadding(tokenizer=tokenizer)`,wrap:!1}}),I=new T({props:{title:"ํ๋ จ",local:"training",headingTag:"h3"}}),E=new u({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMFRyYWluaW5nQXJndW1lbnRzJTBBJTBBdHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUyMnRlc3QtdHJhaW5lciUyMik=",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> TrainingArguments | |
| training_args = TrainingArguments(<span class="hljs-string">"test-trainer"</span>)`,wrap:!1}}),X=new u({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24lMEElMEFtb2RlbCUyMCUzRCUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQlMkMlMjBudW1fbGFiZWxzJTNEMik=",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoModelForSequenceClassification | |
| model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=<span class="hljs-number">2</span>)`,wrap:!1}}),F=new u({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMFRyYWluZXIlMEElMEF0cmFpbmVyJTIwJTNEJTIwVHJhaW5lciglMEElMjAlMjAlMjAlMjBtb2RlbCUyQyUwQSUyMCUyMCUyMCUyMHRyYWluaW5nX2FyZ3MlMkMlMEElMjAlMjAlMjAlMjB0cmFpbl9kYXRhc2V0JTNEdG9rZW5pemVkX2RhdGFzZXRzJTVCJTIydHJhaW4lMjIlNUQlMkMlMEElMjAlMjAlMjAlMjBldmFsX2RhdGFzZXQlM0R0b2tlbml6ZWRfZGF0YXNldHMlNUIlMjJ2YWxpZGF0aW9uJTIyJTVEJTJDJTBBJTIwJTIwJTIwJTIwZGF0YV9jb2xsYXRvciUzRGRhdGFfY29sbGF0b3IlMkMlMEElMjAlMjAlMjAlMjBwcm9jZXNzaW5nX2NsYXNzJTNEdG9rZW5pemVyJTJDJTBBKQ==",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> Trainer | |
| trainer = Trainer( | |
| model, | |
| training_args, | |
| train_dataset=tokenized_datasets[<span class="hljs-string">"train"</span>], | |
| eval_dataset=tokenized_datasets[<span class="hljs-string">"validation"</span>], | |
| data_collator=data_collator, | |
| processing_class=tokenizer, | |
| )`,wrap:!1}}),A=new u({props:{code:"dHJhaW5lci50cmFpbigp",highlighted:"trainer.train()",wrap:!1}}),P=new T({props:{title:"ํ๊ฐ",local:"evaluation",headingTag:"h3"}}),D=new u({props:{code:"cHJlZGljdGlvbnMlMjAlM0QlMjB0cmFpbmVyLnByZWRpY3QodG9rZW5pemVkX2RhdGFzZXRzJTVCJTIydmFsaWRhdGlvbiUyMiU1RCklMEFwcmludChwcmVkaWN0aW9ucy5wcmVkaWN0aW9ucy5zaGFwZSUyQyUyMHByZWRpY3Rpb25zLmxhYmVsX2lkcy5zaGFwZSk=",highlighted:`predictions = trainer.predict(tokenized_datasets[<span class="hljs-string">"validation"</span>]) | |
| <span class="hljs-built_in">print</span>(predictions.predictions.shape, predictions.label_ids.shape)`,wrap:!1}}),O=new u({props:{code:"KDQwOCUyQyUyMDIpJTIwKDQwOCUyQyk=",highlighted:'(<span class="hljs-number">408</span>, <span class="hljs-number">2</span>) (<span class="hljs-number">408</span>,)',wrap:!1}}),te=new u({props:{code:"aW1wb3J0JTIwbnVtcHklMjBhcyUyMG5wJTBBJTBBcHJlZHMlMjAlM0QlMjBucC5hcmdtYXgocHJlZGljdGlvbnMucHJlZGljdGlvbnMlMkMlMjBheGlzJTNELTEp",highlighted:`<span class="hljs-keyword">import</span> numpy <span class="hljs-keyword">as</span> np | |
| preds = np.argmax(predictions.predictions, axis=-<span class="hljs-number">1</span>)`,wrap:!1}}),ne=new u({props:{code:"aW1wb3J0JTIwZXZhbHVhdGUlMEElMEFtZXRyaWMlMjAlM0QlMjBldmFsdWF0ZS5sb2FkKCUyMmdsdWUlMjIlMkMlMjAlMjJtcnBjJTIyKSUwQW1ldHJpYy5jb21wdXRlKHByZWRpY3Rpb25zJTNEcHJlZHMlMkMlMjByZWZlcmVuY2VzJTNEcHJlZGljdGlvbnMubGFiZWxfaWRzKQ==",highlighted:`<span class="hljs-keyword">import</span> evaluate | |
| metric = evaluate.load(<span class="hljs-string">"glue"</span>, <span class="hljs-string">"mrpc"</span>) | |
| metric.compute(predictions=preds, references=predictions.label_ids)`,wrap:!1}}),se=new u({props:{code:"JTdCJ2FjY3VyYWN5JyUzQSUyMDAuODU3ODQzMTM3MjU0OTAxOSUyQyUyMCdmMSclM0ElMjAwLjg5OTY1Mzk3OTIzODc1NDIlN0Q=",highlighted:'{<span class="hljs-string">'accuracy'</span>: <span class="hljs-number">0.8578431372549019</span>, <span class="hljs-string">'f1'</span>: <span class="hljs-number">0.8996539792387542</span>}',wrap:!1}}),re=new u({props:{code:"ZGVmJTIwY29tcHV0ZV9tZXRyaWNzKGV2YWxfcHJlZHMpJTNBJTBBJTIwJTIwJTIwJTIwbWV0cmljJTIwJTNEJTIwZXZhbHVhdGUubG9hZCglMjJnbHVlJTIyJTJDJTIwJTIybXJwYyUyMiklMEElMjAlMjAlMjAlMjBsb2dpdHMlMkMlMjBsYWJlbHMlMjAlM0QlMjBldmFsX3ByZWRzJTBBJTIwJTIwJTIwJTIwcHJlZGljdGlvbnMlMjAlM0QlMjBucC5hcmdtYXgobG9naXRzJTJDJTIwYXhpcyUzRC0xKSUwQSUyMCUyMCUyMCUyMHJldHVybiUyMG1ldHJpYy5jb21wdXRlKHByZWRpY3Rpb25zJTNEcHJlZGljdGlvbnMlMkMlMjByZWZlcmVuY2VzJTNEbGFiZWxzKQ==",highlighted:`<span class="hljs-keyword">def</span> <span class="hljs-title function_">compute_metrics</span>(<span class="hljs-params">eval_preds</span>): | |
| metric = evaluate.load(<span class="hljs-string">"glue"</span>, <span class="hljs-string">"mrpc"</span>) | |
| logits, labels = eval_preds | |
| predictions = np.argmax(logits, axis=-<span class="hljs-number">1</span>) | |
| <span class="hljs-keyword">return</span> metric.compute(predictions=predictions, references=labels)`,wrap:!1}}),oe=new u({props:{code:"dHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUyMnRlc3QtdHJhaW5lciUyMiUyQyUyMGV2YWxfc3RyYXRlZ3klM0QlMjJlcG9jaCUyMiklMEFtb2RlbCUyMCUzRCUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQlMkMlMjBudW1fbGFiZWxzJTNEMiklMEElMEF0cmFpbmVyJTIwJTNEJTIwVHJhaW5lciglMEElMjAlMjAlMjAlMjBtb2RlbCUyQyUwQSUyMCUyMCUyMCUyMHRyYWluaW5nX2FyZ3MlMkMlMEElMjAlMjAlMjAlMjB0cmFpbl9kYXRhc2V0JTNEdG9rZW5pemVkX2RhdGFzZXRzJTVCJTIydHJhaW4lMjIlNUQlMkMlMEElMjAlMjAlMjAlMjBldmFsX2RhdGFzZXQlM0R0b2tlbml6ZWRfZGF0YXNldHMlNUIlMjJ2YWxpZGF0aW9uJTIyJTVEJTJDJTBBJTIwJTIwJTIwJTIwZGF0YV9jb2xsYXRvciUzRGRhdGFfY29sbGF0b3IlMkMlMEElMjAlMjAlMjAlMjBwcm9jZXNzaW5nX2NsYXNzJTNEdG9rZW5pemVyJTJDJTBBJTIwJTIwJTIwJTIwY29tcHV0ZV9tZXRyaWNzJTNEY29tcHV0ZV9tZXRyaWNzJTJDJTBBKQ==",highlighted:`training_args = TrainingArguments(<span class="hljs-string">"test-trainer"</span>, eval_strategy=<span class="hljs-string">"epoch"</span>) | |
| model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=<span class="hljs-number">2</span>) | |
| trainer = Trainer( | |
| model, | |
| training_args, | |
| train_dataset=tokenized_datasets[<span class="hljs-string">"train"</span>], | |
| eval_dataset=tokenized_datasets[<span class="hljs-string">"validation"</span>], | |
| data_collator=data_collator, | |
| processing_class=tokenizer, | |
| compute_metrics=compute_metrics, | |
| )`,wrap:!1}}),me=new u({props:{code:"dHJhaW5lci50cmFpbigp",highlighted:"trainer.train()",wrap:!1}}),fe=new T({props:{title:"๊ณ ๊ธ ํ๋ จ ๊ธฐ๋ฅ",local:"advanced-training-features",headingTag:"h3"}}),Te=new u({props:{code:"dHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUwQSUyMCUyMCUyMCUyMCUyMnRlc3QtdHJhaW5lciUyMiUyQyUwQSUyMCUyMCUyMCUyMGV2YWxfc3RyYXRlZ3klM0QlMjJlcG9jaCUyMiUyQyUwQSUyMCUyMCUyMCUyMGZwMTYlM0RUcnVlJTJDJTIwJTIwJTIzJTIwJUVEJTk4JUJDJUVEJTk1JUE5JTIwJUVDJUEwJTk1JUVCJUIwJTgwJUVCJThGJTg0JTIwJUVEJTk5JTlDJUVDJTg0JUIxJUVEJTk5JTk0JTBBKQ==",highlighted:`training_args = TrainingArguments( | |
| <span class="hljs-string">"test-trainer"</span>, | |
| eval_strategy=<span class="hljs-string">"epoch"</span>, | |
| fp16=<span class="hljs-literal">True</span>, <span class="hljs-comment"># ํผํฉ ์ ๋ฐ๋ ํ์ฑํ</span> | |
| )`,wrap:!1}}),ye=new u({props:{code:"dHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUwQSUyMCUyMCUyMCUyMCUyMnRlc3QtdHJhaW5lciUyMiUyQyUwQSUyMCUyMCUyMCUyMGV2YWxfc3RyYXRlZ3klM0QlMjJlcG9jaCUyMiUyQyUwQSUyMCUyMCUyMCUyMHBlcl9kZXZpY2VfdHJhaW5fYmF0Y2hfc2l6ZSUzRDQlMkMlMEElMjAlMjAlMjAlMjBncmFkaWVudF9hY2N1bXVsYXRpb25fc3RlcHMlM0Q0JTJDJTIwJTIwJTIzJTIwJUVDJTlDJUEwJUVEJTlBJUE4JTIwJUVCJUIwJUIwJUVDJUI5JTk4JTIwJUVEJTgxJUFDJUVBJUI4JUIwJTIwJTNEJTIwNCUyMColMjA0JTIwJTNEJTIwMTYlMEEp",highlighted:`training_args = TrainingArguments( | |
| <span class="hljs-string">"test-trainer"</span>, | |
| eval_strategy=<span class="hljs-string">"epoch"</span>, | |
| per_device_train_batch_size=<span class="hljs-number">4</span>, | |
| gradient_accumulation_steps=<span class="hljs-number">4</span>, <span class="hljs-comment"># ์ ํจ ๋ฐฐ์น ํฌ๊ธฐ = 4 * 4 = 16</span> | |
| )`,wrap:!1}}),Je=new u({props:{code:"dHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUwQSUyMCUyMCUyMCUyMCUyMnRlc3QtdHJhaW5lciUyMiUyQyUwQSUyMCUyMCUyMCUyMGV2YWxfc3RyYXRlZ3klM0QlMjJlcG9jaCUyMiUyQyUwQSUyMCUyMCUyMCUyMGxlYXJuaW5nX3JhdGUlM0QyZS01JTJDJTBBJTIwJTIwJTIwJTIwbHJfc2NoZWR1bGVyX3R5cGUlM0QlMjJjb3NpbmUlMjIlMkMlMjAlMjAlMjMlMjAlRUIlOEIlQTQlRUIlQTUlQjglMjAlRUMlOEElQTQlRUMlQkMlODAlRUMlQTQlODQlRUIlOUYlQUMlMjAlRUMlOEIlOUMlRUIlOEYlODQlMEEp",highlighted:`training_args = TrainingArguments( | |
| <span class="hljs-string">"test-trainer"</span>, | |
| eval_strategy=<span class="hljs-string">"epoch"</span>, | |
| learning_rate=<span class="hljs-number">2e-5</span>, | |
| lr_scheduler_type=<span class="hljs-string">"cosine"</span>, <span class="hljs-comment"># ๋ค๋ฅธ ์ค์ผ์ค๋ฌ ์๋</span> | |
| )`,wrap:!1}}),we=new T({props:{title:"์น์ ํด์ฆ",local:"section-quiz",headingTag:"h2"}}),je=new T({props:{title:"1. Trainer ์์ <code> processing_class </code> ๋งค๊ฐ๋ณ์์ ๋ชฉ์ ์ ๋ฌด์์ธ๊ฐ์?",local:"1-trainer-์์-code-processingclass-code-๋งค๊ฐ๋ณ์์-๋ชฉ์ ์-๋ฌด์์ธ๊ฐ์",headingTag:"h3"}}),_e=new Xe({props:{choices:[{text:"์ฌ์ฉํ ๋ชจ๋ธ ์ํคํ ์ฒ๋ฅผ ์ง์ ํฉ๋๋ค.",explain:"๋ชจ๋ธ ์ํคํ ์ฒ๋ ๋ชจ๋ธ์ ๋ก๋ํ ๋ ์ง์ ๋๋ฉฐ, Trainer์์ ์ง์ ํ์ง ์์ต๋๋ค."},{text:"๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ์ฌ์ฉํ ํ ํฌ๋์ด์ ๋ฅผ Trainer์ ์๋ ค์ค๋๋ค.",explain:"processing_class ๋งค๊ฐ๋ณ์๋ ์ฌ์ฉํ ํ ํฌ๋์ด์ ๋ฅผ Trainer๊ฐ ์ ์ ์๋๋ก ๋์์ฃผ๋ ์ต์ ์ถ๊ฐ ์ฌํญ์ ๋๋ค.",correct:!0},{text:"ํ๋ จ์ ์ํ ๋ฐฐ์น ํฌ๊ธฐ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค.",explain:"๋ฐฐ์น ํฌ๊ธฐ๋ processing_class๊ฐ ์๋ TrainingArguments์์ ์ค์ ๋ฉ๋๋ค."},{text:"ํ๊ฐ ๋น๋๋ฅผ ์ ์ดํฉ๋๋ค.",explain:"ํ๊ฐ ๋น๋๋ TrainingArguments์ eval_strategy๋ก ์ ์ด๋ฉ๋๋ค."}]}}),Ce=new T({props:{title:"2. ํ๋ จ ์ค ํ๊ฐ๊ฐ ์ผ๋ง๋ ์์ฃผ ๋ฐ์ํ๋์ง๋ฅผ ์ ์ดํ๋ TrainingArguments ๋งค๊ฐ๋ณ์๋ ๋ฌด์์ธ๊ฐ์?",local:"2-ํ๋ จ-์ค-ํ๊ฐ๊ฐ-์ผ๋ง๋-์์ฃผ-๋ฐ์ํ๋์ง๋ฅผ-์ ์ดํ๋-trainingarguments-๋งค๊ฐ๋ณ์๋-๋ฌด์์ธ๊ฐ์",headingTag:"h3"}}),ke=new Xe({props:{choices:[{text:"eval_frequency",explain:"TrainingArguments์๋ eval_frequency ๋งค๊ฐ๋ณ์๊ฐ ์์ต๋๋ค."},{text:"eval_strategy",explain:"eval_strategy๋ ํ๊ฐ ํ์ด๋ฐ์ ์ ์ดํ๊ธฐ ์ํด 'epoch', 'steps', ๋๋ 'no'๋ก ์ค์ ํ ์ ์์ต๋๋ค.",correct:!0},{text:"evaluation_steps",explain:"eval_steps๋ ํ๊ฐ ์ฌ์ด์ ๋จ๊ณ ์๋ฅผ ์ค์ ํ์ง๋ง, eval_strategy๊ฐ ํ๊ฐ ๋ฐ์ ์ฌ๋ถ/์๊ธฐ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค."},{text:"do_eval",explain:"์ต์ TrainingArguments์๋ do_eval ๋งค๊ฐ๋ณ์๊ฐ ์์ต๋๋ค."}]}}),ve=new T({props:{title:"3. TrainingArguments์์ <code> fp16=True </code> ๋ ๋ฌด์์ ํ์ฑํํ๋์?",local:"3-trainingarguments์์-code-fp16true-code-๋-๋ฌด์์-ํ์ฑํํ๋์",headingTag:"h3"}}),xe=new Xe({props:{choices:[{text:"๋ ๋น ๋ฅธ ํ๋ จ์ ์ํ 16๋นํธ ์ ์ ์ ๋ฐ๋",explain:"fp16์ ์ ์ ์ ๋ฐ๋๊ฐ ์๋ ๋ถ๋์์์ ์ ๋ฐ๋๋ฅผ ์๋ฏธํฉ๋๋ค."},{text:"๋ ๋น ๋ฅธ ํ๋ จ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋ ๊ฐ์๋ฅผ ์ํ 16๋นํธ ๋ถ๋์์์ ์๋ฅผ ์ฌ์ฉํ ํผํฉ ์ ๋ฐ๋ ํ๋ จ",explain:"ํผํฉ ์ ๋ฐ๋ ํ๋ จ์ ์์ ํ์๋ 16๋นํธ ํ๋กํธ๋ฅผ, ๊ทธ๋ ์ด๋์ธํธ์๋ 32๋นํธ๋ฅผ ์ฌ์ฉํ์ฌ ์๋๋ฅผ ํฅ์์ํค๊ณ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ค์ ๋๋ค.",correct:!0},{text:"์ ํํ 16 ์ํฌํฌ ๋์ ํ๋ จ",explain:"fp16์ ์ํฌํฌ ์์ ๊ด๋ จ์ด ์์ต๋๋ค."},{text:"๋ถ์ฐ ํ๋ จ์ ์ํ 16๊ฐ GPU ์ฌ์ฉ",explain:"GPU ์๋ fp16 ๋งค๊ฐ๋ณ์๋ก ์ ์ด๋์ง ์์ต๋๋ค."}]}}),Re=new T({props:{title:"4. Trainer์์ <code> compute_metrics </code> ํจ์์ ์ญํ ์ ๋ฌด์์ธ๊ฐ์?",local:"4-trainer์์-code-computemetrics-code-ํจ์์-์ญํ ์-๋ฌด์์ธ๊ฐ์",headingTag:"h3"}}),He=new Xe({props:{choices:[{text:"ํ๋ จ ์ค ์์ค์ ๊ณ์ฐํฉ๋๋ค.",explain:"์์ค ๊ณ์ฐ์ compute_metrics๊ฐ ์๋ ๋ชจ๋ธ์์ ์๋์ผ๋ก ์ฒ๋ฆฌ๋ฉ๋๋ค."},{text:"๋ก์ง์ ์์ธก์ผ๋ก ๋ณํํ๊ณ ์ ํ๋ ๋ฐ F1๊ณผ ๊ฐ์ ํ๊ฐ ๋ฉํธ๋ฆญ์ ๊ณ์ฐํฉ๋๋ค.",explain:"compute_metrics๋ ์์ธก๊ณผ ๋ผ๋ฒจ์ ๋ฐ์์ ํ๊ฐ๋ฅผ ์ํ ๋ฉํธ๋ฆญ์ ๋ฐํํฉ๋๋ค.",correct:!0},{text:"์ฌ์ฉํ ์ตํฐ๋ง์ด์ ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค.",explain:"์ตํฐ๋ง์ด์ ์ ํ์ compute_metrics๋ก ์ฒ๋ฆฌ๋์ง ์์ต๋๋ค."},{text:"ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ ์ฒ๋ฆฌํฉ๋๋ค.",explain:"๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ ํ๋ จ ์ ์ ์ํ๋๋ฉฐ, ํ๊ฐ ์ค compute_metrics๋ก ์ํ๋์ง ์์ต๋๋ค."}]}}),We=new T({props:{title:"5. Trainer์ <code> eval_dataset </code> ์ ์ ๊ณตํ์ง ์์ผ๋ฉด ์ด๋ป๊ฒ ๋๋์?",local:"5-trainer์-code-evaldataset-code-์-์ ๊ณตํ์ง-์์ผ๋ฉด-์ด๋ป๊ฒ-๋๋์",headingTag:"h3"}}),Ge=new Xe({props:{choices:[{text:"ํ๋ จ์ด ์ค๋ฅ์ ํจ๊ป ์คํจํฉ๋๋ค.",explain:"eval_dataset ์์ด๋ ํ๋ จ์ ์งํํ ์ ์์ง๋ง, ํ๊ฐ ๋ฉํธ๋ฆญ์ ์ป์ ์ ์์ต๋๋ค."},{text:"Trainer๊ฐ ์๋์ผ๋ก ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ํ๊ฐ์ฉ์ผ๋ก ๋ถํ ํฉ๋๋ค.",explain:"Trainer๋ ์๋์ผ๋ก ๊ฒ์ฆ ๋ถํ ์ ์์ฑํ์ง ์์ต๋๋ค."},{text:"ํ๋ จ ์ค ํ๊ฐ ๋ฉํธ๋ฆญ์ ์ป์ ์ ์์ง๋ง ํ๋ จ์ ์ฌ์ ํ ์๋ํฉ๋๋ค.",explain:"ํ๊ฐ๋ ์ ํ์ฌํญ์ ๋๋ค - ํ๊ฐ ์์ด๋ ํ๋ จํ ์ ์์ง๋ง ๊ฒ์ฆ ๋ฉํธ๋ฆญ์ ๋ณผ ์ ์์ต๋๋ค.",correct:!0},{text:"๋ชจ๋ธ์ด ํ๊ฐ๋ฅผ ์ํด ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํฉ๋๋ค.",explain:"Trainer๋ ์๋์ผ๋ก ํ๊ฐ๋ฅผ ์ํด ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ง ์์ต๋๋ค - ๋จ์ํ ํ๊ฐํ์ง ์์ต๋๋ค."}]}}),Ie=new T({props:{title:"6. ๊ทธ๋ ์ด๋์ธํธ ๋์ ์ด๋ ๋ฌด์์ด๋ฉฐ ์ด๋ป๊ฒ ํ์ฑํํ๋์?",local:"6-๊ทธ๋ ์ด๋์ธํธ-๋์ ์ด๋-๋ฌด์์ด๋ฉฐ-์ด๋ป๊ฒ-ํ์ฑํํ๋์",headingTag:"h3"}}),Ze=new Xe({props:{choices:[{text:"๊ทธ๋ ์ด๋์ธํธ๋ฅผ ๋์คํฌ์ ์ ์ฅํ๋ ๊ฒ์ผ๋ก, save_gradients=True๋ก ํ์ฑํ๋ฉ๋๋ค.",explain:"๊ทธ๋ ์ด๋์ธํธ ๋์ ์ ๊ทธ๋ ์ด๋์ธํธ๋ฅผ ๋์คํฌ์ ์ ์ฅํ๋ ๊ฒ๊ณผ ๊ด๋ จ์ด ์์ต๋๋ค."},{text:"์ ๋ฐ์ดํธ ์ ์ ์ฌ๋ฌ ๋ฐฐ์น์ ๊ฑธ์ณ ๊ทธ๋ ์ด๋์ธํธ๋ฅผ ๋์ ํ๋ ๊ฒ์ผ๋ก, gradient_accumulation_steps๋ก ํ์ฑํ๋ฉ๋๋ค.",explain:"์ด๋ฅผ ํตํด ์ฌ๋ฌ ์์ ํ์ ๊ฑธ์ณ ๊ทธ๋ ์ด๋์ธํธ๋ฅผ ๋์ ํ์ฌ ๋ ํฐ ๋ฐฐ์น ํฌ๊ธฐ๋ฅผ ์๋ฎฌ๋ ์ด์ ํ ์ ์์ต๋๋ค.",correct:!0},{text:"๊ทธ๋ ์ด๋์ธํธ ๊ณ์ฐ์ ๊ฐ์ํํ๋ ๊ฒ์ผ๋ก, fp16๊ณผ ํจ๊ป ์๋์ผ๋ก ํ์ฑํ๋ฉ๋๋ค.",explain:"fp16์ด ํ๋ จ์ ๊ฐ์ํํ ์ ์์ง๋ง, ๊ทธ๋ ์ด๋์ธํธ ๋์ ์ ๋ณ๋์ ๊ธฐ์ ์ ๋๋ค."},{text:"๊ทธ๋ ์ด๋์ธํธ ์ค๋ฒํ๋ก์ฐ๋ฅผ ๋ฐฉ์งํ๋ ๊ฒ์ผ๋ก, gradient_clipping=True๋ก ํ์ฑํ๋ฉ๋๋ค.",explain:"์ด๋ ๊ทธ๋ ์ด๋์ธํธ ๋์ ์ด ์๋ ๊ทธ๋ ์ด๋์ธํธ ํด๋ฆฌํ์ ์ค๋ช ํฉ๋๋ค."}]}}),Ee=new Dl({props:{source:"https://github.com/huggingface/course/blob/main/chapters/ko/chapter3/3.mdx"}}),{c(){$=M("meta"),Qe=s(),g=M("p"),Ve=s(),i(J.$$.fragment),Ye=s(),i(k.$$.fragment),Fe=s(),i(v.$$.fragment),qe=s(),i(x.$$.fragment),Be=s(),i(R.$$.fragment),Ae=s(),H=M("p"),H.innerHTML=pl,Le=s(),U=M("blockquote"),U.innerHTML=ol,Ne=s(),W=M("p"),W.textContent=cl,Pe=s(),i(G.$$.fragment),Se=s(),i(I.$$.fragment),De=s(),Z=M("p"),Z.innerHTML=ml,Oe=s(),i(E.$$.fragment),Ke=s(),Q=M("p"),Q.innerHTML=Ml,et=s(),b=M("blockquote"),b.innerHTML=fl,tt=s(),V=M("p"),V.innerHTML=dl,lt=s(),i(X.$$.fragment),nt=s(),z=M("p"),z.innerHTML=ul,st=s(),Y=M("p"),Y.innerHTML=Tl,at=s(),i(F.$$.fragment),it=s(),q=M("p"),q.innerHTML=$l,rt=s(),w=M("blockquote"),w.innerHTML=yl,pt=s(),B=M("p"),B.innerHTML=gl,ot=s(),i(A.$$.fragment),ct=s(),L=M("p"),L.textContent=Jl,mt=s(),N=M("ol"),N.innerHTML=Ul,Mt=s(),i(P.$$.fragment),ft=s(),S=M("p"),S.innerHTML=bl,dt=s(),i(D.$$.fragment),ut=s(),i(O.$$.fragment),Tt=s(),K=M("p"),K.innerHTML=wl,$t=s(),ee=M("p"),ee.innerHTML=hl,yt=s(),i(te.$$.fragment),gt=s(),le=M("p"),le.innerHTML=jl,Jt=s(),i(ne.$$.fragment),Ut=s(),i(se.$$.fragment),bt=s(),h=M("blockquote"),h.innerHTML=_l,wt=s(),ae=M("p"),ae.innerHTML=Cl,ht=s(),ie=M("p"),ie.innerHTML=kl,jt=s(),i(re.$$.fragment),_t=s(),pe=M("p"),pe.innerHTML=vl,Ct=s(),i(oe.$$.fragment),kt=s(),ce=M("p"),ce.innerHTML=xl,vt=s(),i(me.$$.fragment),xt=s(),Me=M("p"),Me.textContent=Rl,Rt=s(),i(fe.$$.fragment),Ht=s(),de=M("p"),de.innerHTML=Hl,Wt=s(),ue=M("p"),ue.innerHTML=Wl,Gt=s(),i(Te.$$.fragment),It=s(),$e=M("p"),$e.innerHTML=Gl,Zt=s(),i(ye.$$.fragment),Et=s(),ge=M("p"),ge.innerHTML=Il,Qt=s(),i(Je.$$.fragment),Vt=s(),j=M("blockquote"),j.innerHTML=Zl,Xt=s(),Ue=M("p"),Ue.innerHTML=El,zt=s(),be=M("p"),be.innerHTML=Ql,Yt=s(),_=M("blockquote"),_.innerHTML=Vl,Ft=s(),i(we.$$.fragment),qt=s(),he=M("p"),he.textContent=Xl,Bt=s(),i(je.$$.fragment),At=s(),i(_e.$$.fragment),Lt=s(),i(Ce.$$.fragment),Nt=s(),i(ke.$$.fragment),Pt=s(),i(ve.$$.fragment),St=s(),i(xe.$$.fragment),Dt=s(),i(Re.$$.fragment),Ot=s(),i(He.$$.fragment),Kt=s(),i(We.$$.fragment),el=s(),i(Ge.$$.fragment),tl=s(),i(Ie.$$.fragment),ll=s(),i(Ze.$$.fragment),nl=s(),C=M("blockquote"),C.innerHTML=zl,sl=s(),i(Ee.$$.fragment),al=s(),ze=M("p"),this.h()},l(e){const t=Nl("svelte-u9bgzb",document.head);$=f(t,"META",{name:!0,content:!0}),t.forEach(l),Qe=a(e),g=f(e,"P",{}),Fl(g).forEach(l),Ve=a(e),r(J.$$.fragment,e),Ye=a(e),r(k.$$.fragment,e),Fe=a(e),r(v.$$.fragment,e),qe=a(e),r(x.$$.fragment,e),Be=a(e),r(R.$$.fragment,e),Ae=a(e),H=f(e,"P",{"data-svelte-h":!0}),d(H)!=="svelte-knkc89"&&(H.innerHTML=pl),Le=a(e),U=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(U)!=="svelte-1v6278y"&&(U.innerHTML=ol),Ne=a(e),W=f(e,"P",{"data-svelte-h":!0}),d(W)!=="svelte-hs8a7l"&&(W.textContent=cl),Pe=a(e),r(G.$$.fragment,e),Se=a(e),r(I.$$.fragment,e),De=a(e),Z=f(e,"P",{"data-svelte-h":!0}),d(Z)!=="svelte-1enyha7"&&(Z.innerHTML=ml),Oe=a(e),r(E.$$.fragment,e),Ke=a(e),Q=f(e,"P",{"data-svelte-h":!0}),d(Q)!=="svelte-18au6nv"&&(Q.innerHTML=Ml),et=a(e),b=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(b)!=="svelte-1poujc4"&&(b.innerHTML=fl),tt=a(e),V=f(e,"P",{"data-svelte-h":!0}),d(V)!=="svelte-nt9c4b"&&(V.innerHTML=dl),lt=a(e),r(X.$$.fragment,e),nt=a(e),z=f(e,"P",{"data-svelte-h":!0}),d(z)!=="svelte-s3sck9"&&(z.innerHTML=ul),st=a(e),Y=f(e,"P",{"data-svelte-h":!0}),d(Y)!=="svelte-4ai6qh"&&(Y.innerHTML=Tl),at=a(e),r(F.$$.fragment,e),it=a(e),q=f(e,"P",{"data-svelte-h":!0}),d(q)!=="svelte-1m2yas3"&&(q.innerHTML=$l),rt=a(e),w=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(w)!=="svelte-8phhlb"&&(w.innerHTML=yl),pt=a(e),B=f(e,"P",{"data-svelte-h":!0}),d(B)!=="svelte-13y4n8x"&&(B.innerHTML=gl),ot=a(e),r(A.$$.fragment,e),ct=a(e),L=f(e,"P",{"data-svelte-h":!0}),d(L)!=="svelte-1vb1ztl"&&(L.textContent=Jl),mt=a(e),N=f(e,"OL",{"data-svelte-h":!0}),d(N)!=="svelte-1kijd9m"&&(N.innerHTML=Ul),Mt=a(e),r(P.$$.fragment,e),ft=a(e),S=f(e,"P",{"data-svelte-h":!0}),d(S)!=="svelte-1kov8l9"&&(S.innerHTML=bl),dt=a(e),r(D.$$.fragment,e),ut=a(e),r(O.$$.fragment,e),Tt=a(e),K=f(e,"P",{"data-svelte-h":!0}),d(K)!=="svelte-44hwg3"&&(K.innerHTML=wl),$t=a(e),ee=f(e,"P",{"data-svelte-h":!0}),d(ee)!=="svelte-1f3lia8"&&(ee.innerHTML=hl),yt=a(e),r(te.$$.fragment,e),gt=a(e),le=f(e,"P",{"data-svelte-h":!0}),d(le)!=="svelte-4of9x9"&&(le.innerHTML=jl),Jt=a(e),r(ne.$$.fragment,e),Ut=a(e),r(se.$$.fragment,e),bt=a(e),h=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(h)!=="svelte-4q6lfi"&&(h.innerHTML=_l),wt=a(e),ae=f(e,"P",{"data-svelte-h":!0}),d(ae)!=="svelte-1ylr8sj"&&(ae.innerHTML=Cl),ht=a(e),ie=f(e,"P",{"data-svelte-h":!0}),d(ie)!=="svelte-2jb62l"&&(ie.innerHTML=kl),jt=a(e),r(re.$$.fragment,e),_t=a(e),pe=f(e,"P",{"data-svelte-h":!0}),d(pe)!=="svelte-vtoh1f"&&(pe.innerHTML=vl),Ct=a(e),r(oe.$$.fragment,e),kt=a(e),ce=f(e,"P",{"data-svelte-h":!0}),d(ce)!=="svelte-14c26ht"&&(ce.innerHTML=xl),vt=a(e),r(me.$$.fragment,e),xt=a(e),Me=f(e,"P",{"data-svelte-h":!0}),d(Me)!=="svelte-1yytiyu"&&(Me.textContent=Rl),Rt=a(e),r(fe.$$.fragment,e),Ht=a(e),de=f(e,"P",{"data-svelte-h":!0}),d(de)!=="svelte-1lmwzzc"&&(de.innerHTML=Hl),Wt=a(e),ue=f(e,"P",{"data-svelte-h":!0}),d(ue)!=="svelte-1h0qf0f"&&(ue.innerHTML=Wl),Gt=a(e),r(Te.$$.fragment,e),It=a(e),$e=f(e,"P",{"data-svelte-h":!0}),d($e)!=="svelte-pmu9yq"&&($e.innerHTML=Gl),Zt=a(e),r(ye.$$.fragment,e),Et=a(e),ge=f(e,"P",{"data-svelte-h":!0}),d(ge)!=="svelte-umpq8u"&&(ge.innerHTML=Il),Qt=a(e),r(Je.$$.fragment,e),Vt=a(e),j=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(j)!=="svelte-2zhea"&&(j.innerHTML=Zl),Xt=a(e),Ue=f(e,"P",{"data-svelte-h":!0}),d(Ue)!=="svelte-kboajh"&&(Ue.innerHTML=El),zt=a(e),be=f(e,"P",{"data-svelte-h":!0}),d(be)!=="svelte-1p27re0"&&(be.innerHTML=Ql),Yt=a(e),_=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(_)!=="svelte-1vkb1bk"&&(_.innerHTML=Vl),Ft=a(e),r(we.$$.fragment,e),qt=a(e),he=f(e,"P",{"data-svelte-h":!0}),d(he)!=="svelte-1f5akmu"&&(he.textContent=Xl),Bt=a(e),r(je.$$.fragment,e),At=a(e),r(_e.$$.fragment,e),Lt=a(e),r(Ce.$$.fragment,e),Nt=a(e),r(ke.$$.fragment,e),Pt=a(e),r(ve.$$.fragment,e),St=a(e),r(xe.$$.fragment,e),Dt=a(e),r(Re.$$.fragment,e),Ot=a(e),r(He.$$.fragment,e),Kt=a(e),r(We.$$.fragment,e),el=a(e),r(Ge.$$.fragment,e),tl=a(e),r(Ie.$$.fragment,e),ll=a(e),r(Ze.$$.fragment,e),nl=a(e),C=f(e,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),d(C)!=="svelte-1a04z6w"&&(C.innerHTML=zl),sl=a(e),r(Ee.$$.fragment,e),al=a(e),ze=f(e,"P",{}),Fl(ze).forEach(l),this.h()},h(){y($,"name","hf:doc:metadata"),y($,"content",ln),y(U,"class","tip"),y(b,"class","tip"),y(w,"class","tip"),y(h,"class","tip"),y(j,"class","tip"),y(_,"class","tip"),y(C,"class","tip")},m(e,t){Pl(document.head,$),n(e,Qe,t),n(e,g,t),n(e,Ve,t),p(J,e,t),n(e,Ye,t),p(k,e,t),n(e,Fe,t),p(v,e,t),n(e,qe,t),p(x,e,t),n(e,Be,t),p(R,e,t),n(e,Ae,t),n(e,H,t),n(e,Le,t),n(e,U,t),n(e,Ne,t),n(e,W,t),n(e,Pe,t),p(G,e,t),n(e,Se,t),p(I,e,t),n(e,De,t),n(e,Z,t),n(e,Oe,t),p(E,e,t),n(e,Ke,t),n(e,Q,t),n(e,et,t),n(e,b,t),n(e,tt,t),n(e,V,t),n(e,lt,t),p(X,e,t),n(e,nt,t),n(e,z,t),n(e,st,t),n(e,Y,t),n(e,at,t),p(F,e,t),n(e,it,t),n(e,q,t),n(e,rt,t),n(e,w,t),n(e,pt,t),n(e,B,t),n(e,ot,t),p(A,e,t),n(e,ct,t),n(e,L,t),n(e,mt,t),n(e,N,t),n(e,Mt,t),p(P,e,t),n(e,ft,t),n(e,S,t),n(e,dt,t),p(D,e,t),n(e,ut,t),p(O,e,t),n(e,Tt,t),n(e,K,t),n(e,$t,t),n(e,ee,t),n(e,yt,t),p(te,e,t),n(e,gt,t),n(e,le,t),n(e,Jt,t),p(ne,e,t),n(e,Ut,t),p(se,e,t),n(e,bt,t),n(e,h,t),n(e,wt,t),n(e,ae,t),n(e,ht,t),n(e,ie,t),n(e,jt,t),p(re,e,t),n(e,_t,t),n(e,pe,t),n(e,Ct,t),p(oe,e,t),n(e,kt,t),n(e,ce,t),n(e,vt,t),p(me,e,t),n(e,xt,t),n(e,Me,t),n(e,Rt,t),p(fe,e,t),n(e,Ht,t),n(e,de,t),n(e,Wt,t),n(e,ue,t),n(e,Gt,t),p(Te,e,t),n(e,It,t),n(e,$e,t),n(e,Zt,t),p(ye,e,t),n(e,Et,t),n(e,ge,t),n(e,Qt,t),p(Je,e,t),n(e,Vt,t),n(e,j,t),n(e,Xt,t),n(e,Ue,t),n(e,zt,t),n(e,be,t),n(e,Yt,t),n(e,_,t),n(e,Ft,t),p(we,e,t),n(e,qt,t),n(e,he,t),n(e,Bt,t),p(je,e,t),n(e,At,t),p(_e,e,t),n(e,Lt,t),p(Ce,e,t),n(e,Nt,t),p(ke,e,t),n(e,Pt,t),p(ve,e,t),n(e,St,t),p(xe,e,t),n(e,Dt,t),p(Re,e,t),n(e,Ot,t),p(He,e,t),n(e,Kt,t),p(We,e,t),n(e,el,t),p(Ge,e,t),n(e,tl,t),p(Ie,e,t),n(e,ll,t),p(Ze,e,t),n(e,nl,t),n(e,C,t),n(e,sl,t),p(Ee,e,t),n(e,al,t),n(e,ze,t),il=!0},p(e,[t]){const Yl={};t&1&&(Yl.fw=e[0]),J.$set(Yl)},i(e){il||(o(J.$$.fragment,e),o(k.$$.fragment,e),o(v.$$.fragment,e),o(x.$$.fragment,e),o(R.$$.fragment,e),o(G.$$.fragment,e),o(I.$$.fragment,e),o(E.$$.fragment,e),o(X.$$.fragment,e),o(F.$$.fragment,e),o(A.$$.fragment,e),o(P.$$.fragment,e),o(D.$$.fragment,e),o(O.$$.fragment,e),o(te.$$.fragment,e),o(ne.$$.fragment,e),o(se.$$.fragment,e),o(re.$$.fragment,e),o(oe.$$.fragment,e),o(me.$$.fragment,e),o(fe.$$.fragment,e),o(Te.$$.fragment,e),o(ye.$$.fragment,e),o(Je.$$.fragment,e),o(we.$$.fragment,e),o(je.$$.fragment,e),o(_e.$$.fragment,e),o(Ce.$$.fragment,e),o(ke.$$.fragment,e),o(ve.$$.fragment,e),o(xe.$$.fragment,e),o(Re.$$.fragment,e),o(He.$$.fragment,e),o(We.$$.fragment,e),o(Ge.$$.fragment,e),o(Ie.$$.fragment,e),o(Ze.$$.fragment,e),o(Ee.$$.fragment,e),il=!0)},o(e){c(J.$$.fragment,e),c(k.$$.fragment,e),c(v.$$.fragment,e),c(x.$$.fragment,e),c(R.$$.fragment,e),c(G.$$.fragment,e),c(I.$$.fragment,e),c(E.$$.fragment,e),c(X.$$.fragment,e),c(F.$$.fragment,e),c(A.$$.fragment,e),c(P.$$.fragment,e),c(D.$$.fragment,e),c(O.$$.fragment,e),c(te.$$.fragment,e),c(ne.$$.fragment,e),c(se.$$.fragment,e),c(re.$$.fragment,e),c(oe.$$.fragment,e),c(me.$$.fragment,e),c(fe.$$.fragment,e),c(Te.$$.fragment,e),c(ye.$$.fragment,e),c(Je.$$.fragment,e),c(we.$$.fragment,e),c(je.$$.fragment,e),c(_e.$$.fragment,e),c(Ce.$$.fragment,e),c(ke.$$.fragment,e),c(ve.$$.fragment,e),c(xe.$$.fragment,e),c(Re.$$.fragment,e),c(He.$$.fragment,e),c(We.$$.fragment,e),c(Ge.$$.fragment,e),c(Ie.$$.fragment,e),c(Ze.$$.fragment,e),c(Ee.$$.fragment,e),il=!1},d(e){e&&(l(Qe),l(g),l(Ve),l(Ye),l(Fe),l(qe),l(Be),l(Ae),l(H),l(Le),l(U),l(Ne),l(W),l(Pe),l(Se),l(De),l(Z),l(Oe),l(Ke),l(Q),l(et),l(b),l(tt),l(V),l(lt),l(nt),l(z),l(st),l(Y),l(at),l(it),l(q),l(rt),l(w),l(pt),l(B),l(ot),l(ct),l(L),l(mt),l(N),l(Mt),l(ft),l(S),l(dt),l(ut),l(Tt),l(K),l($t),l(ee),l(yt),l(gt),l(le),l(Jt),l(Ut),l(bt),l(h),l(wt),l(ae),l(ht),l(ie),l(jt),l(_t),l(pe),l(Ct),l(kt),l(ce),l(vt),l(xt),l(Me),l(Rt),l(Ht),l(de),l(Wt),l(ue),l(Gt),l(It),l($e),l(Zt),l(Et),l(ge),l(Qt),l(Vt),l(j),l(Xt),l(Ue),l(zt),l(be),l(Yt),l(_),l(Ft),l(qt),l(he),l(Bt),l(At),l(Lt),l(Nt),l(Pt),l(St),l(Dt),l(Ot),l(Kt),l(el),l(tl),l(ll),l(nl),l(C),l(sl),l(al),l(ze)),l($),m(J,e),m(k,e),m(v,e),m(x,e),m(R,e),m(G,e),m(I,e),m(E,e),m(X,e),m(F,e),m(A,e),m(P,e),m(D,e),m(O,e),m(te,e),m(ne,e),m(se,e),m(re,e),m(oe,e),m(me,e),m(fe,e),m(Te,e),m(ye,e),m(Je,e),m(we,e),m(je,e),m(_e,e),m(Ce,e),m(ke,e),m(ve,e),m(xe,e),m(Re,e),m(He,e),m(We,e),m(Ge,e),m(Ie,e),m(Ze,e),m(Ee,e)}}}const ln='{"title":"Trainer API๋ก ๋ชจ๋ธ ๋ฏธ์ธ ์กฐ์ ํ๊ธฐ","local":"fine-tuning-a-model-with-the-trainer-api","sections":[{"title":"ํ๋ จ","local":"training","sections":[],"depth":3},{"title":"ํ๊ฐ","local":"evaluation","sections":[],"depth":3},{"title":"๊ณ ๊ธ ํ๋ จ ๊ธฐ๋ฅ","local":"advanced-training-features","sections":[],"depth":3},{"title":"์น์ ํด์ฆ","local":"section-quiz","sections":[{"title":"1. Trainer ์์ <code> processing_class </code> ๋งค๊ฐ๋ณ์์ ๋ชฉ์ ์ ๋ฌด์์ธ๊ฐ์?","local":"1-trainer-์์-code-processingclass-code-๋งค๊ฐ๋ณ์์-๋ชฉ์ ์-๋ฌด์์ธ๊ฐ์","sections":[],"depth":3},{"title":"2. ํ๋ จ ์ค ํ๊ฐ๊ฐ ์ผ๋ง๋ ์์ฃผ ๋ฐ์ํ๋์ง๋ฅผ ์ ์ดํ๋ TrainingArguments ๋งค๊ฐ๋ณ์๋ ๋ฌด์์ธ๊ฐ์?","local":"2-ํ๋ จ-์ค-ํ๊ฐ๊ฐ-์ผ๋ง๋-์์ฃผ-๋ฐ์ํ๋์ง๋ฅผ-์ ์ดํ๋-trainingarguments-๋งค๊ฐ๋ณ์๋-๋ฌด์์ธ๊ฐ์","sections":[],"depth":3},{"title":"3. TrainingArguments์์ <code> fp16=True </code> ๋ ๋ฌด์์ ํ์ฑํํ๋์?","local":"3-trainingarguments์์-code-fp16true-code-๋-๋ฌด์์-ํ์ฑํํ๋์","sections":[],"depth":3},{"title":"4. Trainer์์ <code> compute_metrics </code> ํจ์์ ์ญํ ์ ๋ฌด์์ธ๊ฐ์?","local":"4-trainer์์-code-computemetrics-code-ํจ์์-์ญํ ์-๋ฌด์์ธ๊ฐ์","sections":[],"depth":3},{"title":"5. Trainer์ <code> eval_dataset </code> ์ ์ ๊ณตํ์ง ์์ผ๋ฉด ์ด๋ป๊ฒ ๋๋์?","local":"5-trainer์-code-evaldataset-code-์-์ ๊ณตํ์ง-์์ผ๋ฉด-์ด๋ป๊ฒ-๋๋์","sections":[],"depth":3},{"title":"6. ๊ทธ๋ ์ด๋์ธํธ ๋์ ์ด๋ ๋ฌด์์ด๋ฉฐ ์ด๋ป๊ฒ ํ์ฑํํ๋์?","local":"6-๊ทธ๋ ์ด๋์ธํธ-๋์ ์ด๋-๋ฌด์์ด๋ฉฐ-์ด๋ป๊ฒ-ํ์ฑํํ๋์","sections":[],"depth":3}],"depth":2}],"depth":1}';function nn(rl,$,Qe){let g="pt";return Bl(()=>{const Ve=new URLSearchParams(window.location.search);Qe(0,g=Ve.get("fw")||"pt")}),[g]}class fn extends Al{constructor($){super(),Ll(this,$,nn,tn,ql,{})}}export{fn as component}; | |
Xet Storage Details
- Size:
- 43.6 kB
- Xet hash:
- 18d876946752553f436ce62eb3899353e123fdaafcb874f15f5d07917e107fd8
ยท
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.