Buckets:

rtrm's picture
download
raw
33.4 kB
import{s as Zt,o as Rt,n as _t}from"../chunks/scheduler.37c15a92.js";import{S as Ct,i as Wt,g as i,s as a,r as c,A as Ht,h as r,f as l,c as n,j as kt,u as d,x as o,k as Ut,y as Ft,a as s,v as m,d as M,t as u,w as f}from"../chunks/index.2bf4358c.js";import{T as Gt}from"../chunks/Tip.363c041f.js";import{Y as Et}from"../chunks/Youtube.1e50a667.js";import{C as $}from"../chunks/CodeBlock.4e987730.js";import{C as It}from"../chunks/CourseFloatingBanner.6add7356.js";import{F as zt}from"../chunks/FrameworkSwitchCourse.8d4d4ab6.js";import{H as tt,E as Xt}from"../chunks/getInferenceSnippets.ebf8be91.js";function xt(w){let p,T='💡 ถ้าคุณต้องการจะอัพโหลดโมเดลของคุณขึ้น Hub ระหว่างที่ทำการเทรนโดยอัตโนมัติ ให้ใส่ <code>push_to_hub=True</code> เข้าไปใน <code>TrainingArguments</code> ด้วย โดยเราจะเรียนรู้เพิ่มเติมใน <a href="/course/chapter4/3">Chapter 4</a>';return{c(){p=i("p"),p.innerHTML=T},l(b){p=r(b,"P",{"data-svelte-h":!0}),o(p)!=="svelte-t794qd"&&(p.innerHTML=T)},m(b,h){s(b,p,h)},p:_t,d(b){b&&l(p)}}}function Vt(w){let p,T="✏️ <strong>ลองเลย!</strong> Fine-tune โมเดลโดยใช้ GLUE SST-2 dataset โดยใช้การประมวลผลข้อมูลแบบที่คุณทำไว้ใน section 2";return{c(){p=i("p"),p.innerHTML=T},l(b){p=r(b,"P",{"data-svelte-h":!0}),o(p)!=="svelte-1fbhp95"&&(p.innerHTML=T)},m(b,h){s(b,p,h)},p:_t,d(b){b&&l(p)}}}function Bt(w){let p,T,b,h,y,de,g,me,v,Me,k,ue,U,lt='🤗 Transformers มี <code>Trainer</code> class เพื่อช่วยให้คุณสามารถ fine-tune โมเดลที่ผ่านการเทรนมาแล้วด้วย dataset ของคุณเองได้ หลังจากที่คุณได้ทำการประมวลผลข้อมูลใน section ที่แล้ว ก็เหลืองานอีกไม่กี่ขั้นตอนเท่านั้นในการกำหนดตัว <code>Trainer</code> ซึ่งงานส่วนที่ยากที่สุดน่าจะเป็นการเตรียม environment ในการ run <code>Trainer.train()</code> เนื่องจากมันจะ run ได้ช้ามากบน CPU ถ้าคุณไม่มีการติดตั้ง GPU คุณก็สามารถเข้าถึง free GPUs หรือ TPUs ได้บน <a href="https://colab.research.google.com/" rel="nofollow">Google Colab</a>',fe,G,st="โค้ดตัวอย่างข้างล่างนี้สันนิษฐานไว้ว่าคุณได้ทำตัวอย่างใน section ที่แล้วมาเรียบร้อยแล้ว นี่คือการสรุปสั้น ๆ เพื่อทบทวนสิ่งที่คุณต้องเตรียมให้พร้อม:",be,_,$e,Z,Te,R,at="ขั้นตอนแรกก่อนที่เราจะกำหนด <code>Trainer</code> ของเราก็คือการกำหนด <code>TrainingArguments</code> class ที่จะมีข้อมูลของ hyperparameters ทุกตัวที่ <code>Trainer</code> จะใช้ในการ train และการ evaluate โดยอากิวเมนต์เดียวที่คุณต้องใส่คือ directory ที่จะเซฟข้อมูลโมเดลที่เทรนแล้ว รวมถึง checkpoints ระหว่างการเทรน ที่เหลือนั้นคุณสามารถปล่อยให้เป็นไปตามค่าเริ่มต้นได้ ซึ่งน่าจะทำงานได้ดีสำหรับการ fine-tune แบบพื้นฐาน",he,C,ye,j,je,W,nt='ขั้นตอนที่สองคือการกำหนดโมเดลของพวกเรา เหมือนกับใน <a href="/course/chapter2">previous chapter</a> เราจะใช้ <code>AutoModelForSequenceClassification</code> class โดยมี 2 labels:',Je,H,we,F,it='คุณจะสังเกตได้ว่าคุณจะได้รับคำเตือนหลังจากที่สร้างโมเดลขึ้นมา ไม่เหมือนกับใน <a href="/course/chapter2">Chapter 2</a> ที่เป็นเช่นนี้เนื่องจาก BERT ยังไม่ได้มีการ pretrained ให้สามารถจำแนกคู่ประโยค ดังนั้น head ของโมเดลที่เทรนไว้แล้วจะถูกตัดทิ้งไป และจะใส่ head ใหม่ที่เหมาะกับการจำแนกลำดับ (sequence classification) เข้ามาแทน คำเตือนนี้เป็นการแจ้งว่า weights บางส่วนจะไม่ถูกนำมาใช้ (weights ของ head ที่ถูกตัดทิ้งไป) และ weights บางส่วน (ของ head ใหม่) จะถูกสร้างขึ้นแบบสุ่ม (randomly initialized) และจบคำเตือนโดยการส่งเสริมให้เราเทรนโมเดล ซึ่งก็เป็นสิ่งที่เรากำลังจะทำตอนนี้',ge,E,rt="หลังจากที่เราได้โมเดลแล้ว เราสามารถกำหนด <code>Trainer</code> โดยการใส่ออพเจ็กต์ที่เราสร้างขึ้นมาทั้งหมด ได้แก่ <code>model</code>, <code>training_args</code>, ชุดข้อมูล training และ validation, <code>data_collator</code> ของเรา และ <code>tokenizer</code> ของเรา:",ve,I,ke,z,pt="ควรสังเกตว่าเมื่อคุณใส่ <code>tokenizer</code> แบบที่เราทำตอนนี้ ตัว <code>data_collator</code> ที่เป็นค่าเริ่มต้นที่ถูกใช้โดย <code>Trainer</code> จะเป็น <code>DataCollatorWithPadding</code> ที่ได้กำหนดไว้ก่อนหน้านี้ ดังนั้นคุณสามารถข้ามบรรทัด <code>data_collator=data_collator</code> ในการ call นี้ไปเลยก็ได้ ซึ่งคุณได้เรียนรู้กระบวนการนี้มาแล้วใน section 2!",Ue,X,ot="เพื่อจะทำการ fine-tune โมเดลด้วย dataset ของเรา เราก็แค่ต้องเรียกเมธอด <code>train()</code> จาก <code>Trainer</code> ของเรา:",Ge,x,_e,V,ct="การรันโค้ดนี้จะเป็นการเริ่มต้น fine-tune โมเดล (ซึ่งจะใช้เวลาไม่กี่นาที ถ้าทำบน GPU) และจะรายงาน training loss ทุก ๆ 500 steps แต่มันจะไม่บอกว่าโมเดลของคุณทำงานได้ดีหรือแย่แค่ไหน เนื่องจาก:",Ze,B,dt="<li>เราไม่ได้บอก <code>Trainer</code> ให้ evaluate ระหว่างการเทรนโดยตั้งค่า <code>evaluation_strategy</code> ให้เป็น <code>&quot;steps&quot;</code> (เพื่อ evaluate ทุก ๆ <code>eval_steps</code>) หรือ <code>&quot;epoch&quot;</code> (เพื่อ evaluate เมื่อจบแต่ละ epoch)</li> <li>เราไม่ได้ใส่ฟังก์ชั่น <code>compute_metrics()</code> เข้าไปใน <code>Trainer</code> ของเรา โดยฟังก์ชั่นนี้จะคำนวณ metric เมื่อมีการ evaluate เกิดขึ้น (ไม่เช่นนั้นเมื่อมีการ evaluate เกิดขึ้น ก็จะรายงานแค่ค่า loss ซึ่งเป็นตัวเลขที่ทำความเข้าใจได้ยาก)</li>",Re,Y,Ce,A,mt="มาดูกันว่าเราจะสามารถสร้างฟังก์ชั่น <code>compute_metrics()</code> และนำไปใช้งานในการเทรนครั้งหน้าได้อย่างไร ฟังก์ชั่นนี้จะต้องรับออพเจกต์ <code>EvalPrediction</code> (ซึ่งเป็น named tuple ที่มี filed เป็น <code>predictions</code> และ <code>label_ids</code>) และจะให้ผลลัพธ์เป็น dictionary ที่มีการ map strings เข้ากับ floats (โดย strings เป็นชื่อของ metrics ผลลัพธ์ และ floats เป็นค่าของ metrics เหล่านั้น) เพื่อจะดูผลการทำนายของโมเดลของเรา เราสามารถใช้คำสั่ง <code>Trainer.predict()</code>:",We,N,He,Q,Fe,L,Mt="ผลลัพธ์จากเมธอด <code>predict()</code> จะเป็น named tuple อีกตัวหนึ่งซึ่งประกอบด้วย 3 fields ได้แก่ <code>predictions</code>, <code>label_ids</code> และ <code>metrics</code> โดย field <code>metrics</code> จะเก็บข้อมูล loss บน dataset ที่ป้อนเข้ามา รวมถึง metrics ที่เกี่ยวข้องกับเวลาบางตัว (ใช้เวลาในการทำนายเท่าไร โดยคิดทั้งเวลาทั้งหมดและเวลาโดยเฉลี่ย) เมื่อเราสร้างฟังก์ชั่น <code>compute_metrics()</code> เสร็จแล้วและใส่เข้าไปใน <code>Trainer</code> ตัว field metric ก็จะมีข้อมูล metrics ต่าง ๆ ที่ได้จากฟังก์ชั่น <code>compute_metrics()</code> ด้วย",Ee,q,ut='ดังที่คุณเห็น <code>predictions</code> เป็น array 2 มิติ ที่มี shape 408 x 2 (408 เป็นจำนวนของ element ใน dataset ที่เราใช้) ซึ่งข้อมูลเหล่านี้คือ logits สำหรับแต่ละ element ของ dataset ที่เราส่งเข้าไปให้เมธอด <code>predict()</code> (เหมือนที่คุณเห็นมาแล้วใน <a href="/course/chapter2">previous chapter</a> ว่าโมเดล Transformers ทุกตัวจะให้ผลลัพธ์เป็น logits) เพื่อจะแปลง logits ให้เป็นการทำนายที่เราสามารถเปรียบเทียบกับ label ของเราได้ เราจะต้องหา index ของค่าที่มีค่าสูงสุดใน axis ที่สอง:',Ie,P,ze,S,ft='ตอนนี้เราก็สามารถเปรียบเทียบ <code>preds</code> เหล่านี้กับ labels ของเราได้แล้ว เพื่อจะสร้างฟังก์ชั่น <code>compute_metric()</code> ของเรา เราจะยืม metrics จากไลบรารี่ 🤗 <a href="https://github.com/huggingface/evaluate/" rel="nofollow">Evaluate</a> มาใช้ เราสามารถโหลด metrics ที่เกี่ยวข้องกับ MRPC dataset ได้อย่างง่ายดายเหมือนกับที่เราโหลดชุดข้อมูล โดยการใช้ฟังก์ชั่น <code>evaluate.load()</code> โดยจะได้ผลลัพธ์เป็นออพเจ็กต์ที่มีเมธอด <code>compute()</code> ที่เราสามารถนำไปใช้ในการคำนวณ metric ได้:',Xe,K,xe,D,Ve,O,bt='ผลลัพธ์ที่ได้อาจแตกต่างไปเล็กน้อย เนื่องจากมีการกำหนดค่า weight ของ model head ขึ้นมาแบบสุ่ม และอาจเปลี่ยนผลลัพธ์ใน metrics ได้ ซึ่งตรงนี้เราจะเห็นได้ว่าโมเดลของเราได้ accuracy ที่ 85.78% เมื่อทดสอบด้วย validation set และได้ค่า F1 score ที่ 89.97 ซึ่ง metrics ทั้งสองตัวนี้เป็น metrics ที่ใช้วัดผล MRPC dataset สำหรับ GLUE benchmark โดยตารางในรายงาน <a href="https://arxiv.org/pdf/1810.04805.pdf" rel="nofollow">BERT paper</a> ได้รายงานค่า F1 score ไว้ที่ 88.9 สำหรับ base model ซึ่งเป็นโมเดล <code>uncased</code> ในขณะที่โมเดลของเราเป็นโมเดล <code>cased</code> จึงเป็นเหตุให้มีผลลัพธ์ที่ดีกว่า',Be,ee,$t="เมื่อรวมทุกอย่างเข้าด้วยกัน เราก็จะได้ฟังก์ชั่น <code>compute_metrics()</code> ของเราดังนี้:",Ye,te,Ae,le,Tt="และเพื่อให้มันรายงาน metrics เมื่อจบ epoch แต่ละ epoch เราสามารกำหนด <code>Trainer</code> ตัวใหม่ โดยใช้ฟังก์ชั่น <code>compute_metrics()</code> ได้ดังนี้:",Ne,se,Qe,ae,ht="ควรสังเกตว่าเราได้สร้าง <code>TrainingArguments</code> ชุดใหม่ โดยกำหนนด <code>evaluation_strategy</code> ให้เป็น <code>&quot;epoch&quot;</code> และสร้างโมเดลขึ้นใหม่ด้วย มิฉะนั้นเราก็จะเทรนโมเดลตัวเดิมของเราต่อ เพื่อจะเริ่มการ training รอบใหม่ เราจะใช้คำสั่ง:",Le,ne,qe,ie,yt="คราวนี้มันจะรายงาน validation loss และ metrics ต่าง ๆ ทุก ๆ ครั้งที่จบแต่ละ epoch นอกจาก training loss ซึ่ง accuracy และ F1 score ที่คุณได้อาจจะต่างจากนี้ไปเล็กน้อยเนื่องจากการสุ่ม แต่มันก็ควรจะได้ค่าที่ใกล้เคียงกัน",Pe,re,jt="<code>Trainer</code> จะสามารถทำงานได้ดีกับการเทรนด้วย GPUs หรือ TPUs หลายตัวโดยไม่ต้องปรับแต่งอะไรมาก และยังมี options มากมายให้เลือกใช้ เช่น mixed-precision training (เลือกได้โดยใส่ <code>fp16 = True</code> เข้าไปใน training arguments ของคุณ) เราจะอธิบายทุกอย่างที่มันทำได้ใน Chapter 10",Se,pe,Jt="ก็เป็นอันเสร็จสิ้นวิธีการ fine-tune โดยใช้ <code>Trainer</code> API ซึ่งตัวอย่างการ fine-tune กับ NLP tasks ส่วนใหญ่ที่ใช้บ่อยจะอยู่ใน Chapter 7 แต่ตอนนี้เรามาดูการทำแบบเดียวกันนี้โดยใช้ PyTorch เพียงอย่างเดียวกัน",Ke,J,De,oe,Oe,ce,et;return y=new zt({props:{fw:w[0]}}),g=new tt({props:{title:"การ Fine-tune โมเดลด้วย Trainer API",local:"การ-fine-tune-โมเดลดวย-trainer-api",headingTag:"h1"}}),v=new It({props:{chapter:3,classNames:"absolute z-10 right-0 top-0",notebooks:[{label:"Google Colab",value:"https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/th/chapter3/section3.ipynb"},{label:"Aws Studio",value:"https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/th/chapter3/section3.ipynb"}]}}),k=new Et({props:{id:"nvBXf7s7vTI"}}),_=new $({props:{code:"ZnJvbSUyMGRhdGFzZXRzJTIwaW1wb3J0JTIwbG9hZF9kYXRhc2V0JTBBZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEF1dG9Ub2tlbml6ZXIlMkMlMjBEYXRhQ29sbGF0b3JXaXRoUGFkZGluZyUwQSUwQXJhd19kYXRhc2V0cyUyMCUzRCUyMGxvYWRfZGF0YXNldCglMjJnbHVlJTIyJTJDJTIwJTIybXJwYyUyMiklMEFjaGVja3BvaW50JTIwJTNEJTIwJTIyYmVydC1iYXNlLXVuY2FzZWQlMjIlMEF0b2tlbml6ZXIlMjAlM0QlMjBBdXRvVG9rZW5pemVyLmZyb21fcHJldHJhaW5lZChjaGVja3BvaW50KSUwQSUwQSUwQWRlZiUyMHRva2VuaXplX2Z1bmN0aW9uKGV4YW1wbGUpJTNBJTBBJTIwJTIwJTIwJTIwcmV0dXJuJTIwdG9rZW5pemVyKGV4YW1wbGUlNUIlMjJzZW50ZW5jZTElMjIlNUQlMkMlMjBleGFtcGxlJTVCJTIyc2VudGVuY2UyJTIyJTVEJTJDJTIwdHJ1bmNhdGlvbiUzRFRydWUpJTBBJTBBJTBBdG9rZW5pemVkX2RhdGFzZXRzJTIwJTNEJTIwcmF3X2RhdGFzZXRzLm1hcCh0b2tlbml6ZV9mdW5jdGlvbiUyQyUyMGJhdGNoZWQlM0RUcnVlKSUwQWRhdGFfY29sbGF0b3IlMjAlM0QlMjBEYXRhQ29sbGF0b3JXaXRoUGFkZGluZyh0b2tlbml6ZXIlM0R0b2tlbml6ZXIp",highlighted:`<span class="hljs-keyword">from</span> datasets <span class="hljs-keyword">import</span> load_dataset
<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoTokenizer, DataCollatorWithPadding
raw_datasets = load_dataset(<span class="hljs-string">&quot;glue&quot;</span>, <span class="hljs-string">&quot;mrpc&quot;</span>)
checkpoint = <span class="hljs-string">&quot;bert-base-uncased&quot;</span>
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
<span class="hljs-keyword">def</span> <span class="hljs-title function_">tokenize_function</span>(<span class="hljs-params">example</span>):
<span class="hljs-keyword">return</span> tokenizer(example[<span class="hljs-string">&quot;sentence1&quot;</span>], example[<span class="hljs-string">&quot;sentence2&quot;</span>], truncation=<span class="hljs-literal">True</span>)
tokenized_datasets = raw_datasets.<span class="hljs-built_in">map</span>(tokenize_function, batched=<span class="hljs-literal">True</span>)
data_collator = DataCollatorWithPadding(tokenizer=tokenizer)`,wrap:!1}}),Z=new tt({props:{title:"การ Train โมเดล",local:"การ-train-โมเดล",headingTag:"h3"}}),C=new $({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMFRyYWluaW5nQXJndW1lbnRzJTBBJTBBdHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUyMnRlc3QtdHJhaW5lciUyMik=",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> TrainingArguments
training_args = TrainingArguments(<span class="hljs-string">&quot;test-trainer&quot;</span>)`,wrap:!1}}),j=new Gt({props:{$$slots:{default:[xt]},$$scope:{ctx:w}}}),H=new $({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24lMEElMEFtb2RlbCUyMCUzRCUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQlMkMlMjBudW1fbGFiZWxzJTNEMik=",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoModelForSequenceClassification
model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=<span class="hljs-number">2</span>)`,wrap:!1}}),I=new $({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMFRyYWluZXIlMEElMEF0cmFpbmVyJTIwJTNEJTIwVHJhaW5lciglMEElMjAlMjAlMjAlMjBtb2RlbCUyQyUwQSUyMCUyMCUyMCUyMHRyYWluaW5nX2FyZ3MlMkMlMEElMjAlMjAlMjAlMjB0cmFpbl9kYXRhc2V0JTNEdG9rZW5pemVkX2RhdGFzZXRzJTVCJTIydHJhaW4lMjIlNUQlMkMlMEElMjAlMjAlMjAlMjBldmFsX2RhdGFzZXQlM0R0b2tlbml6ZWRfZGF0YXNldHMlNUIlMjJ2YWxpZGF0aW9uJTIyJTVEJTJDJTBBJTIwJTIwJTIwJTIwZGF0YV9jb2xsYXRvciUzRGRhdGFfY29sbGF0b3IlMkMlMEElMjAlMjAlMjAlMjB0b2tlbml6ZXIlM0R0b2tlbml6ZXIlMkMlMEEp",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> Trainer
trainer = Trainer(
model,
training_args,
train_dataset=tokenized_datasets[<span class="hljs-string">&quot;train&quot;</span>],
eval_dataset=tokenized_datasets[<span class="hljs-string">&quot;validation&quot;</span>],
data_collator=data_collator,
tokenizer=tokenizer,
)`,wrap:!1}}),x=new $({props:{code:"dHJhaW5lci50cmFpbigp",highlighted:"trainer.train()",wrap:!1}}),Y=new tt({props:{title:"Evaluation (การประเมินผลโมเดล)",local:"evaluation-การประเมนผลโมเดล",headingTag:"h3"}}),N=new $({props:{code:"cHJlZGljdGlvbnMlMjAlM0QlMjB0cmFpbmVyLnByZWRpY3QodG9rZW5pemVkX2RhdGFzZXRzJTVCJTIydmFsaWRhdGlvbiUyMiU1RCklMEFwcmludChwcmVkaWN0aW9ucy5wcmVkaWN0aW9ucy5zaGFwZSUyQyUyMHByZWRpY3Rpb25zLmxhYmVsX2lkcy5zaGFwZSk=",highlighted:`predictions = trainer.predict(tokenized_datasets[<span class="hljs-string">&quot;validation&quot;</span>])
<span class="hljs-built_in">print</span>(predictions.predictions.shape, predictions.label_ids.shape)`,wrap:!1}}),Q=new $({props:{code:"KDQwOCUyQyUyMDIpJTIwKDQwOCUyQyk=",highlighted:'(<span class="hljs-number">408</span>, <span class="hljs-number">2</span>) (<span class="hljs-number">408</span>,)',wrap:!1}}),P=new $({props:{code:"aW1wb3J0JTIwbnVtcHklMjBhcyUyMG5wJTBBJTBBcHJlZHMlMjAlM0QlMjBucC5hcmdtYXgocHJlZGljdGlvbnMucHJlZGljdGlvbnMlMkMlMjBheGlzJTNELTEp",highlighted:`<span class="hljs-keyword">import</span> numpy <span class="hljs-keyword">as</span> np
preds = np.argmax(predictions.predictions, axis=-<span class="hljs-number">1</span>)`,wrap:!1}}),K=new $({props:{code:"aW1wb3J0JTIwZXZhbHVhdGUlMEElMEFtZXRyaWMlMjAlM0QlMjBldmFsdWF0ZS5sb2FkKCUyMmdsdWUlMjIlMkMlMjAlMjJtcnBjJTIyKSUwQW1ldHJpYy5jb21wdXRlKHByZWRpY3Rpb25zJTNEcHJlZHMlMkMlMjByZWZlcmVuY2VzJTNEcHJlZGljdGlvbnMubGFiZWxfaWRzKQ==",highlighted:`<span class="hljs-keyword">import</span> evaluate
metric = evaluate.load(<span class="hljs-string">&quot;glue&quot;</span>, <span class="hljs-string">&quot;mrpc&quot;</span>)
metric.compute(predictions=preds, references=predictions.label_ids)`,wrap:!1}}),D=new $({props:{code:"JTdCJ2FjY3VyYWN5JyUzQSUyMDAuODU3ODQzMTM3MjU0OTAxOSUyQyUyMCdmMSclM0ElMjAwLjg5OTY1Mzk3OTIzODc1NDIlN0Q=",highlighted:'{<span class="hljs-string">&#x27;accuracy&#x27;</span>: <span class="hljs-number">0.8578431372549019</span>, <span class="hljs-string">&#x27;f1&#x27;</span>: <span class="hljs-number">0.8996539792387542</span>}',wrap:!1}}),te=new $({props:{code:"ZGVmJTIwY29tcHV0ZV9tZXRyaWNzKGV2YWxfcHJlZHMpJTNBJTBBJTIwJTIwJTIwJTIwbWV0cmljJTIwJTNEJTIwZXZhbHVhdGUubG9hZCglMjJnbHVlJTIyJTJDJTIwJTIybXJwYyUyMiklMEElMjAlMjAlMjAlMjBsb2dpdHMlMkMlMjBsYWJlbHMlMjAlM0QlMjBldmFsX3ByZWRzJTBBJTIwJTIwJTIwJTIwcHJlZGljdGlvbnMlMjAlM0QlMjBucC5hcmdtYXgobG9naXRzJTJDJTIwYXhpcyUzRC0xKSUwQSUyMCUyMCUyMCUyMHJldHVybiUyMG1ldHJpYy5jb21wdXRlKHByZWRpY3Rpb25zJTNEcHJlZGljdGlvbnMlMkMlMjByZWZlcmVuY2VzJTNEbGFiZWxzKQ==",highlighted:`<span class="hljs-keyword">def</span> <span class="hljs-title function_">compute_metrics</span>(<span class="hljs-params">eval_preds</span>):
metric = evaluate.load(<span class="hljs-string">&quot;glue&quot;</span>, <span class="hljs-string">&quot;mrpc&quot;</span>)
logits, labels = eval_preds
predictions = np.argmax(logits, axis=-<span class="hljs-number">1</span>)
<span class="hljs-keyword">return</span> metric.compute(predictions=predictions, references=labels)`,wrap:!1}}),se=new $({props:{code:"dHJhaW5pbmdfYXJncyUyMCUzRCUyMFRyYWluaW5nQXJndW1lbnRzKCUyMnRlc3QtdHJhaW5lciUyMiUyQyUyMGV2YWx1YXRpb25fc3RyYXRlZ3klM0QlMjJlcG9jaCUyMiklMEFtb2RlbCUyMCUzRCUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQlMkMlMjBudW1fbGFiZWxzJTNEMiklMEElMEF0cmFpbmVyJTIwJTNEJTIwVHJhaW5lciglMEElMjAlMjAlMjAlMjBtb2RlbCUyQyUwQSUyMCUyMCUyMCUyMHRyYWluaW5nX2FyZ3MlMkMlMEElMjAlMjAlMjAlMjB0cmFpbl9kYXRhc2V0JTNEdG9rZW5pemVkX2RhdGFzZXRzJTVCJTIydHJhaW4lMjIlNUQlMkMlMEElMjAlMjAlMjAlMjBldmFsX2RhdGFzZXQlM0R0b2tlbml6ZWRfZGF0YXNldHMlNUIlMjJ2YWxpZGF0aW9uJTIyJTVEJTJDJTBBJTIwJTIwJTIwJTIwZGF0YV9jb2xsYXRvciUzRGRhdGFfY29sbGF0b3IlMkMlMEElMjAlMjAlMjAlMjB0b2tlbml6ZXIlM0R0b2tlbml6ZXIlMkMlMEElMjAlMjAlMjAlMjBjb21wdXRlX21ldHJpY3MlM0Rjb21wdXRlX21ldHJpY3MlMkMlMEEp",highlighted:`training_args = TrainingArguments(<span class="hljs-string">&quot;test-trainer&quot;</span>, evaluation_strategy=<span class="hljs-string">&quot;epoch&quot;</span>)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=<span class="hljs-number">2</span>)
trainer = Trainer(
model,
training_args,
train_dataset=tokenized_datasets[<span class="hljs-string">&quot;train&quot;</span>],
eval_dataset=tokenized_datasets[<span class="hljs-string">&quot;validation&quot;</span>],
data_collator=data_collator,
tokenizer=tokenizer,
compute_metrics=compute_metrics,
)`,wrap:!1}}),ne=new $({props:{code:"dHJhaW5lci50cmFpbigp",highlighted:'trainer.trai<span class="hljs-meta">n</span>()',wrap:!1}}),J=new Gt({props:{$$slots:{default:[Vt]},$$scope:{ctx:w}}}),oe=new Xt({props:{source:"https://github.com/huggingface/course/blob/main/chapters/th/chapter3/3.mdx"}}),{c(){p=i("meta"),T=a(),b=i("p"),h=a(),c(y.$$.fragment),de=a(),c(g.$$.fragment),me=a(),c(v.$$.fragment),Me=a(),c(k.$$.fragment),ue=a(),U=i("p"),U.innerHTML=lt,fe=a(),G=i("p"),G.textContent=st,be=a(),c(_.$$.fragment),$e=a(),c(Z.$$.fragment),Te=a(),R=i("p"),R.innerHTML=at,he=a(),c(C.$$.fragment),ye=a(),c(j.$$.fragment),je=a(),W=i("p"),W.innerHTML=nt,Je=a(),c(H.$$.fragment),we=a(),F=i("p"),F.innerHTML=it,ge=a(),E=i("p"),E.innerHTML=rt,ve=a(),c(I.$$.fragment),ke=a(),z=i("p"),z.innerHTML=pt,Ue=a(),X=i("p"),X.innerHTML=ot,Ge=a(),c(x.$$.fragment),_e=a(),V=i("p"),V.textContent=ct,Ze=a(),B=i("ol"),B.innerHTML=dt,Re=a(),c(Y.$$.fragment),Ce=a(),A=i("p"),A.innerHTML=mt,We=a(),c(N.$$.fragment),He=a(),c(Q.$$.fragment),Fe=a(),L=i("p"),L.innerHTML=Mt,Ee=a(),q=i("p"),q.innerHTML=ut,Ie=a(),c(P.$$.fragment),ze=a(),S=i("p"),S.innerHTML=ft,Xe=a(),c(K.$$.fragment),xe=a(),c(D.$$.fragment),Ve=a(),O=i("p"),O.innerHTML=bt,Be=a(),ee=i("p"),ee.innerHTML=$t,Ye=a(),c(te.$$.fragment),Ae=a(),le=i("p"),le.innerHTML=Tt,Ne=a(),c(se.$$.fragment),Qe=a(),ae=i("p"),ae.innerHTML=ht,Le=a(),c(ne.$$.fragment),qe=a(),ie=i("p"),ie.textContent=yt,Pe=a(),re=i("p"),re.innerHTML=jt,Se=a(),pe=i("p"),pe.innerHTML=Jt,Ke=a(),c(J.$$.fragment),De=a(),c(oe.$$.fragment),Oe=a(),ce=i("p"),this.h()},l(e){const t=Ht("svelte-u9bgzb",document.head);p=r(t,"META",{name:!0,content:!0}),t.forEach(l),T=n(e),b=r(e,"P",{}),kt(b).forEach(l),h=n(e),d(y.$$.fragment,e),de=n(e),d(g.$$.fragment,e),me=n(e),d(v.$$.fragment,e),Me=n(e),d(k.$$.fragment,e),ue=n(e),U=r(e,"P",{"data-svelte-h":!0}),o(U)!=="svelte-ri2n1m"&&(U.innerHTML=lt),fe=n(e),G=r(e,"P",{"data-svelte-h":!0}),o(G)!=="svelte-lju15h"&&(G.textContent=st),be=n(e),d(_.$$.fragment,e),$e=n(e),d(Z.$$.fragment,e),Te=n(e),R=r(e,"P",{"data-svelte-h":!0}),o(R)!=="svelte-1coier3"&&(R.innerHTML=at),he=n(e),d(C.$$.fragment,e),ye=n(e),d(j.$$.fragment,e),je=n(e),W=r(e,"P",{"data-svelte-h":!0}),o(W)!=="svelte-1g21eac"&&(W.innerHTML=nt),Je=n(e),d(H.$$.fragment,e),we=n(e),F=r(e,"P",{"data-svelte-h":!0}),o(F)!=="svelte-1a4jhzb"&&(F.innerHTML=it),ge=n(e),E=r(e,"P",{"data-svelte-h":!0}),o(E)!=="svelte-12nwfzl"&&(E.innerHTML=rt),ve=n(e),d(I.$$.fragment,e),ke=n(e),z=r(e,"P",{"data-svelte-h":!0}),o(z)!=="svelte-qx8k75"&&(z.innerHTML=pt),Ue=n(e),X=r(e,"P",{"data-svelte-h":!0}),o(X)!=="svelte-12asvlz"&&(X.innerHTML=ot),Ge=n(e),d(x.$$.fragment,e),_e=n(e),V=r(e,"P",{"data-svelte-h":!0}),o(V)!=="svelte-19xu70u"&&(V.textContent=ct),Ze=n(e),B=r(e,"OL",{"data-svelte-h":!0}),o(B)!=="svelte-tfbmtd"&&(B.innerHTML=dt),Re=n(e),d(Y.$$.fragment,e),Ce=n(e),A=r(e,"P",{"data-svelte-h":!0}),o(A)!=="svelte-3by548"&&(A.innerHTML=mt),We=n(e),d(N.$$.fragment,e),He=n(e),d(Q.$$.fragment,e),Fe=n(e),L=r(e,"P",{"data-svelte-h":!0}),o(L)!=="svelte-uaqzl2"&&(L.innerHTML=Mt),Ee=n(e),q=r(e,"P",{"data-svelte-h":!0}),o(q)!=="svelte-34397x"&&(q.innerHTML=ut),Ie=n(e),d(P.$$.fragment,e),ze=n(e),S=r(e,"P",{"data-svelte-h":!0}),o(S)!=="svelte-t56ve1"&&(S.innerHTML=ft),Xe=n(e),d(K.$$.fragment,e),xe=n(e),d(D.$$.fragment,e),Ve=n(e),O=r(e,"P",{"data-svelte-h":!0}),o(O)!=="svelte-1vg21xz"&&(O.innerHTML=bt),Be=n(e),ee=r(e,"P",{"data-svelte-h":!0}),o(ee)!=="svelte-1h8o6pr"&&(ee.innerHTML=$t),Ye=n(e),d(te.$$.fragment,e),Ae=n(e),le=r(e,"P",{"data-svelte-h":!0}),o(le)!=="svelte-1ehxxhw"&&(le.innerHTML=Tt),Ne=n(e),d(se.$$.fragment,e),Qe=n(e),ae=r(e,"P",{"data-svelte-h":!0}),o(ae)!=="svelte-ulktjg"&&(ae.innerHTML=ht),Le=n(e),d(ne.$$.fragment,e),qe=n(e),ie=r(e,"P",{"data-svelte-h":!0}),o(ie)!=="svelte-ufdqz2"&&(ie.textContent=yt),Pe=n(e),re=r(e,"P",{"data-svelte-h":!0}),o(re)!=="svelte-1h2xg0o"&&(re.innerHTML=jt),Se=n(e),pe=r(e,"P",{"data-svelte-h":!0}),o(pe)!=="svelte-1g5sfnr"&&(pe.innerHTML=Jt),Ke=n(e),d(J.$$.fragment,e),De=n(e),d(oe.$$.fragment,e),Oe=n(e),ce=r(e,"P",{}),kt(ce).forEach(l),this.h()},h(){Ut(p,"name","hf:doc:metadata"),Ut(p,"content",Yt)},m(e,t){Ft(document.head,p),s(e,T,t),s(e,b,t),s(e,h,t),m(y,e,t),s(e,de,t),m(g,e,t),s(e,me,t),m(v,e,t),s(e,Me,t),m(k,e,t),s(e,ue,t),s(e,U,t),s(e,fe,t),s(e,G,t),s(e,be,t),m(_,e,t),s(e,$e,t),m(Z,e,t),s(e,Te,t),s(e,R,t),s(e,he,t),m(C,e,t),s(e,ye,t),m(j,e,t),s(e,je,t),s(e,W,t),s(e,Je,t),m(H,e,t),s(e,we,t),s(e,F,t),s(e,ge,t),s(e,E,t),s(e,ve,t),m(I,e,t),s(e,ke,t),s(e,z,t),s(e,Ue,t),s(e,X,t),s(e,Ge,t),m(x,e,t),s(e,_e,t),s(e,V,t),s(e,Ze,t),s(e,B,t),s(e,Re,t),m(Y,e,t),s(e,Ce,t),s(e,A,t),s(e,We,t),m(N,e,t),s(e,He,t),m(Q,e,t),s(e,Fe,t),s(e,L,t),s(e,Ee,t),s(e,q,t),s(e,Ie,t),m(P,e,t),s(e,ze,t),s(e,S,t),s(e,Xe,t),m(K,e,t),s(e,xe,t),m(D,e,t),s(e,Ve,t),s(e,O,t),s(e,Be,t),s(e,ee,t),s(e,Ye,t),m(te,e,t),s(e,Ae,t),s(e,le,t),s(e,Ne,t),m(se,e,t),s(e,Qe,t),s(e,ae,t),s(e,Le,t),m(ne,e,t),s(e,qe,t),s(e,ie,t),s(e,Pe,t),s(e,re,t),s(e,Se,t),s(e,pe,t),s(e,Ke,t),m(J,e,t),s(e,De,t),m(oe,e,t),s(e,Oe,t),s(e,ce,t),et=!0},p(e,[t]){const wt={};t&1&&(wt.fw=e[0]),y.$set(wt);const gt={};t&2&&(gt.$$scope={dirty:t,ctx:e}),j.$set(gt);const vt={};t&2&&(vt.$$scope={dirty:t,ctx:e}),J.$set(vt)},i(e){et||(M(y.$$.fragment,e),M(g.$$.fragment,e),M(v.$$.fragment,e),M(k.$$.fragment,e),M(_.$$.fragment,e),M(Z.$$.fragment,e),M(C.$$.fragment,e),M(j.$$.fragment,e),M(H.$$.fragment,e),M(I.$$.fragment,e),M(x.$$.fragment,e),M(Y.$$.fragment,e),M(N.$$.fragment,e),M(Q.$$.fragment,e),M(P.$$.fragment,e),M(K.$$.fragment,e),M(D.$$.fragment,e),M(te.$$.fragment,e),M(se.$$.fragment,e),M(ne.$$.fragment,e),M(J.$$.fragment,e),M(oe.$$.fragment,e),et=!0)},o(e){u(y.$$.fragment,e),u(g.$$.fragment,e),u(v.$$.fragment,e),u(k.$$.fragment,e),u(_.$$.fragment,e),u(Z.$$.fragment,e),u(C.$$.fragment,e),u(j.$$.fragment,e),u(H.$$.fragment,e),u(I.$$.fragment,e),u(x.$$.fragment,e),u(Y.$$.fragment,e),u(N.$$.fragment,e),u(Q.$$.fragment,e),u(P.$$.fragment,e),u(K.$$.fragment,e),u(D.$$.fragment,e),u(te.$$.fragment,e),u(se.$$.fragment,e),u(ne.$$.fragment,e),u(J.$$.fragment,e),u(oe.$$.fragment,e),et=!1},d(e){e&&(l(T),l(b),l(h),l(de),l(me),l(Me),l(ue),l(U),l(fe),l(G),l(be),l($e),l(Te),l(R),l(he),l(ye),l(je),l(W),l(Je),l(we),l(F),l(ge),l(E),l(ve),l(ke),l(z),l(Ue),l(X),l(Ge),l(_e),l(V),l(Ze),l(B),l(Re),l(Ce),l(A),l(We),l(He),l(Fe),l(L),l(Ee),l(q),l(Ie),l(ze),l(S),l(Xe),l(xe),l(Ve),l(O),l(Be),l(ee),l(Ye),l(Ae),l(le),l(Ne),l(Qe),l(ae),l(Le),l(qe),l(ie),l(Pe),l(re),l(Se),l(pe),l(Ke),l(De),l(Oe),l(ce)),l(p),f(y,e),f(g,e),f(v,e),f(k,e),f(_,e),f(Z,e),f(C,e),f(j,e),f(H,e),f(I,e),f(x,e),f(Y,e),f(N,e),f(Q,e),f(P,e),f(K,e),f(D,e),f(te,e),f(se,e),f(ne,e),f(J,e),f(oe,e)}}}const Yt='{"title":"การ Fine-tune โมเดลด้วย Trainer API","local":"การ-fine-tune-โมเดลดวย-trainer-api","sections":[{"title":"การ Train โมเดล","local":"การ-train-โมเดล","sections":[],"depth":3},{"title":"Evaluation (การประเมินผลโมเดล)","local":"evaluation-การประเมนผลโมเดล","sections":[],"depth":3}],"depth":1}';function At(w,p,T){let b="pt";return Rt(()=>{const h=new URLSearchParams(window.location.search);T(0,b=h.get("fw")||"pt")}),[b]}class Ot extends Ct{constructor(p){super(),Wt(this,p,At,Bt,Zt,{})}}export{Ot as component};

Xet Storage Details

Size:
33.4 kB
·
Xet hash:
60e1c44975154587f50a1b5832467991d3235ca88fa4bada701f597f7614145b

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.