Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / course /pr_1114 /my /chapter1 /7.md

rtrm

about 2 months ago

preview code

download

raw

31.5 kB

	# အမှတ်မပေးသော Quiz[[ungraded-quiz]]

	<CourseFloatingBanner
	chapter={1}
	classNames="absolute z-10 right-0 top-0"
	/>

	ဒီအခန်းက သင်ကြားရမယ့် အကြောင်းအရာတွေ အများကြီးကို ဖော်ပြခဲ့ပြီးပါပြီ။ အသေးစိတ် အချက်အလက်အားလုံးကို နားမလည်သေးရင်လည်း စိတ်မပူပါနဲ့။ ဒါပေမယ့် ဒီ quiz နဲ့ သင် သင်ယူခဲ့တာတွေကို ပြန်လည်သုံးသပ်ကြည့်ရအောင်။

	ဒီ quiz က အမှတ်မပေးတဲ့အတွက် သင်နှစ်သက်သလောက် အကြိမ်ကြိမ် ကြိုးစားဖြေဆိုနိုင်ပါတယ်။ မေးခွန်းအချို့နဲ့ ရုန်းကန်ရရင် အကြံပြုချက်တွေကို လိုက်နာပြီး သင်ခန်းစာတွေကို ပြန်လည်လေ့လာပါ။ ဒီအကြောင်းအရာတွေကို အသိအမှတ်ပြု စာမေးပွဲမှာ ထပ်မံဖြေဆိုရမှာ ဖြစ်ပါတယ်။

	### 1. Hub ကို ရှာဖွေပြီး `roberta-large-mnli` checkpoint ကို ရှာပါ။ ၎င်းသည် မည်သည့်လုပ်ငန်းကို လုပ်ဆောင်ပါသနည်း။

	<Question
	choices={[
	{
	text: "အကျဉ်းချုပ်ခြင်း (Summarization)",
	explain: "roberta-large-mnli စာမျက်နှာကို <a href=\"https://huggingface.co/roberta-large-mnli\">ပြန်လည်ကြည့်ရှုပါ။</a>"
	},
	{
	text: "စာသားခွဲခြားသတ်မှတ်ခြင်း (Text classification)",
	explain: " ပိုတိတိကျကျပြောရရင် ၎င်းသည် စာကြောင်းနှစ်ကြောင်းက ယုတ္တိရှိရှိ ဆက်စပ်မှုရှိမရှိကို အဆင့်သုံးဆင့် (contradiction, neutral, entailment) နဲ့ ခွဲခြားသတ်မှတ်ပါတယ်။ ဒီလုပ်ငန်းကို <em>natural language inference</em> လို့လည်း ခေါ်ပါတယ်။",
	correct: true
	},
	{
	text: "စာသားထုတ်လုပ်ခြင်း (Text generation)",
	explain: "roberta-large-mnli စာမျက်နှာကို <a href=\"https://huggingface.co/roberta-large-mnli\">ပြန်လည်ကြည့်ရှုပါ။</a>"
	}
	]}
	/>

	### 2. အောက်ပါ code သည် မည်သည့်အရာကို ပြန်ပေးမည်နည်း။

	```py
	from transformers import pipeline

	ner = pipeline("ner", grouped_entities=True)
	ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")
	```

	<Question
	choices={[
	{
	text: "၎င်းသည် ဤစာကြောင်းအတွက် classification scores \"positive\" သို့မဟုတ် \"negative\" အညွှန်းများဖြင့် ကို ပြန်ပေးပါလိမ့်မည်။",
	explain: "ဒါက မမှန်ကန်ပါဘူး — ဒါက `sentiment-analysis` pipeline ဖြစ်ပါလိမ့်မယ်။"
	},
	{
	text: "၎င်းသည် ဤစာကြောင်းကို ဖြည့်စွက်ထားသော ဖန်တီးထားသည့် စာသားကို ပြန်ပေးပါလိမ့်မည်။",
	explain: "ဒါက မမှန်ကန်ပါဘူး — ဒါက `text-generation` pipeline ဖြစ်ပါလိမ့်မယ်။",
	},
	{
	text: "၎င်းသည် လူပုဂ္ဂိုလ်များ၊ အဖွဲ့အစည်းများ သို့မဟုတ် နေရာများကို ကိုယ်စားပြုသည့် စကားလုံးများကို ပြန်ပေးပါလိမ့်မည်။",
	explain: "ထို့အပြင် `grouped_entities=True` ကို အသုံးပြုထားသောကြောင့် ၎င်းသည် 'Hugging Face' ကဲ့သို့သော တူညီသည့် entity နှင့် သက်ဆိုင်သည့် စကားလုံးများကို အုပ်စုဖွဲ့ပေးပါလိမ့်မည်။",
	correct: true
	}
	]}
	/>

	### 3. ဤ code နမူနာတွင် ... နေရာ၌ မည်သည့်အရာကို အစားထိုးသင့်သနည်း။

	```py
	from transformers import pipeline

	filler = pipeline("fill-mask", model="bert-base-cased")
	result = filler("...")
	```

	<Question
	choices={[
	{
	text: "This <mask> has been waiting for you.",
	explain: "ဒါက မမှန်ကန်ပါဘူး။ `bert-base-cased` မော်ဒယ်ကတ်ကို ကြည့်ပြီး သင့်ရဲ့ အမှားကို ရှာဖွေကြည့်ပါ။"
	},
	{
	text: "This [MASK] has been waiting for you.",
	explain: "ဒီမော်ဒယ်ရဲ့ mask token က `[MASK]` ဖြစ်ပါတယ်။",
	correct: true
	},
	{
	text: "This man has been waiting for you.",
	explain: "ဒါက မမှန်ကန်ပါဘူး။ ဒီ pipeline က ဝှက်ထားတဲ့ စကားလုံးတွေကို ဖြည့်ဆည်းပေးတာဖြစ်တဲ့အတွက် mask token တစ်ခုခု လိုအပ်ပါတယ်။"
	}
	]}
	/>

	### 4. ဤ code သည် အဘယ်ကြောင့် အလုပ်မလုပ်နိုင်သနည်း။

	```py
	from transformers import pipeline

	classifier = pipeline("zero-shot-classification")
	result = classifier("This is a course about the Transformers library")
	```

	<Question
	choices={[
	{
	text: "ဤ pipeline သည် ဤစာသားကို အမျိုးအစားခွဲခြားရန်အတွက် အညွှန်းများ (labels) ပေးရန် လိုအပ်ပါသည်။",
	explain: "မှန်ပါတယ် — မှန်ကန်တဲ့ code မှာ `candidate_labels=[...]` ကို ထည့်သွင်းဖို့ လိုအပ်ပါတယ်။",
	correct: true
	},
	{
	text: "ဤ pipeline သည် စာကြောင်းတစ်ကြောင်းတည်းမဟုတ်ဘဲ စာကြောင်းများစွာ လိုအပ်ပါသည်။",
	explain: "ဒါက မမှန်ကန်ပါဘူး။ ဒါပေမယ့် မှန်ကန်စွာ အသုံးပြုပါက ဒီ pipeline ဟာ စာကြောင်းစာရင်းတစ်ခုကို လုပ်ဆောင်နိုင်ပါတယ်။ (အခြား pipelines အားလုံးလိုပဲပေါ့)"
	},
	{
	text: "🤗 Transformers library သည် အမြဲတမ်းလိုလို ပျက်နေပါသည်။",
	explain: "ဒီအဖြေကို ကျွန်တော်တို့ မှတ်ချက်မပေးတော့ပါဘူး။"
	},
	{
	text: "ဤ pipeline သည် ပိုရှည်သော inputs များ လိုအပ်ပါသည်။ ဤ input သည် အလွန်တိုတောင်းပါသည်။",
	explain: "ဒါက မမှန်ကန်ပါဘူး။ အလွန်ရှည်လျားသော စာသားကို ဒီ pipeline က လုပ်ဆောင်တဲ့အခါ ဖြတ်တောက်သွားမှာ ဖြစ်ပါတယ်။"
	}
	]}
	/>

	### 5. "Transfer learning" ဆိုတာ ဘာကိုဆိုလိုတာလဲ။

	<Question
	choices={[
	{
	text: "ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု၏ အသိပညာကို တူညီသော dataset ဖြင့် ထပ်မံလေ့ကျင့်ခြင်းအားဖြင့် မော်ဒယ်အသစ်သို့ လွှဲပြောင်းပေးခြင်း။",
	explain: "မဟုတ်ပါဘူး၊ ဒါက မော်ဒယ်တစ်ခုတည်းရဲ့ ဗားရှင်းနှစ်ခု ဖြစ်သွားပါလိမ့်မယ်။"
	},
	{
	text: "ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု၏ အသိပညာကို ဒုတိယမော်ဒယ်ကို ပထမမော်ဒယ်၏ weights များဖြင့် စတင်ခြင်းအားဖြင့် မော်ဒယ်အသစ်သို့ လွှဲပြောင်းပေးခြင်း။",
	explain: "ဒုတိယမော်ဒယ်ကို လုပ်ငန်းအသစ်တစ်ခုအတွက် လေ့ကျင့်သောအခါ ၎င်းသည် ပထမမော်ဒယ်၏ အသိပညာကို 'လွှဲပြောင်း' ပေးပါတယ်။",
	correct: true
	},
	{
	text: "ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု၏ အသိပညာကို ဒုတိယမော်ဒယ်ကို ပထမမော်ဒယ်နှင့် တူညီသော architecture ဖြင့် တည်ဆောက်ခြင်းအားဖြင့် မော်ဒယ်အသစ်သို့ လွှဲပြောင်းပေးခြင်း။",
	explain: "Architecture က မော်ဒယ်ကို ဘယ်လိုတည်ဆောက်ထားလဲဆိုတာကိုပဲ ပြောတာပါ။ ဒီကိစ္စမှာ အသိပညာကို မျှဝေတာ ဒါမှမဟုတ် လွှဲပြောင်းပေးတာ မရှိပါဘူး။"
	}
	]}
	/>

	### 6. မှန်လား မှားလား။ Language Model တစ်ခုသည် ၎င်း၏ pretraining အတွက် အညွှန်းများ (labels) မလိုအပ်ပါ။

	<Question
	choices={[
	{
	text: "မှန်သည်",
	explain: "Pretraining က များသောအားဖြင့် self-supervised ဖြစ်ပါတယ်။ ဒါက အညွှန်းတွေကို inputs တွေကနေ အလိုအလျောက် ဖန်တီးပေးတယ်လို့ ဆိုလိုပါတယ်။ (ဥပမာ- နောက်စကားလုံးကို ခန့်မှန်းတာ သို့မဟုတ် ဝှက်ထားတဲ့ စကားလုံးတွေကို ဖြည့်ဆည်းပေးတာ)။",
	correct: true
	},
	{
	text: "မှားသည်",
	explain: "ဒါက မှန်ကန်တဲ့အဖြေ မဟုတ်ပါဘူး။"
	}
	]}
	/>

	### 7. "model"၊ "architecture" နှင့် "weights" ဟူသော ဝေါဟာရများကို အကောင်းဆုံး ဖော်ပြသည့် စာကြောင်းကို ရွေးပါ။

	<Question
	choices={[
	{
	text: "အကယ်၍ model တစ်ခုသည် အဆောက်အအုံတစ်ခုဖြစ်ပါက ၎င်း၏ architecture သည် ပုံစံထုတ်ဒီဇိုင်း (blueprint) ဖြစ်ပြီး weights များသည် အတွင်း၌ နေထိုင်သူများ ဖြစ်သည်။",
	explain: "ဒီဥပမာအတိုင်းဆိုရင် weights တွေက အဆောက်အအုံကို ဆောက်လုပ်ဖို့အတွက် အသုံးပြုတဲ့ အုတ်တွေနဲ့ အခြားပစ္စည်းတွေ ဖြစ်ပါလိမ့်မယ်။"
	},
	{
	text: "Architecture တစ်ခုသည် model တစ်ခုကို တည်ဆောက်ရန် မြေပုံတစ်ခုဖြစ်ပြီး ၎င်း၏ weights များသည် မြေပုံပေါ်တွင် ဖော်ပြထားသော မြို့များ ဖြစ်သည်။",
	explain: "ဒီဥပမာရဲ့ ပြဿနာကတော့ မြေပုံတစ်ခုက များသောအားဖြင့် ရှိပြီးသား အဖြစ်မှန်တစ်ခုကို ကိုယ်စားပြုပါတယ်။ (ပြင်သစ်မှာ Paris လို့ အမည်ရတဲ့ မြို့တစ်မြို့ပဲ ရှိပါတယ်)။ သတ်မှတ်ထားတဲ့ architecture တစ်ခုအတွက် weights များစွာ ဖြစ်နိုင်ပါတယ်။"
	},
	{
	text: "Architecture တစ်ခုသည် model တစ်ခုကို တည်ဆောက်ရန် သင်္ချာဆိုင်ရာ functions များ၏ ဆက်တိုက်ဖြစ်စဉ်တစ်ခုဖြစ်ပြီး ၎င်း၏ weights များသည် ထို functions များ၏ parameters များ ဖြစ်သည်။",
	explain: "တူညီသော သင်္ချာဆိုင်ရာ functions အစုံ (architecture) ကို မတူညီသော parameters (weights) များကို အသုံးပြုခြင်းဖြင့် မတူညီသော model များကို တည်ဆောက်ရန် အသုံးပြုနိုင်ပါသည်။",
	correct: true
	}
	]}
	/>

	### 8. ဖန်တီးထားသော စာသားများဖြင့် prompts များကို ဖြည့်စွက်ရန်အတွက် မည်သည့်မော်ဒယ်အမျိုးအစားများကို အသုံးပြုမည်နည်း။

	<Question
	choices={[
	{
	text: "Encoder model တစ်ခု",
	explain: "Encoder model တစ်ခုသည် စာကြောင်းတစ်ခုလုံး၏ ကိုယ်စားပြုမှုကို ထုတ်ပေးပြီး ၎င်းသည် classification ကဲ့သို့သော လုပ်ငန်းများအတွက် ပိုမိုသင့်လျော်ပါသည်။"
	},
	{
	text: "Decoder model တစ်ခု",
	explain: "Decoder model များသည် prompt တစ်ခုမှ စာသားထုတ်လုပ်ရန်အတွက် အပြည့်အဝ သင့်လျော်ပါသည်။",
	correct: true
	},
	{
	text: "Sequence-to-sequence model တစ်ခု",
	explain: "Sequence-to-sequence model များသည် input စာကြောင်းများနှင့် ဆက်စပ်ပြီး စာကြောင်းများကို ဖန်တီးလိုသည့် လုပ်ငန်းများအတွက် ပိုမိုသင့်လျော်ပြီး၊ သတ်မှတ်ထားသော prompt တစ်ခုအတွက် မဟုတ်ပါ။"
	}
	]}
	/>

	### 9. စာသားများကို အကျဉ်းချုပ်ရန်အတွက် မည်သည့်မော်ဒယ်အမျိုးအစားများကို အသုံးပြုမည်နည်း။

	<Question
	choices={[
	{
	text: "Encoder model တစ်ခု",
	explain: "Encoder model တစ်ခုသည် စာကြောင်းတစ်ခုလုံး၏ ကိုယ်စားပြုမှုကို ထုတ်ပေးပြီး ၎င်းသည် classification ကဲ့သို့သော လုပ်ငန်းများအတွက် ပိုမိုသင့်လျော်ပါသည်။"
	},
	{
	text: "Decoder model တစ်ခု",
	explain: "Decoder model များသည် output text (ဥပမာ- အကျဉ်းချုပ်များ) ကို ထုတ်လုပ်ရန် ကောင်းမွန်သော်လည်း၊ ၎င်းတို့တွင် အကျဉ်းချုပ်ရန် စာသားတစ်ခုလုံးကဲ့သို့သော context ကို အသုံးချနိုင်သည့် စွမ်းရည် မရှိပါ။"
	},
	{
	text: "Sequence-to-sequence model တစ်ခု",
	explain: "Sequence-to-sequence model များသည် အကျဉ်းချုပ်ခြင်း လုပ်ငန်းတစ်ခုအတွက် အပြည့်အဝ သင့်လျော်ပါသည်။",
	correct: true
	}
	]}
	/>

	### 10. သတ်မှတ်ထားသော အညွှန်းများ (labels) အတိုင်း စာသား inputs များကို အမျိုးအစားခွဲခြားရန်အတွက် မည်သည့်မော်ဒယ်အမျိုးအစားများကို အသုံးပြုမည်နည်း။

	<Question
	choices={[
	{
	text: "Encoder model တစ်ခု",
	explain: "Encoder model တစ်ခုသည် စာကြောင်းတစ်ခုလုံး၏ ကိုယ်စားပြုမှုကို ထုတ်ပေးပြီး ၎င်းသည် classification ကဲ့သို့သော လုပ်ငန်းတစ်ခုအတွက် အပြည့်အဝ သင့်လျော်ပါသည်။",
	correct: true
	},
	{
	text: "Decoder model တစ်ခု",
	explain: "Decoder model များသည် output text များကို ထုတ်လုပ်ရန် ကောင်းမွန်ပြီး၊ စာကြောင်းတစ်ခုမှ အညွှန်းတစ်ခုကို ထုတ်ယူရန်အတွက် မဟုတ်ပါ။"
	},
	{
	text: "Sequence-to-sequence model တစ်ခု",
	explain: "Sequence-to-sequence model များသည် input စာကြောင်းတစ်ခုအပေါ် အခြေခံပြီး စာသားကို ဖန်တီးလိုသည့် လုပ်ငန်းများအတွက် ပိုမိုသင့်လျော်ပြီး၊ အညွှန်းတစ်ခုအတွက် မဟုတ်ပါ။",
	}
	]}
	/>

	### 11. မော်ဒယ်တစ်ခုတွင် တွေ့ရသော ဘက်လိုက်မှု (bias) သည် မည်သည့်ရင်းမြစ်မှ ဖြစ်ပေါ်လာနိုင်သနည်း။

	<Question
	choices={[
	{
	text: "မော်ဒယ်သည် ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်၏ fine-tuned version တစ်ခုဖြစ်ပြီး ၎င်းမှ ဘက်လိုက်မှုကို ရယူခဲ့ခြင်း။",
	explain: "Transfer Learning ကို အသုံးပြုသောအခါ ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တွင် ပါဝင်သည့် ဘက်လိုက်မှုသည် fine-tuned မော်ဒယ်တွင် ဆက်လက်တည်ရှိနေပါသည်။",
	correct: true
	},
	{
	text: "မော်ဒယ်ကို လေ့ကျင့်ရာတွင် အသုံးပြုခဲ့သော ဒေတာသည် ဘက်လိုက်မှု ရှိခြင်း။",
	explain: "ဒါက ဘက်လိုက်မှုရဲ့ အထင်ရှားဆုံး ရင်းမြစ်တစ်ခုဖြစ်ပေမယ့် တစ်ခုတည်းတော့ မဟုတ်ပါဘူး။",
	correct: true
	},
	{
	text: "မော်ဒယ်က အကောင်းဆုံးဖြစ်အောင် လုပ်ဆောင်နေတဲ့ metric မှာ ဘက်လိုက်မှု ရှိခြင်း။",
	explain: "ဘက်လိုက်မှုရဲ့ သိသာထင်ရှားမှု နည်းတဲ့ ရင်းမြစ်တစ်ခုကတော့ မော်ဒယ်ကို လေ့ကျင့်တဲ့ နည်းလမ်းပါ။ သင်ရွေးချယ်တဲ့ metric ကို မော်ဒယ်က မျက်စိမှိတ်ပြီး အကောင်းဆုံးဖြစ်အောင် လုပ်ဆောင်သွားမှာ ဖြစ်ပါတယ်။",
	correct: true
	}
	]}
	/>

	## ဝေါဟာရ ရှင်းလင်းချက် (Glossary)

	* Quiz: သင်ယူခဲ့သည့် အကြောင်းအရာများကို ပြန်လည်စစ်ဆေးရန် မေးခွန်းများ။
	* Transformer Models: Natural Language Processing (NLP) မှာ အောင်မြင်မှုများစွာရရှိခဲ့တဲ့ deep learning architecture တစ်မျိုးပါ။ ၎င်းတို့ဟာ စာသားတွေထဲက စကားလုံးတွေရဲ့ ဆက်နွယ်မှုတွေကို "attention mechanism" သုံးပြီး နားလည်အောင် သင်ကြားပေးပါတယ်။
	* Hugging Face Hub: AI မော်ဒယ်တွေ၊ datasets တွေနဲ့ demo တွေကို အခြားသူတွေနဲ့ မျှဝေဖို့၊ ရှာဖွေဖို့နဲ့ ပြန်လည်အသုံးပြုဖို့အတွက် အွန်လိုင်း platform တစ်ခု ဖြစ်ပါတယ်။
	* Checkpoint: မော်ဒယ်တစ်ခုကို လေ့ကျင့်နေစဉ်အတွင်း အချိန်အတန်ကြာပြီးနောက် အခြေအနေတစ်ခုကို သိမ်းဆည်းထားသော အမှတ်။
	* Task: AI မော်ဒယ်တစ်ခုက လုပ်ဆောင်ရန် လေ့ကျင့်ထားသော သီးခြားလုပ်ငန်း (ဥပမာ- စာသားခွဲခြားသတ်မှတ်ခြင်း၊ စာသားထုတ်လုပ်ခြင်း)။
	* Summarization: စာသားတစ်ခုကို အဓိကအချက်အလက်များ မပျောက်ပျက်စေဘဲ ပိုမိုတိုတောင်းသော ပုံစံဖြင့် အကျဉ်းချုပ်ခြင်း။
	* Text Classification: စာသားတစ်ခုကို ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများ သို့မဟုတ် အညွှန်းများထဲသို့ ခွဲခြားသတ်မှတ်ခြင်း။
	* Natural Language Inference (NLI): စာကြောင်းနှစ်ကြောင်းကြားရှိ ယုတ္တိဆိုင်ရာ ဆက်နွယ်မှုကို ဆုံးဖြတ်သည့် လုပ်ငန်း။ (ဥပမာ- contradiction, neutral, entailment)
	* Text Generation: AI မော်ဒယ်များကို အသုံးပြု၍ လူသားကဲ့သို့သော စာသားအသစ်များ ဖန်တီးခြင်း။
	* `pipeline()` function: Hugging Face Transformers library မှာ ပါဝင်တဲ့ လုပ်ဆောင်ချက်တစ်ခုဖြစ်ပြီး မော်ဒယ်တွေကို သီးခြားလုပ်ငန်းတာဝန်များ (ဥပမာ- စာသားခွဲခြားသတ်မှတ်ခြင်း၊ စာသားထုတ်လုပ်ခြင်း) အတွက် အသုံးပြုရလွယ်ကူအောင် ပြုလုပ်ပေးပါတယ်။
	* `ner` (Named Entity Recognition): စာသားထဲက လူအမည်၊ နေရာအမည်၊ အဖွဲ့အစည်းအမည် စတဲ့ သီးခြားအမည်တွေကို ရှာဖွေဖော်ထုတ်ခြင်း။
	* `grouped_entities=True`: `ner` pipeline တွင် အသုံးပြုသည့် parameter တစ်ခုဖြစ်ပြီး တူညီသော entity နှင့် သက်ဆိုင်သည့် စကားလုံးများကို အုပ်စုဖွဲ့ပေးသည်။
	* `sentiment-analysis` pipeline: စာသားတစ်ခု၏ စိတ်ခံစားမှု (အပြုသဘော၊ အနုတ်သဘော) ကို ခွဲခြမ်းစိတ်ဖြာရန် အသုံးပြုသော pipeline။
	* `text-generation` pipeline: input prompt အပေါ် အခြေခံ၍ စာသားအသစ်များကို ဖန်တီးရန် အသုံးပြုသော pipeline။
	* `fill-mask` pipeline: စာသားတစ်ခုရှိ ဝှက်ထားသော စကားလုံးများ (mask tokens) ကို ဖြည့်ဆည်းပေးရန် အသုံးပြုသော pipeline။
	* `bert-base-cased`: BERT (Bidirectional Encoder Representations from Transformers) မော်ဒယ်၏ ဗားရှင်းတစ်ခုဖြစ်ပြီး အင်္ဂလိပ်စာလုံးအကြီးအသေးကို ခွဲခြားသိမြင်သည်။ ၎င်း၏ mask token သည် `[MASK]` ဖြစ်သည်။
	* `zero-shot-classification` pipeline: လေ့ကျင့်မှုဒေတာတွင် မမြင်ဖူးသေးသော အညွှန်းများဖြင့် စာသားများကို အမျိုးအစားခွဲခြားနိုင်သော pipeline။
	* `candidate_labels`: `zero-shot-classification` pipeline တွင် အသုံးပြုသည့် parameter တစ်ခုဖြစ်ပြီး စာသားကို ခွဲခြားသတ်မှတ်ရန်အတွက် ဖြစ်နိုင်ခြေရှိသော အညွှန်းများ (labels) စာရင်းကို ပေးပို့သည်။
	* Transfer Learning: ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခု၏ အသိပညာကို အခြားလုပ်ငန်းတစ်ခု (new task) အတွက် မော်ဒယ်အသစ်သို့ လွှဲပြောင်းပေးခြင်း။
	* Pretrained Model: ကြီးမားသော ဒေတာအစုအဝေးများဖြင့် အစောပိုင်းကတည်းက လေ့ကျင့်ထားသော မော်ဒယ်။
	* Fine-tuned Model: ကြိုတင်လေ့ကျင့်ထားသော မော်ဒယ်တစ်ခုကို သီးခြားလုပ်ငန်းတစ်ခု (specific task) အတွက် အနည်းငယ်သော ဒေတာနှင့် ထပ်မံလေ့ကျင့်ပေးထားသော မော်ဒယ်။
	* Weights: Machine Learning မော်ဒယ်တစ်ခု၏ သင်ယူနိုင်သော အစိတ်အပိုင်းများ။ ၎င်းတို့သည် လေ့ကျင့်နေစဉ်အတွင်း ဒေတာများမှ ပုံစံများကို သင်ယူကာ ချိန်ညှိပေးသည်။
	* Architecture: Machine Learning မော်ဒယ်တစ်ခု၏ တည်ဆောက်ပုံ သို့မဟုတ် ဒီဇိုင်း။ ၎င်းသည် သင်္ချာဆိုင်ရာ functions များ၏ အစီအစဉ်နှင့် ၎င်းတို့ မည်သို့ချိတ်ဆက်ထားသည်ကို သတ်မှတ်သည်။
	* Self-supervised Learning: အညွှန်းများ (labels) ကို inputs များမှ အလိုအလျောက် ထုတ်လုပ်နိုင်သည့် သင်ယူမှုပုံစံတစ်မျိုး။
	* Encoder Model: Transformer Architecture ၏ အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး input data (ဥပမာ- စာသား) ကို နားလည်ပြီး ကိုယ်စားပြုတဲ့ အချက်အလက် (representation) အဖြစ် ပြောင်းလဲပေးကာ classification ကဲ့သို့သော လုပ်ငန်းများအတွက် သင့်လျော်သည်။
	* Decoder Model: Transformer Architecture ၏ အစိတ်အပိုင်းတစ်ခုဖြစ်ပြီး encoder ကနေ ရရှိတဲ့ အချက်အလက် (representation) ကို အသုံးပြုပြီး output data (ဥပမာ- ဘာသာပြန်ထားတဲ့ စာသား သို့မဟုတ် စာသားထုတ်လုပ်ခြင်း) ကို ထုတ်ပေးသည်။
	* Sequence-to-sequence Model: Encoder နှင့် Decoder နှစ်ခုစလုံး ပါဝင်သော Transformer architecture တစ်မျိုးဖြစ်ပြီး input sequence မှ output sequence တစ်ခုသို့ ပြောင်းလဲခြင်း (ဥပမာ- ဘာသာပြန်ခြင်း၊ အကျဉ်းချုပ်ခြင်း) လုပ်ငန်းများအတွက် အသုံးပြုပါတယ်။
	* Bias: ဒေတာအစုအဝေး (dataset) သို့မဟုတ် မော်ဒယ်၏ လေ့ကျင့်မှုပုံစံကြောင့် ဖြစ်ပေါ်လာသော ဘက်လိုက်မှုများ။
	* Metric: မော်ဒယ်တစ်ခု၏ စွမ်းဆောင်ရည်ကို တိုင်းတာရန် အသုံးပြုသော တိုင်းတာမှုစနစ်။

	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/my/chapter1/7.mdx" />

Xet Storage Details

Size:: 31.5 kB
Xet hash:: c41ab7698ff7b3088df422351a00f1d9ecbd48ecb8386441045eb26d83c3aa45

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.