Buckets:

hf-doc-build
/

doc

Files

xet

hf-doc-build/doc / course /main /ko /chapter2 /8.md

rtrm

about 2 months ago

preview code

download

raw

4.37 kB

	# 단원 마무리 퀴즈[[end-of-chapter-quiz]]

	### 1. 언어 모델링 파이프라인은 어떤 순서로 진행될까요?

	### 2. 기본 Transformer 모델에 의해 만들어지는 텐서의 출력은 몇 차원이며, 각 텐서가 무엇을 의미하나요?

	### 3. 서브워드 토큰화 예시에 해당하는 것은 무엇인가요?

	### 4. 모델 헤드가 무엇인가요?

	{#if fw === 'pt'}
	### 5. AutoModel이 무엇인가요?

	AutoTrain과 헷갈린 게 아닐까요?"
	},
	{
	text: "체크포인트에 기반하여 적합한 구조를 반환하는 객체입니다.",
	explain: "정확합니다. AutoModel은 적절한 모델 구조를 초기화할 때 필요한 체크포인트만을 필요로 합니다.",
	correct: true
	},
	{
	text: "적합한 가중치를 불러오기 위해 입력에 사용된 언어를 자동으로 감지하는 모델입니다.",
	explain: "오답입니다. 몇몇 체크포인트와 모델은 다양한 언어를 처리할 수 있지만, 언어에 따라 체크포인트를 자동으로 선택할 수 있도록 내장된 도구는 없습니다. 태스크에 가장 적합한 체크포인트를 찾으려면 모델 허브에 가보세요!"
	}
	]}
	/>

	{:else}
	### 5. TFAutoModel이 무엇인가요?

	AutoTrain과 헷갈린 게 아닐까요?"
	},
	{
	text: "체크포인트에 기반하여 적합한 구조를 반환하는 객체입니다.",
	explain: "정확합니다. AutoModel은 적절한 모델 구조를 초기화할 때 필요한 체크포인트만을 필요로 합니다.",
	correct: true
	},
	{
	text: "적합한 가중치를 불러오기 위해 입력에 사용된 언어를 자동으로 감지하는 모델입니다.",
	explain: "오답입니다. 몇몇 체크포인트와 모델은 다양한 언어를 처리할 수 있지만, 언어에 따라 체크포인트를 자동으로 선택할 수 있도록 내장된 도구는 없습니다. 태스크에 가장 적합한 체크포인트를 찾으려면 모델 허브에 가보세요!"
	}
	]}
	/>

	{/if}

	### 6. 길이가 다른 시퀀스를 하나의 배치로 만들 때 신경써야 할 부분은 무엇일까요?

	### 7. 시퀀스 분류 모델의 로짓 출력 결과에 소프트맥스 함수를 적용하는 핵심적인 이유는 무엇일까요?

	### 8. 토크나이저 API의 가장 핵심적인 메서드는 무엇일까요?

	encode입니다.",
	explain: "틀렸습니다! encode 메서드가 토크나이저에는 있지만, 모델에는 없습니다."
	},
	{
	text: "토크나이저 객체를 바로 호출하는 메서드입니다.",
	explain: "정확합니다! 토크나이저의 __call__ 메서드는 거의 모든 것을 처리할 수 있는 강력한 메서드입니다. 이 메서드는 또한 모델로부터 예측 결과를 탐색하는 데에 사용되기도 합니다.",
	correct: true
	},
	{
	text: "pad 메서드입니다.",
	explain: "틀렸습니다! 패딩은 매우 유용한 방법이지만, 토크나이저 API가 제공하는 기능 중 하나일 뿐입니다."
	},
	{
	text: "tokenize 메서드입니다.",
	explain: "tokenize 메서드가 유용한 것은 틀림없지만, 토크나이저 API의 핵심은 아닙니다."
	}
	]}
	/>

	### 9. 아래 코드 예시에서 `result` 변수가 포함하고 있는 것은 무엇일까요?

	```py
	from transformers import AutoTokenizer

	tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
	result = tokenizer.tokenize("Hello!")
	```

	__call__ 또는 convert_tokens_to_ids 입니다!"
	},
	{
	text: "모든 토큰을 포함하고 있는 문자열입니다.",
	explain: "문자열을 각각의 토큰으로 나누는 것이 목표기 때문에 정확한 정답은 아닙니다."
	}
	]}
	/>

	{#if fw === 'pt'}
	### 10. 아래 코드에서 잘못된 부분이 있을까요?

	```py
	from transformers import AutoTokenizer, AutoModel

	tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
	model = AutoModel.from_pretrained("gpt2")

	encoded = tokenizer("Hey!", return_tensors="pt")
	result = model(**encoded)
	```

	{:else}
	### 10. 아래 코드에서 잘못된 부분이 있을까요?

	```py
	from transformers import AutoTokenizer, TFAutoModel

	tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
	model = TFAutoModel.from_pretrained("gpt2")

	encoded = tokenizer("Hey!", return_tensors="pt")
	result = model(**encoded)
	```

	{/if}

Xet Storage Details

Size:: 4.37 kB
Xet hash:: 4e7e3a08c262ec3aa68d3ab179ea5e6499ad4de1815703d542e58b5bd3fc937d

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.