Buckets:
| # 단원 마무리 퀴즈[[end-of-chapter-quiz]] | |
| ### 1. 언어 모델링 파이프라인은 어떤 순서로 진행될까요? | |
| ### 2. 기본 Transformer 모델에 의해 만들어지는 텐서의 출력은 몇 차원이며, 각 텐서가 무엇을 의미하나요? | |
| ### 3. 서브워드 토큰화 예시에 해당하는 것은 무엇인가요? | |
| ### 4. 모델 헤드가 무엇인가요? | |
| {#if fw === 'pt'} | |
| ### 5. AutoModel이 무엇인가요? | |
| AutoTrain과 헷갈린 게 아닐까요?" | |
| }, | |
| { | |
| text: "체크포인트에 기반하여 적합한 구조를 반환하는 객체입니다.", | |
| explain: "정확합니다. AutoModel은 적절한 모델 구조를 초기화할 때 필요한 체크포인트만을 필요로 합니다.", | |
| correct: true | |
| }, | |
| { | |
| text: "적합한 가중치를 불러오기 위해 입력에 사용된 언어를 자동으로 감지하는 모델입니다.", | |
| explain: "오답입니다. 몇몇 체크포인트와 모델은 다양한 언어를 처리할 수 있지만, 언어에 따라 체크포인트를 자동으로 선택할 수 있도록 내장된 도구는 없습니다. 태스크에 가장 적합한 체크포인트를 찾으려면 모델 허브에 가보세요!" | |
| } | |
| ]} | |
| /> | |
| {:else} | |
| ### 5. TFAutoModel이 무엇인가요? | |
| AutoTrain과 헷갈린 게 아닐까요?" | |
| }, | |
| { | |
| text: "체크포인트에 기반하여 적합한 구조를 반환하는 객체입니다.", | |
| explain: "정확합니다. AutoModel은 적절한 모델 구조를 초기화할 때 필요한 체크포인트만을 필요로 합니다.", | |
| correct: true | |
| }, | |
| { | |
| text: "적합한 가중치를 불러오기 위해 입력에 사용된 언어를 자동으로 감지하는 모델입니다.", | |
| explain: "오답입니다. 몇몇 체크포인트와 모델은 다양한 언어를 처리할 수 있지만, 언어에 따라 체크포인트를 자동으로 선택할 수 있도록 내장된 도구는 없습니다. 태스크에 가장 적합한 체크포인트를 찾으려면 모델 허브에 가보세요!" | |
| } | |
| ]} | |
| /> | |
| {/if} | |
| ### 6. 길이가 다른 시퀀스를 하나의 배치로 만들 때 신경써야 할 부분은 무엇일까요? | |
| ### 7. 시퀀스 분류 모델의 로짓 출력 결과에 소프트맥스 함수를 적용하는 핵심적인 이유는 무엇일까요? | |
| ### 8. 토크나이저 API의 가장 핵심적인 메서드는 무엇일까요? | |
| encode입니다.", | |
| explain: "틀렸습니다! encode 메서드가 토크나이저에는 있지만, 모델에는 없습니다." | |
| }, | |
| { | |
| text: "토크나이저 객체를 바로 호출하는 메서드입니다.", | |
| explain: "정확합니다! 토크나이저의 __call__ 메서드는 거의 모든 것을 처리할 수 있는 강력한 메서드입니다. 이 메서드는 또한 모델로부터 예측 결과를 탐색하는 데에 사용되기도 합니다.", | |
| correct: true | |
| }, | |
| { | |
| text: "pad 메서드입니다.", | |
| explain: "틀렸습니다! 패딩은 매우 유용한 방법이지만, 토크나이저 API가 제공하는 기능 중 하나일 뿐입니다." | |
| }, | |
| { | |
| text: "tokenize 메서드입니다.", | |
| explain: "tokenize 메서드가 유용한 것은 틀림없지만, 토크나이저 API의 핵심은 아닙니다." | |
| } | |
| ]} | |
| /> | |
| ### 9. 아래 코드 예시에서 `result` 변수가 포함하고 있는 것은 무엇일까요? | |
| ```py | |
| from transformers import AutoTokenizer | |
| tokenizer = AutoTokenizer.from_pretrained("bert-base-cased") | |
| result = tokenizer.tokenize("Hello!") | |
| ``` | |
| __call__ 또는 convert_tokens_to_ids 입니다!" | |
| }, | |
| { | |
| text: "모든 토큰을 포함하고 있는 문자열입니다.", | |
| explain: "문자열을 각각의 토큰으로 나누는 것이 목표기 때문에 정확한 정답은 아닙니다." | |
| } | |
| ]} | |
| /> | |
| {#if fw === 'pt'} | |
| ### 10. 아래 코드에서 잘못된 부분이 있을까요? | |
| ```py | |
| from transformers import AutoTokenizer, AutoModel | |
| tokenizer = AutoTokenizer.from_pretrained("bert-base-cased") | |
| model = AutoModel.from_pretrained("gpt2") | |
| encoded = tokenizer("Hey!", return_tensors="pt") | |
| result = model(**encoded) | |
| ``` | |
| {:else} | |
| ### 10. 아래 코드에서 잘못된 부분이 있을까요? | |
| ```py | |
| from transformers import AutoTokenizer, TFAutoModel | |
| tokenizer = AutoTokenizer.from_pretrained("bert-base-cased") | |
| model = TFAutoModel.from_pretrained("gpt2") | |
| encoded = tokenizer("Hey!", return_tensors="pt") | |
| result = model(**encoded) | |
| ``` | |
| {/if} | |
Xet Storage Details
- Size:
- 4.37 kB
- Xet hash:
- 4e7e3a08c262ec3aa68d3ab179ea5e6499ad4de1815703d542e58b5bd3fc937d
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.