Buckets:
| # Тест в конце главы[[end-of-chapter-quiz]] | |
| ### 1. Каков порядок работы конвейера языкового моделирования? | |
| ### 2. Сколько измерений имеет тензор, выводимый базовой моделью Transformer, и каковы они? | |
| ### 3. Что из перечисленного ниже является примером токенизации по подсловам? | |
| ### 4. Что такое голова модели? | |
| {#if fw === 'pt'} | |
| ### 5. Что такое AutoModel? | |
| AutoTrain?" | |
| }, | |
| { | |
| text: "Объект, возвращающий правильную архитектуру на основе контрольной точки", | |
| explain: "Именно: в AutoModel для возврата правильной архитектуры достаточно знать контрольную точку, с которой нужно инициализироваться.", | |
| correct: true | |
| }, | |
| { | |
| text: "Модель, которая автоматически определяет язык, используемый для входов, чтобы загрузить правильные веса", | |
| explain: "Неверно; хотя некоторые контрольные точки и модели способны работать с несколькими языками, встроенных инструментов для автоматического выбора контрольной точки в зависимости от языка не существует. Вам следует обратиться в Model Hub, чтобы найти лучшую контрольную точку для вашей задачи!" | |
| } | |
| ]} | |
| /> | |
| {:else} | |
| ### 5. Что такое TFAutoModel? | |
| AutoTrain?" | |
| }, | |
| { | |
| text: "Объект, возвращающий правильную архитектуру на основе контрольной точки", | |
| explain: "Именно так: в TFAutoModel для возврата правильной архитектуры достаточно знать контрольную точку, с которой нужно инициализироваться.", | |
| correct: true | |
| }, | |
| { | |
| text: "Модель, которая автоматически определяет язык, используемый на входах, чтобы загрузить правильные веса", | |
| explain: "Неверно; хотя некоторые контрольные точки и модели способны работать с несколькими языками, встроенных инструментов для автоматического выбора контрольной точки в зависимости от языка не существует. Вам следует обратиться в Model Hub, чтобы найти лучшую контрольную точку для вашей задачи!" | |
| } | |
| ]} | |
| /> | |
| {/if} | |
| ### 6. На какие техники следует обратить внимание при объединении в батч последовательностей разной длины? | |
| ### 7. В чем смысл применения функции SoftMax к логитам, выводимым моделью классификации последовательностей? | |
| ### 8. Какой метод является основным в API токенизатора? | |
| encode, поскольку он может кодировать текст в идентификаторы и идентификаторы в прогнозы.", | |
| explain: "Неверно! Если метод encode существует в токенизаторах, то в моделях его нет." | |
| }, | |
| { | |
| text: "Вызов объекта токенизатора напрямую.", | |
| explain: "Точно! Метод __call__ токенизатора - это очень мощный метод, который может обрабатывать практически все. Это также метод, используемый для получения прогнозов из модели.", | |
| correct: true | |
| }, | |
| { | |
| text: "pad", | |
| explain: "Неверно! Дополнение очень полезно, но это всего лишь одна из частей API токенизатора." | |
| }, | |
| { | |
| text: "tokenize", | |
| explain: "Метод tokenize, пожалуй, один из самых полезных методов, но он не является ядром API токенизатора." | |
| } | |
| ]} | |
| /> | |
| ### 9. Что содержит переменная `result` в этом примере кода? | |
| ```py | |
| from transformers import AutoTokenizer | |
| tokenizer = AutoTokenizer.from_pretrained("bert-base-cased") | |
| result = tokenizer.tokenize("Hello!") | |
| ``` | |
| __call__ или convert_tokens_to_ids!" | |
| }, | |
| { | |
| text: "Строка, содержащая все токены", | |
| explain: "Это было бы неоптимально, поскольку цель состоит в том, чтобы разбить строку на множество токенов." | |
| } | |
| ]} | |
| /> | |
| {#if fw === 'pt'} | |
| ### 10. Есть ли что-то неправильное в следующем коде? | |
| ```py | |
| from transformers import AutoTokenizer, AutoModel | |
| tokenizer = AutoTokenizer.from_pretrained("bert-base-cased") | |
| model = AutoModel.from_pretrained("gpt2") | |
| encoded = tokenizer("Hey!", return_tensors="pt") | |
| result = model(**encoded) | |
| ``` | |
| {:else} | |
| ### 10. Что-то не так с приведенным ниже кодом? | |
| ```py | |
| from transformers import AutoTokenizer, TFAutoModel | |
| tokenizer = AutoTokenizer.from_pretrained("bert-base-cased") | |
| model = TFAutoModel.from_pretrained("gpt2") | |
| encoded = tokenizer("Hey!", return_tensors="pt") | |
| result = model(**encoded) | |
| ``` | |
| {/if} | |
Xet Storage Details
- Size:
- 5.93 kB
- Xet hash:
- 1232bed9143a8b117e536ffc96710906de9fff12563cd9a4f8ab0ed0f9a31aea
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.