Buckets:

rtrm's picture
|
download
raw
5.93 kB
# Тест в конце главы[[end-of-chapter-quiz]]
### 1. Каков порядок работы конвейера языкового моделирования?
### 2. Сколько измерений имеет тензор, выводимый базовой моделью Transformer, и каковы они?
### 3. Что из перечисленного ниже является примером токенизации по подсловам?
### 4. Что такое голова модели?
{#if fw === 'pt'}
### 5. Что такое AutoModel?
AutoTrain?"
},
{
text: "Объект, возвращающий правильную архитектуру на основе контрольной точки",
explain: "Именно: в AutoModel для возврата правильной архитектуры достаточно знать контрольную точку, с которой нужно инициализироваться.",
correct: true
},
{
text: "Модель, которая автоматически определяет язык, используемый для входов, чтобы загрузить правильные веса",
explain: "Неверно; хотя некоторые контрольные точки и модели способны работать с несколькими языками, встроенных инструментов для автоматического выбора контрольной точки в зависимости от языка не существует. Вам следует обратиться в Model Hub, чтобы найти лучшую контрольную точку для вашей задачи!"
}
]}
/>
{:else}
### 5. Что такое TFAutoModel?
AutoTrain?"
},
{
text: "Объект, возвращающий правильную архитектуру на основе контрольной точки",
explain: "Именно так: в TFAutoModel для возврата правильной архитектуры достаточно знать контрольную точку, с которой нужно инициализироваться.",
correct: true
},
{
text: "Модель, которая автоматически определяет язык, используемый на входах, чтобы загрузить правильные веса",
explain: "Неверно; хотя некоторые контрольные точки и модели способны работать с несколькими языками, встроенных инструментов для автоматического выбора контрольной точки в зависимости от языка не существует. Вам следует обратиться в Model Hub, чтобы найти лучшую контрольную точку для вашей задачи!"
}
]}
/>
{/if}
### 6. На какие техники следует обратить внимание при объединении в батч последовательностей разной длины?
### 7. В чем смысл применения функции SoftMax к логитам, выводимым моделью классификации последовательностей?
### 8. Какой метод является основным в API токенизатора?
encode, поскольку он может кодировать текст в идентификаторы и идентификаторы в прогнозы.",
explain: "Неверно! Если метод encode существует в токенизаторах, то в моделях его нет."
},
{
text: "Вызов объекта токенизатора напрямую.",
explain: "Точно! Метод __call__ токенизатора - это очень мощный метод, который может обрабатывать практически все. Это также метод, используемый для получения прогнозов из модели.",
correct: true
},
{
text: "pad",
explain: "Неверно! Дополнение очень полезно, но это всего лишь одна из частей API токенизатора."
},
{
text: "tokenize",
explain: "Метод tokenize, пожалуй, один из самых полезных методов, но он не является ядром API токенизатора."
}
]}
/>
### 9. Что содержит переменная `result` в этом примере кода?
```py
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")
```
__call__ или convert_tokens_to_ids!"
},
{
text: "Строка, содержащая все токены",
explain: "Это было бы неоптимально, поскольку цель состоит в том, чтобы разбить строку на множество токенов."
}
]}
/>
{#if fw === 'pt'}
### 10. Есть ли что-то неправильное в следующем коде?
```py
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)
```
{:else}
### 10. Что-то не так с приведенным ниже кодом?
```py
from transformers import AutoTokenizer, TFAutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = TFAutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)
```
{/if}

Xet Storage Details

Size:
5.93 kB
·
Xet hash:
1232bed9143a8b117e536ffc96710906de9fff12563cd9a4f8ab0ed0f9a31aea

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.