Buckets:

rtrm's picture
|
download
raw
14.3 kB

Тест в конце главы[[end-of-chapter-quiz]]

В этой главе было много материала! Если вы чувствуете, что все еще всецело не познали все премудрости трансформеров - не переживайте! В следующих главах мы детально расскажем, как все устроено "под капотом".

Сперва, однако, давайте проверим, что вы узнали в этой главе!

1. Зайдите на Hub и найдите чекпоинт модели roberta-large-mnli. Какую задачу она решает?

<Question choices={[ { text: "Автоматическое реферирование (саммаризация)", explain: "Посмотрите получше на <a href="https://huggingface.co/roberta-large-mnli\">странице roberta-large-mnli." }, { text: "Классификация текстов", explain: "В частности, модель определяет, являются ли два предложения логически связанными и присваивает одну из трех меток: противопоставление, нейтральная связь, импликация (англ. contradiction, neutral, entailment). Эта задача называется автоматическое определение логической связи между текстами (англ. natural language inference).", correct: true }, { text: "Генерация текста", explain: "Посмотрите получше на <a href="https://huggingface.co/roberta-large-mnli\">странице roberta-large-mnli." } ]} />

2. Какой будет результат выполнения данного кода?

from transformers import pipeline

ner = pipeline("ner", grouped_entities=True)
ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")

<Question choices={[ { text: "Пайплайн вернет следующие метки классов для этого предложения: "positive" или "negative".", explain: "Неверно — для этого используется пайплайн sentiment-analysis." }, { text: "Пайплайн вернет текст, сгенерированный на основе данного предложения.", explain: "Неверно — для этого используется пайплайн text-generation.", }, { text: "Пайплайн вернет слова, обозначающие персон, организаций или географических локаций.", explain: "Кроме того, с аргументом grouped_entities=True, пайплайн сгруппирует слова, принадлежащие одной и той же сущности, например, "Hugging Face".", correct: true } ]} />

3. Чем нужно заменить ... в данном коде?

from transformers import pipeline

filler = pipeline("fill-mask", model="bert-base-cased")
result = filler("...")

<Question choices={[ { text: "This <mask> has been waiting for you.", explain: "Неверно. Прочитайте карточку модели bert-base-cased и попробуйте найти, где вы ошиблись." }, { text: "This [MASK] has been waiting for you.", explain: "Верно! Токен-маска для этой модели - [MASK].", correct: true }, { text: "This man has been waiting for you.", explain: "Неверно. Этот пайплайн предсказывает замаскированный токен, а для этого нужно предоставить токен-маску." } ]} />

4. Почему этот код выдаст ошибку?

from transformers import pipeline

classifier = pipeline("zero-shot-classification")
result = classifier("This is a course about the Transformers library")

<Question choices={[ { text: "Этому пайплайну требуются метки классов.", explain: "Верно — правильный код должен содержать аргумент candidate_labels=[...].", correct: true }, { text: "Этому пайплайну требуются несколько предложений, а не одно.", explain: "Неверно. Хотя, если использовать этот пайплайн правильно, он может принимать на вход массив предложений (как и все остальные пайплайны)." }, { text: "Опять библиотека 🤗 Transformers не работает как положено.", explain: "Мы даже не будем комментировать этот ответ!" }, { text: "Этому пайплайну требуются более длинные предложения - это слишком короткое.", explain: "Неверно. Однако, стоит отметить, что этот пайплайн обрежет очень длинный текст, для того, чтобы его корректно обработать." } ]} />

5. Что такое «трансферное обучение»?

<Question choices={[ { text: "Передача знаний от предобученной модели к новой модели путем ее обучения на тех же данных.", explain: "Нет - результатом этого будут две версии той же самой модели." }, { text: "Передача знаний от предобученной модели к новой модели путем инициализирования новой модели с весами предобученной.", explain: "Верно - когда новая модель будет обучена на новой задаче, она получит знания предобученной модели. Другими словами, предобученная модель передаст свои знания новой.", correct: true }, { text: "Передача знаний от предобученной модели к новой модели путем проектирования новой модели с той же самой архитектурой, что и у предобученной.", explain: "Архитектура - это лишь «скелет» модели; в этом случае никой передачи знаний не происходит." } ]} />

6. Правда или ложь? Для предобучения языковой модели обычно не требуются метки классов.

<Question choices={[ { text: "Правда", explain: "Предобучение обычно самостоятельно (англ. self-supervised). Это означает, что метки классов создаются автоматически на основе входных данных (например, предсказание следующего или замаскированного слова).", correct: true }, { text: "Ложь", explain: "Это неверный ответ." } ]} />

7. Выберите предложение, которое наилучшим способом описывает следующие термины: «модель», «архитектура» и «веса».

<Question choices={[ { text: "Модель - это здание, ее архитектура - чертеж, а веса - люди, которые там живут.", explain: "Чтобы это сравнение было верным, веса должны быть кирпичами и другими материалами из которых построено здание." }, { text: "Архитектура - это карта, по которой можно построить модель, а веса - это города на этой карте.", explain: "Проблема этого сравнения в том, что карта обычно отображает одну существующую реальность (во Франции только один город под названием Париж). В то время как одна и та же архитектура может быть заполнена разными наборами весов." }, { text: "Архитектура - это последовательность математических функций для создания модели, а веса - параметры этих функций.", explain: "Один и тот же набор математических функций (архитектура) можно использовать для построения разных моделей, используя разные параметры (веса).", correct: true } ]} />

8. Какую из этих моделей вы выберете для дополнения текста по введенной его части?

<Question choices={[ { text: "Кодировщик", explain: "Кодировщик генерирует векторное представление всего предложения, что больше подходит для таких задач как классификация." }, { text: "Декодировщик", explain: "Декодировщик идеально подходит для дополнения текста по введенной его части.", correct: true }, { text: "Кодировщик-декодировщик", explain: "Модели sequence-to-sequence больше подходят для задач, в которых вам нужно сгенерировать предложения, основываясь на входных предложениях целиком, а не на части текста, которую нужно продолжить." } ]} />

9. Какую из этих моделей вы выберете для автоматического реферирования?

<Question choices={[ { text: "Кодировщик", explain: "Кодировщик генерирует векторное представление всего предложения, что больше подходит для таких задач как классификация." }, { text: "Декодировщик", explain: "Декодировщих хорошо продходит для генерации текста (например, рефератов), но он не способен брать во внимание контекст (например, документ целиком) для реферирования." }, { text: "Кодировщик-декодировщик", explain: "Кодировщик-декодировщик идеально подходит для задачи автоматического реферирования.", correct: true } ]} />

10. Какую из этих моделей вы выберете для классификации текстов путем присвоения им определенных меток?

<Question choices={[ { text: "Кодировщик", explain: "Кодировщик генерирует векторное представление всего предложения, что идеально подходит для такой задачи, как классификация.", correct: true }, { text: "Декодировщик", explain: "Декодировщих хорошо подходит для генерации текста, а не для присвоения метки документу." }, { text: "Кодировщик-декодировщик", explain: "Модели sequence-to-sequence больше подходят для задач, в которых вам нужно сгенерировать предложения, основываясь на входных предложениях целиком, а не для присвоения метки документу.", } ]} />

11. Что может быть одной из причин предвзятости модели?

<Question choices={[ { text: "Модель была дообучена на основе предобученной модели, которая содержала в себе предвзятость.", explain: "Используя трансферное обучение, предвзятость предобученной модели также передастся новой модели.", correct: true }, { text: "В обучающей выборке были тексты предвзятого содержания.", explain: "Это самый очевидный источник предвзятости, но далеко не единственный.", correct: true }, { text: "Метрика, выбранная для оптимизации модели, была склонна к предвзятости.", explain: "Менее очевидный источник предвзятости кроется в организации ее обучения. Модель будет слепо следовать выбранной метрике, так как она неспособна «задуматься» о ее корректности.", correct: true } ]} />

Xet Storage Details

Size:
14.3 kB
·
Xet hash:
c226b1d5aeb386f606aa54ae94f50b101e6dcbe2cfed2555d176d4a3b244cf6c

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.