Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / course /pr_1107 /ru /chapter3 /6.md

rtrm's picture

about 2 months ago

|

16.4 kB

Тест в конце главы[[end-of-chapter-quiz]]

Тест по результатам изучения главы 3.

Датасет `emotion` содержит сообщения из Твиттера, каждое сообщение помечено какой-либо эмоцией. Найдите его на Hub и изучить карточку датасета. Какая из этих эмоцией не является базовой?

<Question choices={[ { text: "Joy", explain: "Попробуйте еще раз, этот класс присутствует в датасете!" }, { text: "Love", explain: "Попробуйте еще раз, этот класс присутствует в датасете!" }, { text: "Confusion", explain: "Правильно! Замешательство не является одним из 6 базовых классов датасета.", correct: true }, { text: "Surprise", explain: "Сюрприз! Попробуйте другой вариант!" } ]} />

2. Найдите датасет `ar_sarcasm` в Hub. Какую задачу можно решить с использованием этого датасета?

<Question choices={[ { text: "Sentiment classification / Классификация тональности", explain: "Правильно! Поблагодарите за это тэги. ", correct: true }, { text: "Machine translation / Машинный перевод", explain: "Нет, изучите еще раз карточку датасета!" }, { text: "Named entity recognition / Распознавание именованных сущностей", explain: "Нет, изучите еще раз карточку датасета!" }, { text: "Question answering / Ответы на вопросы", explain: "Увы! Неправильный ответ. " } ]} />

3. В каком формате модель BERT ожидает на вход пару предложений?

<Question choices={[ { text: "Токены_предложения_1 [SEP] Токены_предложения_2", explain: "Токен [SEP] – специальный токен для разделения двух предложений, однако этого недостаточно." }, { text: "[CLS] Токены_предложения_1 Токены_предложения_2", explain: "Токен [CLS] – специальный токен, обозначающий начало последовательнсти, однако этого недостаточно." }, { text: "[CLS] Токены_предложения_1 [SEP] Токены_предложения_2 [SEP]", explain: "Правильно!", correct: true }, { text: "[CLS] Токены_предложения_1 [SEP] Токены_предложения_2", explain: "Токен [CLS] – специальный токен, обозначающий начало последовательнсти, Токен [SEP] – специальный токен для разделения двух предложений. Но это не всё!" } ]} />

{#if fw === 'pt'}

4. Какие преимущества есть у метода `Dataset.map()?`

<Question choices={[ { text: "Результаты функции кэшируются, поэтому повторное выполнение кода не займет много времени.", explain: "Это действительно одно из преимуществ этого метода! Впрочем, не единственное...", correct: true }, { text: "Можно применить мультипроцессорную обработку – это быстрее, чем применять функцию к каждому элементу выборки.", explain: "Это преимущество данного метода, но не единственное.", correct: true }, { text: "Он не загружает весь набор данных в память, сохраняя результаты сразу после обработки одного элемента.", explain: "Это одно из преимуществ этого метода. Хотя есть и другие!", correct: true }, ]} />

5. Что такое dynamic padding?

<Question choices={[ { text: "Дополнение нулями каждой входной последовательности до максимальной длины, содержащейся в датасете.", explain: "Подразумевает дополнение при создании батча, но не до максимальной длины во всем датасете." }, { text: "Дополнение нулями при создании батча до максимальной длины предложения, содержашегося в батче.", explain: "Правильно! "Динамическим" пэддинг становится в момент анализа каждого элемента батча. Все батчи могут иметь разную длину элементов.", correct: true }, { text: "Такое дополнение, при котором длина каждого предложения равна длине предыдущего предложения.", explain: "Неправильно. Хотя бы потому, что мы перемешиваем датасет во время обучения." }, ]} />

6. Какова цель функции сопоставления (collate function)?

<Question choices={[ { text: "Она проверяет, что все предложения в датасете одинаковой длины.", explain: "Функция сопоставления используется для обработки отдельных батчей, а не всего датасета. Кроме того, мы говорим об общих collate-функциях, а не конкретно о DataCollatorWithPadding." }, { text: "Она соединяет вместе все элементы батча.", explain: "Верно! Вы можете передать функцию сопоставления в качестве аргумента для DataLoader. Мы использовали функцию DataCollatorWithPadding, которая дополняет все элементы в батче до одинаковой длины.", correct: true }, { text: "Она обрабатывает весь датасет. ", explain: "Тогда она называлась быть функцией препроцессинга, а не функцией сопоставления." }, { text: "Она обрезает предложения в датасете.", explain: "Collate-функция используется для одного батча, а не всего датасета. Если вам необходимо обрезать датасет, вы можете использовать аргумент truncate в tokenizer." } ]} />

7. Что происходит, когда вы создаете экземпляр одного из классов `AutoModelForXxx` с предварительно обученной языковой моделью (например, `bert-base-uncased`), которая соответствует задаче, отличной от той, для которой она была обучена?

<Question choices={[ { text: "Ничего, но будет выведено предупреждение.", explain: "Предупреждение действительно появится, но это не всё!" }, { text: "Последний слой модели будет заменён на слой, подходящий для текущей задачи.", explain: "Правильно. Например, когда мы используем AutoModelForSequenceClassification с bert-base-uncased чекпоинтом, распечатывается предупреждение при инициализации модели. Предобученная «голова» модели не используется для классификации предложений, так что она заменяется другим слоем со случайно инициализированными весами.", correct: true }, { text: "Последний слой модели игнорируется.", explain: "Должно произойти что-то еще! Попробуй еще раз!" }, { text: "Ничего, модель по-прежнему можно будет настроить на решение другой задачи.", explain: "Последний слой модели был обучен решать другую задачу, значит с ним должно что-то произойти!" } ]} />

8. Зачем нужен `TrainingArguments`?

<Question choices={[ { text: "Он содержит все гиперпараметры, используемые для обучения и оценки с помощью Trainer", explain: "Верно!", correct: true }, { text: "Задает размер модели.", explain: "Размер модели определяется ее структурой, а не классом TrainingArguments." }, { text: "Содержит гиперпараметры для этапа валидации модели.", explain: "В примере мы задавали, где будут сохраняться модель и её веса. Попробуй еще раз!" }, { text: "Он содержит гиперпараметры этапа обучения.", explain: "В примере мы использовали evaluation_strategy, что также влияет на валидацию. Попробуй еще раз!" } ]} />

9. Зачем нужна библиотека 🤗 Accelerate?

<Question choices={[ { text: "Предоставляет доступ к более быстрым моделям.", explain: "Нет, 🤗 Accelerate не предоставляет доступа к каким-либо ни было моделям." }, { text: "Предоставляет высокоуровневый API и появляется возможность не реализовывать собственный цикл обучения.", explain: "Это мы делаем с помощью Trainer, а не 🤗 Accelerate. Попробуй еще раз!" }, { text: "Позволяет исполнить наш цикл обучения на распределенных системах.", explain: "Праивльно! С помощью 🤗 Accelerate обучающий цикл будет исполняться на нескольких GPU или TPU.", correct: true }, { text: "Предоставляет больше оптимизационных функций.", explain: "Нет, 🤗 Accelerate не предоставляет оптимизационных функций." } ]} />

{:else}

4. Что происходит, когда вы создаете экземпляр одного из классов `TFAutoModelForXxx` с предварительно обученной языковой моделью (например, `bert-base-uncased`), которая соответствует задаче, отличной от той, для которой она была обучена?

<Question choices={[ { text: "Ничего, но будет выведено предупреждение.", explain: "Предупреждение действительно появится, но это не всё!" }, { text: "Последний слой модели будет заменён на слой, подходящий для текущей задачи.", explain: "Правильно. Например, когда мы используем AutoModelForSequenceClassification с bert-base-uncased чекпоинтом, распечатывается предупреждение при инициализации модели. Предобученная «голова» модели не используется для классификации предложений, так что она заменяется другим слоем со случайно инициализированными весами.", correct: true }, { text: "Последний слой модели игнорируется.", explain: "Должно произойти что-то еще! Попробуй еще раз!" }, { text: "Ничего, модель по-прежнему можно будет настроить на решение другой задачи.", explain: "Последний слой модели был обучен решать другую задачу, значит с ним должно что-то произойти!" } ]} />

5. TensorFlow-модели из `transformers` уже можно рассматривать как Keras-модели. Какие преимущества это дает?

<Question choices={[ { text: "Модели будут работать на TPU «из коробки».", explain: "Почти! Необходимо внести ряд дополнительных изменений, например: следует запустить все с помощью TPUStrategy (включая инициализацию модели)." }, { text: "Вы сможете испольовать существующие методы, такие как compile(), fit() и predict().", explain: "Верно! Данные у вас уже есть, дело осталось за малым – обучить модель. ", correct: true }, { text: "Вы сможете изучить и Keras, и transformers.", explain: "Верно! Но ответ все же немного другой :)", correct: true }, { text: "Вы можете просто вычислить метрики, связанные с датасетом.", explain: "Keras помогает в обучении и валидации модели, а не с вычислением метрик." } ]} />

6. Как мы можем задать собственную метрику?

<Question choices={[ { text: "Наследуя tf.keras.metrics.Metric.", explain: "Великолепно!", correct: true }, { text: "С использованием функционального API Keras.", explain: "Try again!" }, { text: "С использованием вызываемого модуля metric_fn(y_true, y_pred).", explain: "Верно!", correct: true }, { text: "Загуглив её!", explain: "Это не тот ответ, который мы ожидаем, однако это должно помочь вам!", correct: true } ]} />

{/if}

Xet Storage Details

Size:: 16.4 kB
Xet hash:: def52aca61edc694f147ab170f571b1b0f049a35bb13c3e73a5866acd214f888

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.