Buckets:

rtrm's picture
|
download
raw
3.66 kB

Введение[[introduction]]

В Главе 3 вы узнали, как дообучить модель для классификации текстов. В этой главе мы рассмотрим следующие общие задачи NLP:

  • Классификация токенов (Token classification)
  • Маскированное языковое моделирование (Masked language modeling, например, BERT)
  • Резюмирование текста (Summarization)
  • Перевод (Translation)
  • Предварительное обучение каузального языкового моделирования (Causal language modeling, например, GPT-2)
  • Ответы на вопросы (Question answering)

{#if fw === 'pt'}

Для этого вам понадобится использовать все, что вы узнали об API Trainer и библиотеке 🤗 Accelerate в Главе 3, библиотеке 🤗 Datasets в Главе 5 и библиотеке 🤗 Tokenizers в Главе 6. Мы также загрузим наши результаты в хаб моделей, как мы делали это в Главе 4, так что это действительно глава,в которой все собирается воедино!

Каждый раздел можно читать независимо друг от друга, и в нем вы узнаете, как обучить модель с помощью API Trainer или с помощью собственного цикла обучения, используя 🤗 Accelerate. Вы можете пропустить любую часть и сосредоточиться на той, которая вас больше всего интересует: API Trainer отлично подходит для того, чтобы дообучить или обучить вашу модель, не беспокоясь о том, что происходит за кулисами, а цикл обучения с Accelerate позволит вам легче настроить любую часть, которую вы хотите.

{:else}

Для этого вам понадобится использовать все, что вы узнали об обучении моделей с помощью Keras API в Главе 3, библиотеке 🤗 Datasets в Главе 5 и библиотеке 🤗 Tokenizers в Главе 6. Мы также загрузим наши результаты в хаб моделей, как мы делали это в Главе 4, так что это действительно глава, в которой все собирается воедино!

Каждый раздел можно читать самостоятельно.

{/if}

Если вы будете читать разделы по порядку, то заметите, что в них довольно много общего в коде и тексте. Повторение сделано намеренно, чтобы вы могли погрузиться (или вернуться позже) в любую интересующую вас задачу и найти полный рабочий пример.

Xet Storage Details

Size:
3.66 kB
·
Xet hash:
c386038faac0facd596b4ebc4d309e74877b384a02b2341be71ff1798b4f440e

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.