Buckets:

rtrm's picture
download
raw
37.8 kB
<meta charset="utf-8" /><meta name="hf:doc:metadata" content="{&quot;title&quot;:&quot;Что такое LLM?&quot;,&quot;local&quot;:&quot;что-такое-llm&quot;,&quot;sections&quot;:[{&quot;title&quot;:&quot;## Что такое Большая Языковая Модель?&quot;,&quot;local&quot;:&quot;-что-такое-большая-языковая-модель&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Понимание предсказания следующего токена.&quot;,&quot;local&quot;:&quot;понимание-предсказания-следующего-токена&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Внимание - это все, что вам нужно&quot;,&quot;local&quot;:&quot;внимание---это-все-что-вам-нужно&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Подсказки для LLM очень важны&quot;,&quot;local&quot;:&quot;подсказки-для-llm-очень-важны&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Как обучаются LLM?&quot;,&quot;local&quot;:&quot;как-обучаются-llm&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Как я могу использовать LLM?&quot;,&quot;local&quot;:&quot;как-я-могу-использовать-llm&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Как LLM используются в AI Агентах?&quot;,&quot;local&quot;:&quot;как-llm-используются-в-ai-агентах&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2}],&quot;depth&quot;:1}">
<link href="/docs/agents-course/pr_545/ru-RU/_app/immutable/assets/0.e3b0c442.css" rel="modulepreload">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/entry/start.592056c6.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/scheduler.f6b352c8.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/singletons.cff3ffe7.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/index.26cf6c5a.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/paths.1592cfdf.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/entry/app.8fd36cf7.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/index.7f38e934.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/nodes/0.9b025bee.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/each.e59479a4.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/nodes/27.f1777983.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/Tip.ae532637.js">
<link rel="modulepreload" href="/docs/agents-course/pr_545/ru-RU/_app/immutable/chunks/getInferenceSnippets.1ddaa658.js"><!-- HEAD_svelte-u9bgzb_START --><meta name="hf:doc:metadata" content="{&quot;title&quot;:&quot;Что такое LLM?&quot;,&quot;local&quot;:&quot;что-такое-llm&quot;,&quot;sections&quot;:[{&quot;title&quot;:&quot;## Что такое Большая Языковая Модель?&quot;,&quot;local&quot;:&quot;-что-такое-большая-языковая-модель&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Понимание предсказания следующего токена.&quot;,&quot;local&quot;:&quot;понимание-предсказания-следующего-токена&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Внимание - это все, что вам нужно&quot;,&quot;local&quot;:&quot;внимание---это-все-что-вам-нужно&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Подсказки для LLM очень важны&quot;,&quot;local&quot;:&quot;подсказки-для-llm-очень-важны&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Как обучаются LLM?&quot;,&quot;local&quot;:&quot;как-обучаются-llm&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Как я могу использовать LLM?&quot;,&quot;local&quot;:&quot;как-я-могу-использовать-llm&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2},{&quot;title&quot;:&quot;Как LLM используются в AI Агентах?&quot;,&quot;local&quot;:&quot;как-llm-используются-в-ai-агентах&quot;,&quot;sections&quot;:[],&quot;depth&quot;:2}],&quot;depth&quot;:1}"><!-- HEAD_svelte-u9bgzb_END --> <p></p> <h1 class="relative group"><a id="что-такое-llm" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#что-такое-llm"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Что такое LLM?</span></h1> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/whiteboard-check-1.jpg" alt="Unit 1 planning"> <p data-svelte-h="svelte-2pnibh">В предыдущем разделе мы узнали, что каждый агент нуждается в <strong>AI Модели как в ядре</strong>, и что LLM являются наиболее распространенным типом AI моделей использующихся для этой цели.</p> <p data-svelte-h="svelte-36bzke">Теперь мы узнаем, что такое LLM и как они наделяют агентов мощью.</p> <p data-svelte-h="svelte-1ut0xy4">В этом разделе представлено краткое техническое объяснение использования LLM. Если вы хотите погрузиться глубже, вы можете ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по Обработке Естественного Языка (Natural Language Processing).</a>.</p> <h2 class="relative group"><a id="-что-такое-большая-языковая-модель" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#-что-такое-большая-языковая-модель"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>## Что такое Большая Языковая Модель?</span></h2> <p data-svelte-h="svelte-1933cpz">Большая Языковая Модель (Large Language Model, LLM) - это тип AI модели, которая превосходно работает с <strong>пониманием и генерированием человеческого языка</strong>. Они обучаются на огромных объемах текстовых данных, что позволяет им изучать шаблоны, структуру и даже нюансы языка. Эти модели обычно состоят из многих миллионов параметров.</p> <p data-svelte-h="svelte-16y0emv">Большинство LLM в настоящее время <strong>построены на архитектуре Transformer</strong> - архитектуре глубокого обучения, основанной на алгоритме «Внимания» («Attention» algorithm), который стал вызывать значительный интерес после выхода BERT от Google в 2018 году.</p> <figure data-svelte-h="svelte-1dmbz6h"><img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/transformer.jpg" alt="Transformer"> <figcaption>Оригинальная архитектура трансформера выглядела следующим образом: слева располагался кодер, справа - декодер.</figcaption></figure> <p data-svelte-h="svelte-1fxrro0">Существует 3 типа трансформеров:</p> <ol data-svelte-h="svelte-1b1u6nt"><li><p><strong>Энкодеры (кодеры)</strong><br>
Трансформер на основе кодировщика принимает на вход текст (или другие данные) и выдает плотное векторное представление (или эмбеддинг) этого текста.</p> <ul><li><strong>Пример</strong>: BERT от Google</li> <li><strong>Примеры использования</strong>: классификация текста, семантический поиск, Распознавание Именованных Сущностей (Named Entity Recognition, NER)</li> <li><strong>Типичный размер</strong>: миллионы параметров</li></ul></li> <li><p><strong>Декодеры</strong>.<br>
Трансформер на основе декодера фокусируется <strong>на генерации новых токенов для завершения последовательности, по одному токену за раз</strong>.</p> <ul><li><strong>Пример</strong>: Llama из Meta</li> <li><strong>Примеры использования</strong>: Генерация текста, чат-боты, генерация кода</li> <li><strong>Типичный размер</strong>: Миллиарды (в американском понимании, т.е. 10^9) параметров</li></ul></li> <li><p><strong>Seq2Seq (энкодер-декодер)</strong>.<br>
Трансформер преобразующие последовательности в последовательность (sequence-to-sequence) объединяет в себе энкодер и декодер. Сначала энкодер преобразует входную последовательность в контекстное представление, а затем декодер генерирует выходную последовательность.</p> <ul><li><strong>Пример</strong>: T5, BART</li> <li><strong>Примеры использования</strong>: Перевод, обобщение, перефразирование.</li> <li><strong>Типичный размер</strong>: Миллионы параметров</li></ul></li></ol> <p data-svelte-h="svelte-7mjybc">Хотя Большие Языковые Модели (Large Language Model) бывают разных форм, LLM обычно представляют собой модели на основе декодера с миллиардами параметров. Вот некоторые из наиболее известных LLM:</p> <table data-svelte-h="svelte-19v7rkw"><thead><tr><th><strong>Модель</strong></th> <th><strong>Провайдер</strong></th></tr></thead> <tbody><tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td></tr> <tr><td><strong>GPT4</strong></td> <td>OpenAI</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td></tr> <tr><td><strong>Mistral</strong></td> <td>Mistral</td></tr></tbody></table> <p data-svelte-h="svelte-12f9l17">Принцип, лежащий в основе LLM, прост, но очень эффективен: <strong>его цель - предсказать следующий токен, учитывая последовательность предыдущих токенов</strong>. “Токен” - это единица информации, с которой работает LLM. Вы можете воспринимать “токен” как “слово”, но по соображениям эффективности LLM не используют целые слова.</p> <p data-svelte-h="svelte-1qxciym">Например, если в английском языке насчитывается около 600 000 слов, то в LLM может быть около 32 000 токенов (как в случае с Llama 2). Токенизация часто работает по подсловам, которые можно комбинировать.</p> <p data-svelte-h="svelte-109ri7d">Например, рассмотрим, как токены “interest” и “ing” могут быть объединены в слово “interesting”, или “ed” может быть добавлено в слово “interested”.</p> <p data-svelte-h="svelte-1f74eyz">Вы можете поэкспериментировать с различными токенами в интерактивной демонстрации ниже:</p> <iframe src="https://agents-course-the-tokenizer-playground.static.hf.space" frameborder="0" width="850" height="450"></iframe> <p data-svelte-h="svelte-rx2tcv">Каждая LLM имеет несколько <strong>специальных токенов</strong>, специфичных для данной модели. LLM использует эти токены для открытия и закрытия структурированных компонентов своей генерации. Например, чтобы указать начало или конец последовательности, сообщения или ответа. Кроме того, инструкции для ввода (input prompts), которые мы передаем модели, также структурированы с помощью специальных токенов. Наиболее важным из них является токен <strong>Конец последовательности</strong> (EOS).</p> <p data-svelte-h="svelte-ildqzg">Формы специальных токенов у разных провайдеров моделей весьма разнообразны.</p> <p data-svelte-h="svelte-rjpjzr">Таблица ниже иллюстрирует разнообразие специальных токенов.</p> <table data-svelte-h="svelte-oa6538"><thead><tr><th><strong>Model</strong></th> <th><strong>Provider</strong></th> <th><strong>EOS Token</strong></th> <th><strong>Functionality</strong></th></tr></thead> <tbody><tr><td><strong>GPT4</strong></td> <td>OpenAI</td> <td><code>&lt;|endoftext|&gt;</code></td> <td>End of message text</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td> <td><code>&lt;|eot_id|&gt;</code></td> <td>End of sequence</td></tr> <tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td> <td><code>&lt;|end_of_sentence|&gt;</code></td> <td>End of message text</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td> <td><code>&lt;|im_end|&gt;</code></td> <td>End of instruction or message</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td> <td><code>&lt;end_of_turn&gt;</code></td> <td>End of conversation turn</td></tr></tbody></table> <div class="course-tip bg-gradient-to-br dark:bg-gradient-to-r before:border-green-500 dark:before:border-green-800 from-green-50 dark:from-gray-900 to-white dark:to-gray-950 border border-green-50 text-green-700 dark:text-gray-400"><p data-svelte-h="svelte-1fgyux1">Мы не ожидаем, что вы запомните эти специальные токены, но важно оценить их разнообразие и роль, которую они играют в генерации текста LLM. Если вы хотите узнать больше о специальных токенах, вы можете посмотреть конфигурацию модели в ее репозитории на Hugging Face Hub. Например, вы можете найти специальные токены модели SmolLM2 в ее <a href="https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct/blob/main/tokenizer_config.json">tokenizer_config.json</a>.</p></div> <h2 class="relative group"><a id="понимание-предсказания-следующего-токена" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#понимание-предсказания-следующего-токена"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Понимание предсказания следующего токена.</span></h2> <p data-svelte-h="svelte-aplhxy">Считается, что LLM - это <strong>авторегрессия</strong>, то есть <strong>выход одного прохода становится входом для следующего</strong>. Этот цикл продолжается до тех пор, пока модель не предскажет, что следующим токеном будет токен EOS, на котором модель может остановиться.</p> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AutoregressionSchema.gif" alt="Визуализация процесса авторегрессионного декодирования" width="60%"> <p data-svelte-h="svelte-13xsflf">Другими словами, LLM будет декодировать текст до тех пор, пока он не достигнет EOS. Но что происходит во время одного цикла декодирования?</p> <p data-svelte-h="svelte-x3zaun">Хотя полное описание процесса может быть довольно техническим для целей изучения агентов, вот краткий обзор:</p> <ul data-svelte-h="svelte-gf8zn1"><li>После того как входной текст <strong>токинизирован</strong>, модель вычисляет представление последовательности, которое содержит информацию о значении и положении каждого токена во входной последовательности.</li> <li>Это представление поступает в модель, которая возвращает оценки, оценивающие вероятность для каждого токена из ее словаря быть следующим в последовательности.</li></ul> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/DecodingFinal.gif" alt="Визуализация процесса декодирования" width="60%"> <p data-svelte-h="svelte-1eqrprl">Основываясь на этих оценках, у нас есть несколько стратегий выбора токенов для завершения предложения.</p> <ul data-svelte-h="svelte-1nset1j"><li>Самой простой стратегией декодирования будет всегда брать токен с максимальным количеством баллов.</li></ul> <p data-svelte-h="svelte-si064d">Вы можете самостоятельно взаимодействовать с процессом декодирования с помощью SmolLM2 в этом Пространстве (помните, что она декодирует до достижения токена <strong>EOS</strong>, которым является <strong>&lt;|im_end|&gt;</strong> для этой модели):</p> <iframe src="https://agents-course-decoding-visualizer.hf.space" frameborder="0" width="850" height="450"></iframe> <ul data-svelte-h="svelte-1ppak22"><li>Но есть и более продвинутые стратегии декодирования. Например, <em>лучевой поиск (beam search)</em> исследует несколько последовательностей-кандидатов, чтобы найти ту, которая имеет максимальную общую оценку - даже если некоторые отдельные токены имеют более низкие оценки.</li></ul> <iframe src="https://agents-course-beam-search-visualizer.hf.space" frameborder="0" width="850" height="450"></iframe> <p data-svelte-h="svelte-1jp055l">Если вы хотите узнать больше о декодировании, вы можете изучить <a href="https://huggingface.co/learn/nlp-course" rel="nofollow">курс по NLP</a>.</p> <h2 class="relative group"><a id="внимание---это-все-что-вам-нужно" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#внимание---это-все-что-вам-нужно"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Внимание - это все, что вам нужно</span></h2> <p data-svelte-h="svelte-ef367h">Ключевым аспектом архитектуры трансформера является <strong>Внимание (Attention)</strong>. При предсказании следующего слова,
не все слова в предложении одинаково важны; такие слова, как “France” и “capital” в предложении <em>“The capital of France is …”</em>, несут наибольшую смысловую нагрузку.</p> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AttentionSceneFinal.gif" alt="Визуализация механизма Внимания" width="60%">
Этот процесс определения наиболее релевантных слов для предсказания следующего токена оказался невероятно эффективным.
<p data-svelte-h="svelte-f4yvjz">Хотя основной принцип работы LLM - предсказание следующего токена - остается неизменным со времен GPT-2, были достигнуты значительные успехи в масштабировании нейронных сетей и обеспечении работы механизма внимания для все более длинных последовательностей.</p> <p data-svelte-h="svelte-ysq1n8">Если вы взаимодействовали с LLM, вы, вероятно, знакомы с термином <em>длина контекста (context length)</em>, который обозначает максимальное количество токенов, которые может обработать LLM, и максимальную <em>продолжительность внимания (attention span)</em>, которой она обладает.</p> <h2 class="relative group"><a id="подсказки-для-llm-очень-важны" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#подсказки-для-llm-очень-важны"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Подсказки для LLM очень важны</span></h2> <p data-svelte-h="svelte-ifrxro">Учитывая, что единственная задача LLM - предсказать следующий токен, просматривая каждый входной токен, и выбрать “важные” токены, формулировка вашей входной последовательности очень важна.</p> <p data-svelte-h="svelte-16598tm">Входная последовательность, которую вы передаете LLM, называется <em>подсказкой (prompt)</em>. Тщательное проектирование подсказки облегчает <strong>направление генерации LLM к желаемому результату</strong>.</p> <h2 class="relative group"><a id="как-обучаются-llm" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#как-обучаются-llm"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Как обучаются LLM?</span></h2> <p data-svelte-h="svelte-18lovr6">Модели LLM обучаются на больших массивах данных текста, где они учатся предсказывать следующее слово в последовательности с помощью самообучения (self-supervised) или маскированного языкового моделирования (masked language modeling).</p> <p data-svelte-h="svelte-1ihfc49">В результате такого обучения без учителя модель изучает структуру языка и <strong>основные закономерности в тексте, что позволяет модели обобщать ранее не встречавшиеся данные</strong>.</p> <p data-svelte-h="svelte-10a222u">После такого начального <em>предварительного</em> обучения LLM могут быть дообучены для выполнения конкретных задач методами обучения с учителем. Например, некоторые модели обучаются разговорным структурам или использованию инструментов, в то время как другие сосредоточены на классификации или генерации кода.</p> <h2 class="relative group"><a id="как-я-могу-использовать-llm" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#как-я-могу-использовать-llm"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Как я могу использовать LLM?</span></h2> <p data-svelte-h="svelte-m67wga">У вас есть два основных варианта:</p> <ol data-svelte-h="svelte-awaolz"><li><p><strong>Запустить локально</strong> (если у вас достаточно аппаратных ресурсов).</p></li> <li><p><strong>Использовать облако/API</strong> (например, через Hugging Face Serverless Inference API).</p></li></ol> <p data-svelte-h="svelte-3vnptw">На протяжении всего курса мы будем использовать модели через API на Hugging Face Hub. Позже мы изучим, как запустить эти модели локально на вашем оборудовании.</p> <h2 class="relative group"><a id="как-llm-используются-в-ai-агентах" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#как-llm-используются-в-ai-агентах"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Как LLM используются в AI Агентах?</span></h2> <p data-svelte-h="svelte-1bc9i6a">LLM являются ключевым компонентом агентов искусственного интеллекта, <strong>обеспечивая основу для понимания и генерации человеческого языка</strong>.</p> <p data-svelte-h="svelte-1nxy5cq">Они могут интерпретировать инструкции пользователя, поддерживать контекст в разговоре, определять план и решать, какие инструменты использовать.</p> <p data-svelte-h="svelte-l310f7">Мы рассмотрим эти шаги более подробно в данном Разделе, а пока вам нужно понять, что LLM - это <strong>мозг агента</strong>.</p> <hr> <p data-svelte-h="svelte-8j483l">Это был большой объем информации! Мы рассмотрели основы того, что такое LLM, как они функционируют и какова их роль в работе AI агентов.</p> <p data-svelte-h="svelte-4l2emu">Если вы хотите еще глубже погрузиться в увлекательный мир языковых моделей и обработки естественного языка, не поленитесь ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по NLP</a>.</p> <p data-svelte-h="svelte-1u3kfgf">Теперь, когда мы поняли, как работают LLM, пришло время увидеть <strong>как LLM структурируют свою генерацию в разговорном контексте</strong>.</p> <p data-svelte-h="svelte-eb2tat">Чтобы запустить <a href="https://huggingface.co/agents-course/notebooks/blob/main/unit1/dummy_agent_library.ipynb" target="_blank">этот блокнот</a>, <strong>вам понадобится токен Hugging Face</strong> который вы можете получить из <a href="https://hf.co/settings/tokens" target="_blank">https://hf.co/settings/tokens</a>.</p> <p data-svelte-h="svelte-1uprhni">Более подробную информацию о том, как запустить блокноты Jupyter, изучите <a href="https://huggingface.co/docs/hub/notebooks">Блокноты Jupyter на Hugging Face Hub</a>.</p> <p data-svelte-h="svelte-16sfyy7">Вам также необходимо запросить доступ к <a href="https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct" target="_blank">модели Meta Llama</a>.</p> <a class="!text-gray-400 !no-underline text-sm flex items-center not-prose mt-4" href="https://github.com/huggingface/agents-course/blob/main/units/ru-RU/unit1/what-are-llms.mdx" target="_blank"><span data-svelte-h="svelte-1kd6by1">&lt;</span> <span data-svelte-h="svelte-x0xyl0">&gt;</span> <span data-svelte-h="svelte-1dajgef"><span class="underline ml-1.5">Update</span> on GitHub</span></a> <p></p>
<script>
{
__sveltekit_1a0dws4 = {
assets: "/docs/agents-course/pr_545/ru-RU",
base: "/docs/agents-course/pr_545/ru-RU",
env: {}
};
const element = document.currentScript.parentElement;
const data = [null,null];
Promise.all([
import("/docs/agents-course/pr_545/ru-RU/_app/immutable/entry/start.592056c6.js"),
import("/docs/agents-course/pr_545/ru-RU/_app/immutable/entry/app.8fd36cf7.js")
]).then(([kit, app]) => {
kit.start(app, element, {
node_ids: [0, 27],
data,
form: null,
error: null
});
});
}
</script>

Xet Storage Details

Size:
37.8 kB
·
Xet hash:
229dae14ac9df86c2d4aa840e769a54baa1bce1480ea1d4200b87b0c1fd3ff7b

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.