Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / agents-course /pr_653 /ru-RU /unit1 /what-are-llms.html

rtrm

about 1 month ago

download

raw

39.9 kB

	<meta charset="utf-8" /><meta name="hf:doc:metadata" content="{"title":"Что такое LLM?","local":"что-такое-llm","sections":[{"title":"## Что такое Большая Языковая Модель?","local":"-что-такое-большая-языковая-модель","sections":[],"depth":2},{"title":"Понимание предсказания следующего токена.","local":"понимание-предсказания-следующего-токена","sections":[],"depth":2},{"title":"Внимание - это все, что вам нужно","local":"внимание---это-все-что-вам-нужно","sections":[],"depth":2},{"title":"Подсказки для LLM очень важны","local":"подсказки-для-llm-очень-важны","sections":[],"depth":2},{"title":"Как обучаются LLM?","local":"как-обучаются-llm","sections":[],"depth":2},{"title":"Как я могу использовать LLM?","local":"как-я-могу-использовать-llm","sections":[],"depth":2},{"title":"Как LLM используются в AI Агентах?","local":"как-llm-используются-в-ai-агентах","sections":[],"depth":2}],"depth":1}">
	<link href="/docs/agents-course/pr_653/ru-RU/_app/immutable/assets/0.e3b0c442.css" rel="modulepreload">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/entry/start.ad3c6024.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/scheduler.4048030c.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/singletons.067b028e.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/index.dd3f5310.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/paths.b8fec54d.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/entry/app.a5092b41.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/preload-helper.ff39e22b.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/index.b7616466.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/nodes/0.438267b3.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/each.e59479a4.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/nodes/27.98e6b3f1.js">
	<link rel="modulepreload" href="/docs/agents-course/pr_653/ru-RU/_app/immutable/chunks/MermaidChart.svelte_svelte_type_style_lang.881374c1.js"><!-- HEAD_svelte-u9bgzb_START --><meta name="hf:doc:metadata" content="{"title":"Что такое LLM?","local":"что-такое-llm","sections":[{"title":"## Что такое Большая Языковая Модель?","local":"-что-такое-большая-языковая-модель","sections":[],"depth":2},{"title":"Понимание предсказания следующего токена.","local":"понимание-предсказания-следующего-токена","sections":[],"depth":2},{"title":"Внимание - это все, что вам нужно","local":"внимание---это-все-что-вам-нужно","sections":[],"depth":2},{"title":"Подсказки для LLM очень важны","local":"подсказки-для-llm-очень-важны","sections":[],"depth":2},{"title":"Как обучаются LLM?","local":"как-обучаются-llm","sections":[],"depth":2},{"title":"Как я могу использовать LLM?","local":"как-я-могу-использовать-llm","sections":[],"depth":2},{"title":"Как LLM используются в AI Агентах?","local":"как-llm-используются-в-ai-агентах","sections":[],"depth":2}],"depth":1}"><!-- HEAD_svelte-u9bgzb_END --> <p></p> <div class="items-center shrink-0 min-w-[100px] max-sm:min-w-[50px] justify-end ml-auto flex" style="float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"><div class="inline-flex rounded-md max-sm:rounded-sm"><button class="inline-flex items-center gap-1 h-7 max-sm:h-7 px-2 max-sm:px-1.5 text-sm font-medium text-gray-800 border border-r-0 rounded-l-md max-sm:rounded-l-sm border-gray-200 bg-white hover:shadow-inner dark:border-gray-850 dark:bg-gray-950 dark:text-gray-200 dark:hover:bg-gray-800" aria-live="polite"><span class="inline-flex items-center justify-center rounded-md p-0.5 max-sm:p-0 hover:text-gray-800 dark:hover:text-gray-200"><svg class="sm:size-3.5 size-3" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M28,10V28H10V10H28m0-2H10a2,2,0,0,0-2,2V28a2,2,0,0,0,2,2H28a2,2,0,0,0,2-2V10a2,2,0,0,0-2-2Z" transform="translate(0)"></path><path d="M4,18H2V4A2,2,0,0,1,4,2H18V4H4Z" transform="translate(0)"></path><rect fill="none" width="32" height="32"></rect></svg></span> <span>Copy page</span></button> <button class="inline-flex items-center justify-center w-6 max-sm:w-5 h-7 max-sm:h-7 disabled:pointer-events-none text-sm text-gray-500 hover:text-gray-700 dark:hover:text-white rounded-r-md max-sm:rounded-r-sm border border-l transition border-gray-200 bg-white hover:shadow-inner dark:border-gray-850 dark:bg-gray-950 dark:text-gray-200 dark:hover:bg-gray-800" aria-haspopup="menu" aria-expanded="false" aria-label="Open copy menu"><svg class="transition-transform text-gray-400 overflow-visible sm:size-3.5 size-3 rotate-0" width="1em" height="1em" viewBox="0 0 12 7" fill="none" xmlns="http://www.w3.org/2000/svg"><path d="M1 1L6 6L11 1" stroke="currentColor"></path></svg></button></div> </div> <h1 class="relative group"><a id="что-такое-llm" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#что-такое-llm"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Что такое LLM?</span></h1> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/whiteboard-check-1.jpg" alt="Unit 1 planning"> <p data-svelte-h="svelte-2pnibh">В предыдущем разделе мы узнали, что каждый агент нуждается в <strong>AI Модели как в ядре</strong>, и что LLM являются наиболее распространенным типом AI моделей использующихся для этой цели.</p> <p data-svelte-h="svelte-36bzke">Теперь мы узнаем, что такое LLM и как они наделяют агентов мощью.</p> <p data-svelte-h="svelte-1ut0xy4">В этом разделе представлено краткое техническое объяснение использования LLM. Если вы хотите погрузиться глубже, вы можете ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по Обработке Естественного Языка (Natural Language Processing).</a>.</p> <h2 class="relative group"><a id="-что-такое-большая-языковая-модель" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#-что-такое-большая-языковая-модель"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>## Что такое Большая Языковая Модель?</span></h2> <p data-svelte-h="svelte-1933cpz">Большая Языковая Модель (Large Language Model, LLM) - это тип AI модели, которая превосходно работает с <strong>пониманием и генерированием человеческого языка</strong>. Они обучаются на огромных объемах текстовых данных, что позволяет им изучать шаблоны, структуру и даже нюансы языка. Эти модели обычно состоят из многих миллионов параметров.</p> <p data-svelte-h="svelte-16y0emv">Большинство LLM в настоящее время <strong>построены на архитектуре Transformer</strong> - архитектуре глубокого обучения, основанной на алгоритме «Внимания» («Attention» algorithm), который стал вызывать значительный интерес после выхода BERT от Google в 2018 году.</p> <figure data-svelte-h="svelte-1dmbz6h"><img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/transformer.jpg" alt="Transformer"> <figcaption>Оригинальная архитектура трансформера выглядела следующим образом: слева располагался кодер, справа - декодер.</figcaption></figure> <p data-svelte-h="svelte-1fxrro0">Существует 3 типа трансформеров:</p> <ol data-svelte-h="svelte-1b1u6nt"><li><p><strong>Энкодеры (кодеры)</strong><br>
	Трансформер на основе кодировщика принимает на вход текст (или другие данные) и выдает плотное векторное представление (или эмбеддинг) этого текста.</p> <ul><li><strong>Пример</strong>: BERT от Google</li> <li><strong>Примеры использования</strong>: классификация текста, семантический поиск, Распознавание Именованных Сущностей (Named Entity Recognition, NER)</li> <li><strong>Типичный размер</strong>: миллионы параметров</li></ul></li> <li><p><strong>Декодеры</strong>.<br>
	Трансформер на основе декодера фокусируется <strong>на генерации новых токенов для завершения последовательности, по одному токену за раз</strong>.</p> <ul><li><strong>Пример</strong>: Llama из Meta</li> <li><strong>Примеры использования</strong>: Генерация текста, чат-боты, генерация кода</li> <li><strong>Типичный размер</strong>: Миллиарды (в американском понимании, т.е. 10^9) параметров</li></ul></li> <li><p><strong>Seq2Seq (энкодер-декодер)</strong>.<br>
	Трансформер преобразующие последовательности в последовательность (sequence-to-sequence) объединяет в себе энкодер и декодер. Сначала энкодер преобразует входную последовательность в контекстное представление, а затем декодер генерирует выходную последовательность.</p> <ul><li><strong>Пример</strong>: T5, BART</li> <li><strong>Примеры использования</strong>: Перевод, обобщение, перефразирование.</li> <li><strong>Типичный размер</strong>: Миллионы параметров</li></ul></li></ol> <p data-svelte-h="svelte-7mjybc">Хотя Большие Языковые Модели (Large Language Model) бывают разных форм, LLM обычно представляют собой модели на основе декодера с миллиардами параметров. Вот некоторые из наиболее известных LLM:</p> <table data-svelte-h="svelte-19v7rkw"><thead><tr><th><strong>Модель</strong></th> <th><strong>Провайдер</strong></th></tr></thead> <tbody><tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td></tr> <tr><td><strong>GPT4</strong></td> <td>OpenAI</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td></tr> <tr><td><strong>Mistral</strong></td> <td>Mistral</td></tr></tbody></table> <p data-svelte-h="svelte-12f9l17">Принцип, лежащий в основе LLM, прост, но очень эффективен: <strong>его цель - предсказать следующий токен, учитывая последовательность предыдущих токенов</strong>. “Токен” - это единица информации, с которой работает LLM. Вы можете воспринимать “токен” как “слово”, но по соображениям эффективности LLM не используют целые слова.</p> <p data-svelte-h="svelte-1qxciym">Например, если в английском языке насчитывается около 600 000 слов, то в LLM может быть около 32 000 токенов (как в случае с Llama 2). Токенизация часто работает по подсловам, которые можно комбинировать.</p> <p data-svelte-h="svelte-109ri7d">Например, рассмотрим, как токены “interest” и “ing” могут быть объединены в слово “interesting”, или “ed” может быть добавлено в слово “interested”.</p> <p data-svelte-h="svelte-1f74eyz">Вы можете поэкспериментировать с различными токенами в интерактивной демонстрации ниже:</p> <iframe src="https://agents-course-the-tokenizer-playground.static.hf.space" frameborder="0" width="850" height="450"></iframe> <p data-svelte-h="svelte-rx2tcv">Каждая LLM имеет несколько <strong>специальных токенов</strong>, специфичных для данной модели. LLM использует эти токены для открытия и закрытия структурированных компонентов своей генерации. Например, чтобы указать начало или конец последовательности, сообщения или ответа. Кроме того, инструкции для ввода (input prompts), которые мы передаем модели, также структурированы с помощью специальных токенов. Наиболее важным из них является токен <strong>Конец последовательности</strong> (EOS).</p> <p data-svelte-h="svelte-ildqzg">Формы специальных токенов у разных провайдеров моделей весьма разнообразны.</p> <p data-svelte-h="svelte-rjpjzr">Таблица ниже иллюстрирует разнообразие специальных токенов.</p> <table data-svelte-h="svelte-oa6538"><thead><tr><th><strong>Model</strong></th> <th><strong>Provider</strong></th> <th><strong>EOS Token</strong></th> <th><strong>Functionality</strong></th></tr></thead> <tbody><tr><td><strong>GPT4</strong></td> <td>OpenAI</td> <td><code><\|endoftext\|></code></td> <td>End of message text</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td> <td><code><\|eot_id\|></code></td> <td>End of sequence</td></tr> <tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td> <td><code><\|end_of_sentence\|></code></td> <td>End of message text</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td> <td><code><\|im_end\|></code></td> <td>End of instruction or message</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td> <td><code><end_of_turn></code></td> <td>End of conversation turn</td></tr></tbody></table> <blockquote class="tip" data-svelte-h="svelte-1aw9swu"><p>Мы не ожидаем, что вы запомните эти специальные токены, но важно оценить их разнообразие и роль, которую они играют в генерации текста LLM. Если вы хотите узнать больше о специальных токенах, вы можете посмотреть конфигурацию модели в ее репозитории на Hugging Face Hub. Например, вы можете найти специальные токены модели SmolLM2 в ее <a href="https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct/blob/main/tokenizer_config.json">tokenizer_config.json</a>.</p></blockquote> <h2 class="relative group"><a id="понимание-предсказания-следующего-токена" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#понимание-предсказания-следующего-токена"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Понимание предсказания следующего токена.</span></h2> <p data-svelte-h="svelte-aplhxy">Считается, что LLM - это <strong>авторегрессия</strong>, то есть <strong>выход одного прохода становится входом для следующего</strong>. Этот цикл продолжается до тех пор, пока модель не предскажет, что следующим токеном будет токен EOS, на котором модель может остановиться.</p> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AutoregressionSchema.gif" alt="Визуализация процесса авторегрессионного декодирования" width="60%"> <p data-svelte-h="svelte-13xsflf">Другими словами, LLM будет декодировать текст до тех пор, пока он не достигнет EOS. Но что происходит во время одного цикла декодирования?</p> <p data-svelte-h="svelte-x3zaun">Хотя полное описание процесса может быть довольно техническим для целей изучения агентов, вот краткий обзор:</p> <ul data-svelte-h="svelte-gf8zn1"><li>После того как входной текст <strong>токинизирован</strong>, модель вычисляет представление последовательности, которое содержит информацию о значении и положении каждого токена во входной последовательности.</li> <li>Это представление поступает в модель, которая возвращает оценки, оценивающие вероятность для каждого токена из ее словаря быть следующим в последовательности.</li></ul> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/DecodingFinal.gif" alt="Визуализация процесса декодирования" width="60%"> <p data-svelte-h="svelte-1eqrprl">Основываясь на этих оценках, у нас есть несколько стратегий выбора токенов для завершения предложения.</p> <ul data-svelte-h="svelte-1nset1j"><li>Самой простой стратегией декодирования будет всегда брать токен с максимальным количеством баллов.</li></ul> <p data-svelte-h="svelte-si064d">Вы можете самостоятельно взаимодействовать с процессом декодирования с помощью SmolLM2 в этом Пространстве (помните, что она декодирует до достижения токена <strong>EOS</strong>, которым является <strong><\|im_end\|></strong> для этой модели):</p> <iframe src="https://agents-course-decoding-visualizer.hf.space" frameborder="0" width="850" height="450"></iframe> <ul data-svelte-h="svelte-1ppak22"><li>Но есть и более продвинутые стратегии декодирования. Например, <em>лучевой поиск (beam search)</em> исследует несколько последовательностей-кандидатов, чтобы найти ту, которая имеет максимальную общую оценку - даже если некоторые отдельные токены имеют более низкие оценки.</li></ul> <iframe src="https://agents-course-beam-search-visualizer.hf.space" frameborder="0" width="850" height="450"></iframe> <p data-svelte-h="svelte-1jp055l">Если вы хотите узнать больше о декодировании, вы можете изучить <a href="https://huggingface.co/learn/nlp-course" rel="nofollow">курс по NLP</a>.</p> <h2 class="relative group"><a id="внимание---это-все-что-вам-нужно" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#внимание---это-все-что-вам-нужно"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Внимание - это все, что вам нужно</span></h2> <p data-svelte-h="svelte-ef367h">Ключевым аспектом архитектуры трансформера является <strong>Внимание (Attention)</strong>. При предсказании следующего слова,
	не все слова в предложении одинаково важны; такие слова, как “France” и “capital” в предложении <em>“The capital of France is …”</em>, несут наибольшую смысловую нагрузку.</p> <img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AttentionSceneFinal.gif" alt="Визуализация механизма Внимания" width="60%">
	Этот процесс определения наиболее релевантных слов для предсказания следующего токена оказался невероятно эффективным.
	<p data-svelte-h="svelte-f4yvjz">Хотя основной принцип работы LLM - предсказание следующего токена - остается неизменным со времен GPT-2, были достигнуты значительные успехи в масштабировании нейронных сетей и обеспечении работы механизма внимания для все более длинных последовательностей.</p> <p data-svelte-h="svelte-ysq1n8">Если вы взаимодействовали с LLM, вы, вероятно, знакомы с термином <em>длина контекста (context length)</em>, который обозначает максимальное количество токенов, которые может обработать LLM, и максимальную <em>продолжительность внимания (attention span)</em>, которой она обладает.</p> <h2 class="relative group"><a id="подсказки-для-llm-очень-важны" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#подсказки-для-llm-очень-важны"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Подсказки для LLM очень важны</span></h2> <p data-svelte-h="svelte-ifrxro">Учитывая, что единственная задача LLM - предсказать следующий токен, просматривая каждый входной токен, и выбрать “важные” токены, формулировка вашей входной последовательности очень важна.</p> <p data-svelte-h="svelte-16598tm">Входная последовательность, которую вы передаете LLM, называется <em>подсказкой (prompt)</em>. Тщательное проектирование подсказки облегчает <strong>направление генерации LLM к желаемому результату</strong>.</p> <h2 class="relative group"><a id="как-обучаются-llm" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#как-обучаются-llm"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Как обучаются LLM?</span></h2> <p data-svelte-h="svelte-18lovr6">Модели LLM обучаются на больших массивах данных текста, где они учатся предсказывать следующее слово в последовательности с помощью самообучения (self-supervised) или маскированного языкового моделирования (masked language modeling).</p> <p data-svelte-h="svelte-1ihfc49">В результате такого обучения без учителя модель изучает структуру языка и <strong>основные закономерности в тексте, что позволяет модели обобщать ранее не встречавшиеся данные</strong>.</p> <p data-svelte-h="svelte-10a222u">После такого начального <em>предварительного</em> обучения LLM могут быть дообучены для выполнения конкретных задач методами обучения с учителем. Например, некоторые модели обучаются разговорным структурам или использованию инструментов, в то время как другие сосредоточены на классификации или генерации кода.</p> <h2 class="relative group"><a id="как-я-могу-использовать-llm" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#как-я-могу-использовать-llm"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Как я могу использовать LLM?</span></h2> <p data-svelte-h="svelte-m67wga">У вас есть два основных варианта:</p> <ol data-svelte-h="svelte-awaolz"><li><p><strong>Запустить локально</strong> (если у вас достаточно аппаратных ресурсов).</p></li> <li><p><strong>Использовать облако/API</strong> (например, через Hugging Face Serverless Inference API).</p></li></ol> <p data-svelte-h="svelte-3vnptw">На протяжении всего курса мы будем использовать модели через API на Hugging Face Hub. Позже мы изучим, как запустить эти модели локально на вашем оборудовании.</p> <h2 class="relative group"><a id="как-llm-используются-в-ai-агентах" class="header-link block pr-1.5 text-lg no-hover:hidden with-hover:absolute with-hover:p-1.5 with-hover:opacity-0 with-hover:group-hover:opacity-100 with-hover:right-full" href="#как-llm-используются-в-ai-агентах"><span><svg class="" xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" aria-hidden="true" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 256 256"><path d="M167.594 88.393a8.001 8.001 0 0 1 0 11.314l-67.882 67.882a8 8 0 1 1-11.314-11.315l67.882-67.881a8.003 8.003 0 0 1 11.314 0zm-28.287 84.86l-28.284 28.284a40 40 0 0 1-56.567-56.567l28.284-28.284a8 8 0 0 0-11.315-11.315l-28.284 28.284a56 56 0 0 0 79.196 79.197l28.285-28.285a8 8 0 1 0-11.315-11.314zM212.852 43.14a56.002 56.002 0 0 0-79.196 0l-28.284 28.284a8 8 0 1 0 11.314 11.314l28.284-28.284a40 40 0 0 1 56.568 56.567l-28.285 28.285a8 8 0 0 0 11.315 11.314l28.284-28.284a56.065 56.065 0 0 0 0-79.196z" fill="currentColor"></path></svg></span></a> <span>Как LLM используются в AI Агентах?</span></h2> <p data-svelte-h="svelte-1bc9i6a">LLM являются ключевым компонентом агентов искусственного интеллекта, <strong>обеспечивая основу для понимания и генерации человеческого языка</strong>.</p> <p data-svelte-h="svelte-1nxy5cq">Они могут интерпретировать инструкции пользователя, поддерживать контекст в разговоре, определять план и решать, какие инструменты использовать.</p> <p data-svelte-h="svelte-l310f7">Мы рассмотрим эти шаги более подробно в данном Разделе, а пока вам нужно понять, что LLM - это <strong>мозг агента</strong>.</p> <hr> <p data-svelte-h="svelte-8j483l">Это был большой объем информации! Мы рассмотрели основы того, что такое LLM, как они функционируют и какова их роль в работе AI агентов.</p> <p data-svelte-h="svelte-4l2emu">Если вы хотите еще глубже погрузиться в увлекательный мир языковых моделей и обработки естественного языка, не поленитесь ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по NLP</a>.</p> <p data-svelte-h="svelte-1u3kfgf">Теперь, когда мы поняли, как работают LLM, пришло время увидеть <strong>как LLM структурируют свою генерацию в разговорном контексте</strong>.</p> <p data-svelte-h="svelte-eb2tat">Чтобы запустить <a href="https://huggingface.co/agents-course/notebooks/blob/main/unit1/dummy_agent_library.ipynb" target="_blank">этот блокнот</a>, <strong>вам понадобится токен Hugging Face</strong> который вы можете получить из <a href="https://hf.co/settings/tokens" target="_blank">https://hf.co/settings/tokens</a>.</p> <p data-svelte-h="svelte-1uprhni">Более подробную информацию о том, как запустить блокноты Jupyter, изучите <a href="https://huggingface.co/docs/hub/notebooks">Блокноты Jupyter на Hugging Face Hub</a>.</p> <p data-svelte-h="svelte-16sfyy7">Вам также необходимо запросить доступ к <a href="https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct" target="_blank">модели Meta Llama</a>.</p> <a class="!text-gray-400 !no-underline text-sm flex items-center not-prose mt-4" href="https://github.com/huggingface/agents-course/blob/main/units/ru-RU/unit1/what-are-llms.mdx" target="_blank"><svg class="mr-1" xmlns="http://www.w3.org/2000/svg" aria-hidden="true" fill="currentColor" focusable="false" role="img" width="1em" height="1em" preserveAspectRatio="xMidYMid meet" viewBox="0 0 32 32"><path d="M31,16l-7,7l-1.41-1.41L28.17,16l-5.58-5.59L24,9l7,7z"></path><path d="M1,16l7-7l1.41,1.41L3.83,16l5.58,5.59L8,23l-7-7z"></path><path d="M12.419,25.484L17.639,6.552l1.932,0.518L14.351,26.002z"></path></svg> <span data-svelte-h="svelte-zjs2n5"><span class="underline">Update</span> on GitHub</span></a> <p></p>

	<script>
	{
	__sveltekit_118jisx = {
	assets: "/docs/agents-course/pr_653/ru-RU",
	base: "/docs/agents-course/pr_653/ru-RU",
	env: {}
	};

	const element = document.currentScript.parentElement;

	const data = [null,null];

	Promise.all([
	import("/docs/agents-course/pr_653/ru-RU/_app/immutable/entry/start.ad3c6024.js"),
	import("/docs/agents-course/pr_653/ru-RU/_app/immutable/entry/app.a5092b41.js")
	]).then(([kit, app]) => {
	kit.start(app, element, {
	node_ids: [0, 27],
	data,
	form: null,
	error: null
	});
	});
	}
	</script>

Xet Storage Details

Size:: 39.9 kB
Xet hash:: 0580f5175bafa847e240962533436a79df2e77b1b929033a635350bd80c58dcd

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.