Buckets:

HuggingFaceDocBuilder's picture
download
raw
34.5 kB
import{s as Xl,a as yt,n as Yl,o as Zl}from"../chunks/scheduler.4048030c.js";import{S as tn,i as en,e as r,s as i,c as L,q as ln,h as nn,a as p,d as l,b as s,f as At,g as o,j as u,r as sn,k as f,l as rn,m as n,n as M,t as v,o as x,p as _}from"../chunks/index.b7616466.js";import{C as pn,H as h,E as un}from"../chunks/MermaidChart.svelte_svelte_type_style_lang.0413ada1.js";function fn(Ve){let d,It,Et,St,b,Ft,P,zt,c,We,Rt,w,Xe="В предыдущем разделе мы узнали, что каждый агент нуждается в <strong>AI Модели как в ядре</strong>, и что LLM являются наиболее распространенным типом AI моделей использующихся для этой цели.",qt,y,Ye="Теперь мы узнаем, что такое LLM и как они наделяют агентов мощью.",Gt,E,Ze='В этом разделе представлено краткое техническое объяснение использования LLM. Если вы хотите погрузиться глубже, вы можете ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по Обработке Естественного Языка (Natural Language Processing).</a>.',jt,k,Ot,A,tl="Большая Языковая Модель (Large Language Model, LLM) - это тип AI модели, которая превосходно работает с <strong>пониманием и генерированием человеческого языка</strong>. Они обучаются на огромных объемах текстовых данных, что позволяет им изучать шаблоны, структуру и даже нюансы языка. Эти модели обычно состоят из многих миллионов параметров.",Bt,I,el="Большинство LLM в настоящее время <strong>построены на архитектуре Transformer</strong> - архитектуре глубокого обучения, основанной на алгоритме «Внимания» («Attention» algorithm), который стал вызывать значительный интерес после выхода BERT от Google в 2018 году.",Ut,S,ll='<img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/transformer.jpg" alt="Transformer"/> <figcaption>Оригинальная архитектура трансформера выглядела следующим образом: слева располагался кодер, справа - декодер.</figcaption>',Dt,F,nl="Существует 3 типа трансформеров:",Nt,z,il=`<li><p><strong>Энкодеры (кодеры)</strong><br/>
Трансформер на основе кодировщика принимает на вход текст (или другие данные) и выдает плотное векторное представление (или эмбеддинг) этого текста.</p> <ul><li><strong>Пример</strong>: BERT от Google</li> <li><strong>Примеры использования</strong>: классификация текста, семантический поиск, Распознавание Именованных Сущностей (Named Entity Recognition, NER)</li> <li><strong>Типичный размер</strong>: миллионы параметров</li></ul></li> <li><p><strong>Декодеры</strong>.<br/>
Трансформер на основе декодера фокусируется <strong>на генерации новых токенов для завершения последовательности, по одному токену за раз</strong>.</p> <ul><li><strong>Пример</strong>: Llama из Meta</li> <li><strong>Примеры использования</strong>: Генерация текста, чат-боты, генерация кода</li> <li><strong>Типичный размер</strong>: Миллиарды (в американском понимании, т.е. 10^9) параметров</li></ul></li> <li><p><strong>Seq2Seq (энкодер-декодер)</strong>.<br/>
Трансформер преобразующие последовательности в последовательность (sequence-to-sequence) объединяет в себе энкодер и декодер. Сначала энкодер преобразует входную последовательность в контекстное представление, а затем декодер генерирует выходную последовательность.</p> <ul><li><strong>Пример</strong>: T5, BART</li> <li><strong>Примеры использования</strong>: Перевод, обобщение, перефразирование.</li> <li><strong>Типичный размер</strong>: Миллионы параметров</li></ul></li>`,Jt,R,sl="Хотя Большие Языковые Модели (Large Language Model) бывают разных форм, LLM обычно представляют собой модели на основе декодера с миллиардами параметров. Вот некоторые из наиболее известных LLM:",Kt,q,rl="<thead><tr><th><strong>Модель</strong></th> <th><strong>Провайдер</strong></th></tr></thead> <tbody><tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td></tr> <tr><td><strong>GPT4</strong></td> <td>OpenAI</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td></tr> <tr><td><strong>Mistral</strong></td> <td>Mistral</td></tr></tbody>",Qt,G,pl="Принцип, лежащий в основе LLM, прост, но очень эффективен: <strong>его цель - предсказать следующий токен, учитывая последовательность предыдущих токенов</strong>. “Токен” - это единица информации, с которой работает LLM. Вы можете воспринимать “токен” как “слово”, но по соображениям эффективности LLM не используют целые слова.",Vt,j,ul="Например, если в английском языке насчитывается около 600 000 слов, то в LLM может быть около 32 000 токенов (как в случае с Llama 2). Токенизация часто работает по подсловам, которые можно комбинировать.",Wt,O,fl="Например, рассмотрим, как токены “interest” и “ing” могут быть объединены в слово “interesting”, или “ed” может быть добавлено в слово “interested”.",Xt,B,al="Вы можете поэкспериментировать с различными токенами в интерактивной демонстрации ниже:",Yt,a,gl,Zt,U,ml="Каждая LLM имеет несколько <strong>специальных токенов</strong>, специфичных для данной модели. LLM использует эти токены для открытия и закрытия структурированных компонентов своей генерации. Например, чтобы указать начало или конец последовательности, сообщения или ответа. Кроме того, инструкции для ввода (input prompts), которые мы передаем модели, также структурированы с помощью специальных токенов. Наиболее важным из них является токен <strong>Конец последовательности</strong> (EOS).",te,D,Ll="Формы специальных токенов у разных провайдеров моделей весьма разнообразны.",ee,N,ol="Таблица ниже иллюстрирует разнообразие специальных токенов.",le,J,Ml="<thead><tr><th><strong>Model</strong></th> <th><strong>Provider</strong></th> <th><strong>EOS Token</strong></th> <th><strong>Functionality</strong></th></tr></thead> <tbody><tr><td><strong>GPT4</strong></td> <td>OpenAI</td> <td><code>&lt;|endoftext|&gt;</code></td> <td>End of message text</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td> <td><code>&lt;|eot_id|&gt;</code></td> <td>End of sequence</td></tr> <tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td> <td><code>&lt;|end_of_sentence|&gt;</code></td> <td>End of message text</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td> <td><code>&lt;|im_end|&gt;</code></td> <td>End of instruction or message</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td> <td><code>&lt;end_of_turn&gt;</code></td> <td>End of conversation turn</td></tr></tbody>",ne,C,vl='<p>Мы не ожидаем, что вы запомните эти специальные токены, но важно оценить их разнообразие и роль, которую они играют в генерации текста LLM. Если вы хотите узнать больше о специальных токенах, вы можете посмотреть конфигурацию модели в ее репозитории на Hugging Face Hub. Например, вы можете найти специальные токены модели SmolLM2 в ее <a href="https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct/blob/main/tokenizer_config.json">tokenizer_config.json</a>.</p>',ie,K,se,Q,xl="Считается, что LLM - это <strong>авторегрессия</strong>, то есть <strong>выход одного прохода становится входом для следующего</strong>. Этот цикл продолжается до тех пор, пока модель не предскажет, что следующим токеном будет токен EOS, на котором модель может остановиться.",re,T,_l,pe,V,dl="Другими словами, LLM будет декодировать текст до тех пор, пока он не достигнет EOS. Но что происходит во время одного цикла декодирования?",ue,W,Cl="Хотя полное описание процесса может быть довольно техническим для целей изучения агентов, вот краткий обзор:",fe,X,Tl="<li>После того как входной текст <strong>токинизирован</strong>, модель вычисляет представление последовательности, которое содержит информацию о значении и положении каждого токена во входной последовательности.</li> <li>Это представление поступает в модель, которая возвращает оценки, оценивающие вероятность для каждого токена из ее словаря быть следующим в последовательности.</li>",ae,$,$l,ge,Y,Hl="Основываясь на этих оценках, у нас есть несколько стратегий выбора токенов для завершения предложения.",me,Z,hl="<li>Самой простой стратегией декодирования будет всегда брать токен с максимальным количеством баллов.</li>",Le,tt,bl="Вы можете самостоятельно взаимодействовать с процессом декодирования с помощью SmolLM2 в этом Пространстве (помните, что она декодирует до достижения токена <strong>EOS</strong>, которым является <strong>&lt;|im_end|&gt;</strong> для этой модели):",oe,g,Pl,Me,et,cl="<li>Но есть и более продвинутые стратегии декодирования. Например, <em>лучевой поиск (beam search)</em> исследует несколько последовательностей-кандидатов, чтобы найти ту, которая имеет максимальную общую оценку - даже если некоторые отдельные токены имеют более низкие оценки.</li>",ve,m,wl,xe,lt,yl='Если вы хотите узнать больше о декодировании, вы можете изучить <a href="https://huggingface.co/learn/nlp-course" rel="nofollow">курс по NLP</a>.',_e,nt,de,it,El=`Ключевым аспектом архитектуры трансформера является <strong>Внимание (Attention)</strong>. При предсказании следующего слова,
не все слова в предложении одинаково важны; такие слова, как “France” и “capital” в предложении <em>“The capital of France is …”</em>, несут наибольшую смысловую нагрузку.`,Ce,H,kl,Te,st,Al="Хотя основной принцип работы LLM - предсказание следующего токена - остается неизменным со времен GPT-2, были достигнуты значительные успехи в масштабировании нейронных сетей и обеспечении работы механизма внимания для все более длинных последовательностей.",$e,rt,Il="Если вы взаимодействовали с LLM, вы, вероятно, знакомы с термином <em>длина контекста (context length)</em>, который обозначает максимальное количество токенов, которые может обработать LLM, и максимальную <em>продолжительность внимания (attention span)</em>, которой она обладает.",He,pt,he,ut,Sl="Учитывая, что единственная задача LLM - предсказать следующий токен, просматривая каждый входной токен, и выбрать “важные” токены, формулировка вашей входной последовательности очень важна.",be,ft,Fl="Входная последовательность, которую вы передаете LLM, называется <em>подсказкой (prompt)</em>. Тщательное проектирование подсказки облегчает <strong>направление генерации LLM к желаемому результату</strong>.",Pe,at,ce,gt,zl="Модели LLM обучаются на больших массивах данных текста, где они учатся предсказывать следующее слово в последовательности с помощью самообучения (self-supervised) или маскированного языкового моделирования (masked language modeling).",we,mt,Rl="В результате такого обучения без учителя модель изучает структуру языка и <strong>основные закономерности в тексте, что позволяет модели обобщать ранее не встречавшиеся данные</strong>.",ye,Lt,ql="После такого начального <em>предварительного</em> обучения LLM могут быть дообучены для выполнения конкретных задач методами обучения с учителем. Например, некоторые модели обучаются разговорным структурам или использованию инструментов, в то время как другие сосредоточены на классификации или генерации кода.",Ee,ot,ke,Mt,Gl="У вас есть два основных варианта:",Ae,vt,jl="<li><p><strong>Запустить локально</strong> (если у вас достаточно аппаратных ресурсов).</p></li> <li><p><strong>Использовать облако/API</strong> (например, через Hugging Face Serverless Inference API).</p></li>",Ie,xt,Ol="На протяжении всего курса мы будем использовать модели через API на Hugging Face Hub. Позже мы изучим, как запустить эти модели локально на вашем оборудовании.",Se,_t,Fe,dt,Bl="LLM являются ключевым компонентом агентов искусственного интеллекта, <strong>обеспечивая основу для понимания и генерации человеческого языка</strong>.",ze,Ct,Ul="Они могут интерпретировать инструкции пользователя, поддерживать контекст в разговоре, определять план и решать, какие инструменты использовать.",Re,Tt,Dl="Мы рассмотрим эти шаги более подробно в данном Разделе, а пока вам нужно понять, что LLM - это <strong>мозг агента</strong>.",qe,Ge,je,$t,Nl="Это был большой объем информации! Мы рассмотрели основы того, что такое LLM, как они функционируют и какова их роль в работе AI агентов.",Oe,Ht,Jl='Если вы хотите еще глубже погрузиться в увлекательный мир языковых моделей и обработки естественного языка, не поленитесь ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по NLP</a>.',Be,ht,Kl="Теперь, когда мы поняли, как работают LLM, пришло время увидеть <strong>как LLM структурируют свою генерацию в разговорном контексте</strong>.",Ue,bt,Ql='Чтобы запустить <a href="https://huggingface.co/agents-course/notebooks/blob/main/unit1/dummy_agent_library.ipynb" target="_blank">этот блокнот</a>, <strong>вам понадобится токен Hugging Face</strong> который вы можете получить из <a href="https://hf.co/settings/tokens" target="_blank">https://hf.co/settings/tokens</a>.',De,Pt,Vl='Более подробную информацию о том, как запустить блокноты Jupyter, изучите <a href="https://huggingface.co/docs/hub/notebooks">Блокноты Jupyter на Hugging Face Hub</a>.',Ne,ct,Wl='Вам также необходимо запросить доступ к <a href="https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct" target="_blank">модели Meta Llama</a>.',Je,wt,Ke,kt,Qe;return b=new pn({props:{containerStyle:"float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"}}),P=new h({props:{title:"Что такое LLM?",local:"что-такое-llm",headingTag:"h1"}}),k=new h({props:{title:"## Что такое Большая Языковая Модель?",local:"-что-такое-большая-языковая-модель",headingTag:"h2"}}),K=new h({props:{title:"Понимание предсказания следующего токена.",local:"понимание-предсказания-следующего-токена",headingTag:"h2"}}),nt=new h({props:{title:"Внимание - это все, что вам нужно",local:"внимание---это-все-что-вам-нужно",headingTag:"h2"}}),pt=new h({props:{title:"Подсказки для LLM очень важны",local:"подсказки-для-llm-очень-важны",headingTag:"h2"}}),at=new h({props:{title:"Как обучаются LLM?",local:"как-обучаются-llm",headingTag:"h2"}}),ot=new h({props:{title:"Как я могу использовать LLM?",local:"как-я-могу-использовать-llm",headingTag:"h2"}}),_t=new h({props:{title:"Как LLM используются в AI Агентах?",local:"как-llm-используются-в-ai-агентах",headingTag:"h2"}}),wt=new un({props:{source:"https://github.com/huggingface/agents-course/blob/main/units/ru-RU/unit1/what-are-llms.mdx"}}),{c(){d=r("meta"),It=i(),Et=r("p"),St=i(),L(b.$$.fragment),Ft=i(),L(P.$$.fragment),zt=i(),c=r("img"),Rt=i(),w=r("p"),w.innerHTML=Xe,qt=i(),y=r("p"),y.textContent=Ye,Gt=i(),E=r("p"),E.innerHTML=Ze,jt=i(),L(k.$$.fragment),Ot=i(),A=r("p"),A.innerHTML=tl,Bt=i(),I=r("p"),I.innerHTML=el,Ut=i(),S=r("figure"),S.innerHTML=ll,Dt=i(),F=r("p"),F.textContent=nl,Nt=i(),z=r("ol"),z.innerHTML=il,Jt=i(),R=r("p"),R.textContent=sl,Kt=i(),q=r("table"),q.innerHTML=rl,Qt=i(),G=r("p"),G.innerHTML=pl,Vt=i(),j=r("p"),j.textContent=ul,Wt=i(),O=r("p"),O.textContent=fl,Xt=i(),B=r("p"),B.textContent=al,Yt=i(),a=r("iframe"),Zt=i(),U=r("p"),U.innerHTML=ml,te=i(),D=r("p"),D.textContent=Ll,ee=i(),N=r("p"),N.textContent=ol,le=i(),J=r("table"),J.innerHTML=Ml,ne=i(),C=r("blockquote"),C.innerHTML=vl,ie=i(),L(K.$$.fragment),se=i(),Q=r("p"),Q.innerHTML=xl,re=i(),T=r("img"),pe=i(),V=r("p"),V.textContent=dl,ue=i(),W=r("p"),W.textContent=Cl,fe=i(),X=r("ul"),X.innerHTML=Tl,ae=i(),$=r("img"),ge=i(),Y=r("p"),Y.textContent=Hl,me=i(),Z=r("ul"),Z.innerHTML=hl,Le=i(),tt=r("p"),tt.innerHTML=bl,oe=i(),g=r("iframe"),Me=i(),et=r("ul"),et.innerHTML=cl,ve=i(),m=r("iframe"),xe=i(),lt=r("p"),lt.innerHTML=yl,_e=i(),L(nt.$$.fragment),de=i(),it=r("p"),it.innerHTML=El,Ce=i(),H=r("img"),Te=ln(`
Этот процесс определения наиболее релевантных слов для предсказания следующего токена оказался невероятно эффективным.
`),st=r("p"),st.textContent=Al,$e=i(),rt=r("p"),rt.innerHTML=Il,He=i(),L(pt.$$.fragment),he=i(),ut=r("p"),ut.textContent=Sl,be=i(),ft=r("p"),ft.innerHTML=Fl,Pe=i(),L(at.$$.fragment),ce=i(),gt=r("p"),gt.textContent=zl,we=i(),mt=r("p"),mt.innerHTML=Rl,ye=i(),Lt=r("p"),Lt.innerHTML=ql,Ee=i(),L(ot.$$.fragment),ke=i(),Mt=r("p"),Mt.textContent=Gl,Ae=i(),vt=r("ol"),vt.innerHTML=jl,Ie=i(),xt=r("p"),xt.textContent=Ol,Se=i(),L(_t.$$.fragment),Fe=i(),dt=r("p"),dt.innerHTML=Bl,ze=i(),Ct=r("p"),Ct.textContent=Ul,Re=i(),Tt=r("p"),Tt.innerHTML=Dl,qe=i(),Ge=r("hr"),je=i(),$t=r("p"),$t.textContent=Nl,Oe=i(),Ht=r("p"),Ht.innerHTML=Jl,Be=i(),ht=r("p"),ht.innerHTML=Kl,Ue=i(),bt=r("p"),bt.innerHTML=Ql,De=i(),Pt=r("p"),Pt.innerHTML=Vl,Ne=i(),ct=r("p"),ct.innerHTML=Wl,Je=i(),L(wt.$$.fragment),Ke=i(),kt=r("p"),this.h()},l(t){const e=nn("svelte-u9bgzb",document.head);d=p(e,"META",{name:!0,content:!0}),e.forEach(l),It=s(t),Et=p(t,"P",{}),At(Et).forEach(l),St=s(t),o(b.$$.fragment,t),Ft=s(t),o(P.$$.fragment,t),zt=s(t),c=p(t,"IMG",{src:!0,alt:!0}),Rt=s(t),w=p(t,"P",{"data-svelte-h":!0}),u(w)!=="svelte-2pnibh"&&(w.innerHTML=Xe),qt=s(t),y=p(t,"P",{"data-svelte-h":!0}),u(y)!=="svelte-36bzke"&&(y.textContent=Ye),Gt=s(t),E=p(t,"P",{"data-svelte-h":!0}),u(E)!=="svelte-1ut0xy4"&&(E.innerHTML=Ze),jt=s(t),o(k.$$.fragment,t),Ot=s(t),A=p(t,"P",{"data-svelte-h":!0}),u(A)!=="svelte-1933cpz"&&(A.innerHTML=tl),Bt=s(t),I=p(t,"P",{"data-svelte-h":!0}),u(I)!=="svelte-16y0emv"&&(I.innerHTML=el),Ut=s(t),S=p(t,"FIGURE",{"data-svelte-h":!0}),u(S)!=="svelte-1dmbz6h"&&(S.innerHTML=ll),Dt=s(t),F=p(t,"P",{"data-svelte-h":!0}),u(F)!=="svelte-1fxrro0"&&(F.textContent=nl),Nt=s(t),z=p(t,"OL",{"data-svelte-h":!0}),u(z)!=="svelte-1b1u6nt"&&(z.innerHTML=il),Jt=s(t),R=p(t,"P",{"data-svelte-h":!0}),u(R)!=="svelte-7mjybc"&&(R.textContent=sl),Kt=s(t),q=p(t,"TABLE",{"data-svelte-h":!0}),u(q)!=="svelte-19v7rkw"&&(q.innerHTML=rl),Qt=s(t),G=p(t,"P",{"data-svelte-h":!0}),u(G)!=="svelte-12f9l17"&&(G.innerHTML=pl),Vt=s(t),j=p(t,"P",{"data-svelte-h":!0}),u(j)!=="svelte-1qxciym"&&(j.textContent=ul),Wt=s(t),O=p(t,"P",{"data-svelte-h":!0}),u(O)!=="svelte-109ri7d"&&(O.textContent=fl),Xt=s(t),B=p(t,"P",{"data-svelte-h":!0}),u(B)!=="svelte-1f74eyz"&&(B.textContent=al),Yt=s(t),a=p(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),At(a).forEach(l),Zt=s(t),U=p(t,"P",{"data-svelte-h":!0}),u(U)!=="svelte-rx2tcv"&&(U.innerHTML=ml),te=s(t),D=p(t,"P",{"data-svelte-h":!0}),u(D)!=="svelte-ildqzg"&&(D.textContent=Ll),ee=s(t),N=p(t,"P",{"data-svelte-h":!0}),u(N)!=="svelte-rjpjzr"&&(N.textContent=ol),le=s(t),J=p(t,"TABLE",{"data-svelte-h":!0}),u(J)!=="svelte-oa6538"&&(J.innerHTML=Ml),ne=s(t),C=p(t,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),u(C)!=="svelte-1aw9swu"&&(C.innerHTML=vl),ie=s(t),o(K.$$.fragment,t),se=s(t),Q=p(t,"P",{"data-svelte-h":!0}),u(Q)!=="svelte-aplhxy"&&(Q.innerHTML=xl),re=s(t),T=p(t,"IMG",{src:!0,alt:!0,width:!0}),pe=s(t),V=p(t,"P",{"data-svelte-h":!0}),u(V)!=="svelte-13xsflf"&&(V.textContent=dl),ue=s(t),W=p(t,"P",{"data-svelte-h":!0}),u(W)!=="svelte-x3zaun"&&(W.textContent=Cl),fe=s(t),X=p(t,"UL",{"data-svelte-h":!0}),u(X)!=="svelte-gf8zn1"&&(X.innerHTML=Tl),ae=s(t),$=p(t,"IMG",{src:!0,alt:!0,width:!0}),ge=s(t),Y=p(t,"P",{"data-svelte-h":!0}),u(Y)!=="svelte-1eqrprl"&&(Y.textContent=Hl),me=s(t),Z=p(t,"UL",{"data-svelte-h":!0}),u(Z)!=="svelte-1nset1j"&&(Z.innerHTML=hl),Le=s(t),tt=p(t,"P",{"data-svelte-h":!0}),u(tt)!=="svelte-si064d"&&(tt.innerHTML=bl),oe=s(t),g=p(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),At(g).forEach(l),Me=s(t),et=p(t,"UL",{"data-svelte-h":!0}),u(et)!=="svelte-1ppak22"&&(et.innerHTML=cl),ve=s(t),m=p(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),At(m).forEach(l),xe=s(t),lt=p(t,"P",{"data-svelte-h":!0}),u(lt)!=="svelte-1jp055l"&&(lt.innerHTML=yl),_e=s(t),o(nt.$$.fragment,t),de=s(t),it=p(t,"P",{"data-svelte-h":!0}),u(it)!=="svelte-ef367h"&&(it.innerHTML=El),Ce=s(t),H=p(t,"IMG",{src:!0,alt:!0,width:!0}),Te=sn(t,`
Этот процесс определения наиболее релевантных слов для предсказания следующего токена оказался невероятно эффективным.
`),st=p(t,"P",{"data-svelte-h":!0}),u(st)!=="svelte-f4yvjz"&&(st.textContent=Al),$e=s(t),rt=p(t,"P",{"data-svelte-h":!0}),u(rt)!=="svelte-ysq1n8"&&(rt.innerHTML=Il),He=s(t),o(pt.$$.fragment,t),he=s(t),ut=p(t,"P",{"data-svelte-h":!0}),u(ut)!=="svelte-ifrxro"&&(ut.textContent=Sl),be=s(t),ft=p(t,"P",{"data-svelte-h":!0}),u(ft)!=="svelte-16598tm"&&(ft.innerHTML=Fl),Pe=s(t),o(at.$$.fragment,t),ce=s(t),gt=p(t,"P",{"data-svelte-h":!0}),u(gt)!=="svelte-18lovr6"&&(gt.textContent=zl),we=s(t),mt=p(t,"P",{"data-svelte-h":!0}),u(mt)!=="svelte-1ihfc49"&&(mt.innerHTML=Rl),ye=s(t),Lt=p(t,"P",{"data-svelte-h":!0}),u(Lt)!=="svelte-10a222u"&&(Lt.innerHTML=ql),Ee=s(t),o(ot.$$.fragment,t),ke=s(t),Mt=p(t,"P",{"data-svelte-h":!0}),u(Mt)!=="svelte-m67wga"&&(Mt.textContent=Gl),Ae=s(t),vt=p(t,"OL",{"data-svelte-h":!0}),u(vt)!=="svelte-awaolz"&&(vt.innerHTML=jl),Ie=s(t),xt=p(t,"P",{"data-svelte-h":!0}),u(xt)!=="svelte-3vnptw"&&(xt.textContent=Ol),Se=s(t),o(_t.$$.fragment,t),Fe=s(t),dt=p(t,"P",{"data-svelte-h":!0}),u(dt)!=="svelte-1bc9i6a"&&(dt.innerHTML=Bl),ze=s(t),Ct=p(t,"P",{"data-svelte-h":!0}),u(Ct)!=="svelte-1nxy5cq"&&(Ct.textContent=Ul),Re=s(t),Tt=p(t,"P",{"data-svelte-h":!0}),u(Tt)!=="svelte-l310f7"&&(Tt.innerHTML=Dl),qe=s(t),Ge=p(t,"HR",{}),je=s(t),$t=p(t,"P",{"data-svelte-h":!0}),u($t)!=="svelte-8j483l"&&($t.textContent=Nl),Oe=s(t),Ht=p(t,"P",{"data-svelte-h":!0}),u(Ht)!=="svelte-4l2emu"&&(Ht.innerHTML=Jl),Be=s(t),ht=p(t,"P",{"data-svelte-h":!0}),u(ht)!=="svelte-1u3kfgf"&&(ht.innerHTML=Kl),Ue=s(t),bt=p(t,"P",{"data-svelte-h":!0}),u(bt)!=="svelte-eb2tat"&&(bt.innerHTML=Ql),De=s(t),Pt=p(t,"P",{"data-svelte-h":!0}),u(Pt)!=="svelte-1uprhni"&&(Pt.innerHTML=Vl),Ne=s(t),ct=p(t,"P",{"data-svelte-h":!0}),u(ct)!=="svelte-16sfyy7"&&(ct.innerHTML=Wl),Je=s(t),o(wt.$$.fragment,t),Ke=s(t),kt=p(t,"P",{}),At(kt).forEach(l),this.h()},h(){f(d,"name","hf:doc:metadata"),f(d,"content",an),yt(c.src,We="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/whiteboard-check-1.jpg")||f(c,"src",We),f(c,"alt","Unit 1 planning"),yt(a.src,gl="https://agents-course-the-tokenizer-playground.static.hf.space")||f(a,"src",gl),f(a,"frameborder","0"),f(a,"width","850"),f(a,"height","450"),f(C,"class","tip"),yt(T.src,_l="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AutoregressionSchema.gif")||f(T,"src",_l),f(T,"alt","Визуализация процесса авторегрессионного декодирования"),f(T,"width","60%"),yt($.src,$l="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/DecodingFinal.gif")||f($,"src",$l),f($,"alt","Визуализация процесса декодирования"),f($,"width","60%"),yt(g.src,Pl="https://agents-course-decoding-visualizer.hf.space")||f(g,"src",Pl),f(g,"frameborder","0"),f(g,"width","850"),f(g,"height","450"),yt(m.src,wl="https://agents-course-beam-search-visualizer.hf.space")||f(m,"src",wl),f(m,"frameborder","0"),f(m,"width","850"),f(m,"height","450"),yt(H.src,kl="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AttentionSceneFinal.gif")||f(H,"src",kl),f(H,"alt","Визуализация механизма Внимания"),f(H,"width","60%")},m(t,e){rn(document.head,d),n(t,It,e),n(t,Et,e),n(t,St,e),M(b,t,e),n(t,Ft,e),M(P,t,e),n(t,zt,e),n(t,c,e),n(t,Rt,e),n(t,w,e),n(t,qt,e),n(t,y,e),n(t,Gt,e),n(t,E,e),n(t,jt,e),M(k,t,e),n(t,Ot,e),n(t,A,e),n(t,Bt,e),n(t,I,e),n(t,Ut,e),n(t,S,e),n(t,Dt,e),n(t,F,e),n(t,Nt,e),n(t,z,e),n(t,Jt,e),n(t,R,e),n(t,Kt,e),n(t,q,e),n(t,Qt,e),n(t,G,e),n(t,Vt,e),n(t,j,e),n(t,Wt,e),n(t,O,e),n(t,Xt,e),n(t,B,e),n(t,Yt,e),n(t,a,e),n(t,Zt,e),n(t,U,e),n(t,te,e),n(t,D,e),n(t,ee,e),n(t,N,e),n(t,le,e),n(t,J,e),n(t,ne,e),n(t,C,e),n(t,ie,e),M(K,t,e),n(t,se,e),n(t,Q,e),n(t,re,e),n(t,T,e),n(t,pe,e),n(t,V,e),n(t,ue,e),n(t,W,e),n(t,fe,e),n(t,X,e),n(t,ae,e),n(t,$,e),n(t,ge,e),n(t,Y,e),n(t,me,e),n(t,Z,e),n(t,Le,e),n(t,tt,e),n(t,oe,e),n(t,g,e),n(t,Me,e),n(t,et,e),n(t,ve,e),n(t,m,e),n(t,xe,e),n(t,lt,e),n(t,_e,e),M(nt,t,e),n(t,de,e),n(t,it,e),n(t,Ce,e),n(t,H,e),n(t,Te,e),n(t,st,e),n(t,$e,e),n(t,rt,e),n(t,He,e),M(pt,t,e),n(t,he,e),n(t,ut,e),n(t,be,e),n(t,ft,e),n(t,Pe,e),M(at,t,e),n(t,ce,e),n(t,gt,e),n(t,we,e),n(t,mt,e),n(t,ye,e),n(t,Lt,e),n(t,Ee,e),M(ot,t,e),n(t,ke,e),n(t,Mt,e),n(t,Ae,e),n(t,vt,e),n(t,Ie,e),n(t,xt,e),n(t,Se,e),M(_t,t,e),n(t,Fe,e),n(t,dt,e),n(t,ze,e),n(t,Ct,e),n(t,Re,e),n(t,Tt,e),n(t,qe,e),n(t,Ge,e),n(t,je,e),n(t,$t,e),n(t,Oe,e),n(t,Ht,e),n(t,Be,e),n(t,ht,e),n(t,Ue,e),n(t,bt,e),n(t,De,e),n(t,Pt,e),n(t,Ne,e),n(t,ct,e),n(t,Je,e),M(wt,t,e),n(t,Ke,e),n(t,kt,e),Qe=!0},p:Yl,i(t){Qe||(v(b.$$.fragment,t),v(P.$$.fragment,t),v(k.$$.fragment,t),v(K.$$.fragment,t),v(nt.$$.fragment,t),v(pt.$$.fragment,t),v(at.$$.fragment,t),v(ot.$$.fragment,t),v(_t.$$.fragment,t),v(wt.$$.fragment,t),Qe=!0)},o(t){x(b.$$.fragment,t),x(P.$$.fragment,t),x(k.$$.fragment,t),x(K.$$.fragment,t),x(nt.$$.fragment,t),x(pt.$$.fragment,t),x(at.$$.fragment,t),x(ot.$$.fragment,t),x(_t.$$.fragment,t),x(wt.$$.fragment,t),Qe=!1},d(t){t&&(l(It),l(Et),l(St),l(Ft),l(zt),l(c),l(Rt),l(w),l(qt),l(y),l(Gt),l(E),l(jt),l(Ot),l(A),l(Bt),l(I),l(Ut),l(S),l(Dt),l(F),l(Nt),l(z),l(Jt),l(R),l(Kt),l(q),l(Qt),l(G),l(Vt),l(j),l(Wt),l(O),l(Xt),l(B),l(Yt),l(a),l(Zt),l(U),l(te),l(D),l(ee),l(N),l(le),l(J),l(ne),l(C),l(ie),l(se),l(Q),l(re),l(T),l(pe),l(V),l(ue),l(W),l(fe),l(X),l(ae),l($),l(ge),l(Y),l(me),l(Z),l(Le),l(tt),l(oe),l(g),l(Me),l(et),l(ve),l(m),l(xe),l(lt),l(_e),l(de),l(it),l(Ce),l(H),l(Te),l(st),l($e),l(rt),l(He),l(he),l(ut),l(be),l(ft),l(Pe),l(ce),l(gt),l(we),l(mt),l(ye),l(Lt),l(Ee),l(ke),l(Mt),l(Ae),l(vt),l(Ie),l(xt),l(Se),l(Fe),l(dt),l(ze),l(Ct),l(Re),l(Tt),l(qe),l(Ge),l(je),l($t),l(Oe),l(Ht),l(Be),l(ht),l(Ue),l(bt),l(De),l(Pt),l(Ne),l(ct),l(Je),l(Ke),l(kt)),l(d),_(b,t),_(P,t),_(k,t),_(K,t),_(nt,t),_(pt,t),_(at,t),_(ot,t),_(_t,t),_(wt,t)}}}const an='{"title":"Что такое LLM?","local":"что-такое-llm","sections":[{"title":"## Что такое Большая Языковая Модель?","local":"-что-такое-большая-языковая-модель","sections":[],"depth":2},{"title":"Понимание предсказания следующего токена.","local":"понимание-предсказания-следующего-токена","sections":[],"depth":2},{"title":"Внимание - это все, что вам нужно","local":"внимание---это-все-что-вам-нужно","sections":[],"depth":2},{"title":"Подсказки для LLM очень важны","local":"подсказки-для-llm-очень-важны","sections":[],"depth":2},{"title":"Как обучаются LLM?","local":"как-обучаются-llm","sections":[],"depth":2},{"title":"Как я могу использовать LLM?","local":"как-я-могу-использовать-llm","sections":[],"depth":2},{"title":"Как LLM используются в AI Агентах?","local":"как-llm-используются-в-ai-агентах","sections":[],"depth":2}],"depth":1}';function gn(Ve){return Zl(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class Mn extends tn{constructor(d){super(),en(this,d,gn,fn,Xl,{})}}export{Mn as component};

Xet Storage Details

Size:
34.5 kB
·
Xet hash:
ff001f0366701949542ffa398d3eb6cf6f52dff8c5bb935575cb14ad43624746

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.