Buckets:

rtrm's picture
download
raw
34.5 kB
import{s as Vl,f as yt,o as Wl,n as Xl}from"../chunks/scheduler.f6b352c8.js";import{S as Yl,i as Zl,g as r,s as i,r as v,m as tn,A as en,h as p,f as l,c as s,j as It,u as M,x as u,n as ln,k as f,y as nn,a as n,v as x,d as _,t as d,w as $}from"../chunks/index.7f38e934.js";import{T as sn}from"../chunks/Tip.ae532637.js";import{H as P,E as rn}from"../chunks/getInferenceSnippets.6e7b7bd6.js";function pn(St){let a,c='Мы не ожидаем, что вы запомните эти специальные токены, но важно оценить их разнообразие и роль, которую они играют в генерации текста LLM. Если вы хотите узнать больше о специальных токенах, вы можете посмотреть конфигурацию модели в ее репозитории на Hugging Face Hub. Например, вы можете найти специальные токены модели SmolLM2 в ее <a href="https://huggingface.co/HuggingFaceTB/SmolLM2-135M-Instruct/blob/main/tokenizer_config.json">tokenizer_config.json</a>.';return{c(){a=r("p"),a.innerHTML=c},l(g){a=p(g,"P",{"data-svelte-h":!0}),u(a)!=="svelte-1fgyux1"&&(a.innerHTML=c)},m(g,kt){n(g,a,kt)},p:Xl,d(g){g&&l(a)}}}function un(St){let a,c,g,kt,b,Ft,w,Qe,zt,E,Ve="В предыдущем разделе мы узнали, что каждый агент нуждается в <strong>AI Модели как в ядре</strong>, и что LLM являются наиболее распространенным типом AI моделей использующихся для этой цели.",Rt,y,We="Теперь мы узнаем, что такое LLM и как они наделяют агентов мощью.",Gt,k,Xe='В этом разделе представлено краткое техническое объяснение использования LLM. Если вы хотите погрузиться глубже, вы можете ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по Обработке Естественного Языка (Natural Language Processing).</a>.',jt,A,qt,I,Ye="Большая Языковая Модель (Large Language Model, LLM) - это тип AI модели, которая превосходно работает с <strong>пониманием и генерированием человеческого языка</strong>. Они обучаются на огромных объемах текстовых данных, что позволяет им изучать шаблоны, структуру и даже нюансы языка. Эти модели обычно состоят из многих миллионов параметров.",Ot,S,Ze="Большинство LLM в настоящее время <strong>построены на архитектуре Transformer</strong> - архитектуре глубокого обучения, основанной на алгоритме «Внимания» («Attention» algorithm), который стал вызывать значительный интерес после выхода BERT от Google в 2018 году.",Bt,F,tl='<img src="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/transformer.jpg" alt="Transformer"/> <figcaption>Оригинальная архитектура трансформера выглядела следующим образом: слева располагался кодер, справа - декодер.</figcaption>',Ut,z,el="Существует 3 типа трансформеров:",Dt,R,ll=`<li><p><strong>Энкодеры (кодеры)</strong><br/>
Трансформер на основе кодировщика принимает на вход текст (или другие данные) и выдает плотное векторное представление (или эмбеддинг) этого текста.</p> <ul><li><strong>Пример</strong>: BERT от Google</li> <li><strong>Примеры использования</strong>: классификация текста, семантический поиск, Распознавание Именованных Сущностей (Named Entity Recognition, NER)</li> <li><strong>Типичный размер</strong>: миллионы параметров</li></ul></li> <li><p><strong>Декодеры</strong>.<br/>
Трансформер на основе декодера фокусируется <strong>на генерации новых токенов для завершения последовательности, по одному токену за раз</strong>.</p> <ul><li><strong>Пример</strong>: Llama из Meta</li> <li><strong>Примеры использования</strong>: Генерация текста, чат-боты, генерация кода</li> <li><strong>Типичный размер</strong>: Миллиарды (в американском понимании, т.е. 10^9) параметров</li></ul></li> <li><p><strong>Seq2Seq (энкодер-декодер)</strong>.<br/>
Трансформер преобразующие последовательности в последовательность (sequence-to-sequence) объединяет в себе энкодер и декодер. Сначала энкодер преобразует входную последовательность в контекстное представление, а затем декодер генерирует выходную последовательность.</p> <ul><li><strong>Пример</strong>: T5, BART</li> <li><strong>Примеры использования</strong>: Перевод, обобщение, перефразирование.</li> <li><strong>Типичный размер</strong>: Миллионы параметров</li></ul></li>`,Nt,G,nl="Хотя Большие Языковые Модели (Large Language Model) бывают разных форм, LLM обычно представляют собой модели на основе декодера с миллиардами параметров. Вот некоторые из наиболее известных LLM:",Jt,j,il="<thead><tr><th><strong>Модель</strong></th> <th><strong>Провайдер</strong></th></tr></thead> <tbody><tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td></tr> <tr><td><strong>GPT4</strong></td> <td>OpenAI</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td></tr> <tr><td><strong>Mistral</strong></td> <td>Mistral</td></tr></tbody>",Kt,q,sl="Принцип, лежащий в основе LLM, прост, но очень эффективен: <strong>его цель - предсказать следующий токен, учитывая последовательность предыдущих токенов</strong>. “Токен” - это единица информации, с которой работает LLM. Вы можете воспринимать “токен” как “слово”, но по соображениям эффективности LLM не используют целые слова.",Qt,O,rl="Например, если в английском языке насчитывается около 600 000 слов, то в LLM может быть около 32 000 токенов (как в случае с Llama 2). Токенизация часто работает по подсловам, которые можно комбинировать.",Vt,B,pl="Например, рассмотрим, как токены “interest” и “ing” могут быть объединены в слово “interesting”, или “ed” может быть добавлено в слово “interested”.",Wt,U,ul="Вы можете поэкспериментировать с различными токенами в интерактивной демонстрации ниже:",Xt,m,fl,Yt,D,al="Каждая LLM имеет несколько <strong>специальных токенов</strong>, специфичных для данной модели. LLM использует эти токены для открытия и закрытия структурированных компонентов своей генерации. Например, чтобы указать начало или конец последовательности, сообщения или ответа. Кроме того, инструкции для ввода (input prompts), которые мы передаем модели, также структурированы с помощью специальных токенов. Наиболее важным из них является токен <strong>Конец последовательности</strong> (EOS).",Zt,N,gl="Формы специальных токенов у разных провайдеров моделей весьма разнообразны.",te,J,ml="Таблица ниже иллюстрирует разнообразие специальных токенов.",ee,K,Ll="<thead><tr><th><strong>Model</strong></th> <th><strong>Provider</strong></th> <th><strong>EOS Token</strong></th> <th><strong>Functionality</strong></th></tr></thead> <tbody><tr><td><strong>GPT4</strong></td> <td>OpenAI</td> <td><code>&lt;|endoftext|&gt;</code></td> <td>End of message text</td></tr> <tr><td><strong>Llama 3</strong></td> <td>Meta (Facebook AI Research)</td> <td><code>&lt;|eot_id|&gt;</code></td> <td>End of sequence</td></tr> <tr><td><strong>Deepseek-R1</strong></td> <td>DeepSeek</td> <td><code>&lt;|end_of_sentence|&gt;</code></td> <td>End of message text</td></tr> <tr><td><strong>SmolLM2</strong></td> <td>Hugging Face</td> <td><code>&lt;|im_end|&gt;</code></td> <td>End of instruction or message</td></tr> <tr><td><strong>Gemma</strong></td> <td>Google</td> <td><code>&lt;end_of_turn&gt;</code></td> <td>End of conversation turn</td></tr></tbody>",le,C,ne,Q,ie,V,ol="Считается, что LLM - это <strong>авторегрессия</strong>, то есть <strong>выход одного прохода становится входом для следующего</strong>. Этот цикл продолжается до тех пор, пока модель не предскажет, что следующим токеном будет токен EOS, на котором модель может остановиться.",se,T,vl,re,W,Ml="Другими словами, LLM будет декодировать текст до тех пор, пока он не достигнет EOS. Но что происходит во время одного цикла декодирования?",pe,X,xl="Хотя полное описание процесса может быть довольно техническим для целей изучения агентов, вот краткий обзор:",ue,Y,_l="<li>После того как входной текст <strong>токинизирован</strong>, модель вычисляет представление последовательности, которое содержит информацию о значении и положении каждого токена во входной последовательности.</li> <li>Это представление поступает в модель, которая возвращает оценки, оценивающие вероятность для каждого токена из ее словаря быть следующим в последовательности.</li>",fe,H,dl,ae,Z,$l="Основываясь на этих оценках, у нас есть несколько стратегий выбора токенов для завершения предложения.",ge,tt,Cl="<li>Самой простой стратегией декодирования будет всегда брать токен с максимальным количеством баллов.</li>",me,et,Tl="Вы можете самостоятельно взаимодействовать с процессом декодирования с помощью SmolLM2 в этом Пространстве (помните, что она декодирует до достижения токена <strong>EOS</strong>, которым является <strong>&lt;|im_end|&gt;</strong> для этой модели):",Le,L,Hl,oe,lt,hl="<li>Но есть и более продвинутые стратегии декодирования. Например, <em>лучевой поиск (beam search)</em> исследует несколько последовательностей-кандидатов, чтобы найти ту, которая имеет максимальную общую оценку - даже если некоторые отдельные токены имеют более низкие оценки.</li>",ve,o,Pl,Me,nt,cl='Если вы хотите узнать больше о декодировании, вы можете изучить <a href="https://huggingface.co/learn/nlp-course" rel="nofollow">курс по NLP</a>.',xe,it,_e,st,bl=`Ключевым аспектом архитектуры трансформера является <strong>Внимание (Attention)</strong>. При предсказании следующего слова,
не все слова в предложении одинаково важны; такие слова, как “France” и “capital” в предложении <em>“The capital of France is …”</em>, несут наибольшую смысловую нагрузку.`,de,h,wl,$e,rt,El="Хотя основной принцип работы LLM - предсказание следующего токена - остается неизменным со времен GPT-2, были достигнуты значительные успехи в масштабировании нейронных сетей и обеспечении работы механизма внимания для все более длинных последовательностей.",Ce,pt,yl="Если вы взаимодействовали с LLM, вы, вероятно, знакомы с термином <em>длина контекста (context length)</em>, который обозначает максимальное количество токенов, которые может обработать LLM, и максимальную <em>продолжительность внимания (attention span)</em>, которой она обладает.",Te,ut,He,ft,kl="Учитывая, что единственная задача LLM - предсказать следующий токен, просматривая каждый входной токен, и выбрать “важные” токены, формулировка вашей входной последовательности очень важна.",he,at,Al="Входная последовательность, которую вы передаете LLM, называется <em>подсказкой (prompt)</em>. Тщательное проектирование подсказки облегчает <strong>направление генерации LLM к желаемому результату</strong>.",Pe,gt,ce,mt,Il="Модели LLM обучаются на больших массивах данных текста, где они учатся предсказывать следующее слово в последовательности с помощью самообучения (self-supervised) или маскированного языкового моделирования (masked language modeling).",be,Lt,Sl="В результате такого обучения без учителя модель изучает структуру языка и <strong>основные закономерности в тексте, что позволяет модели обобщать ранее не встречавшиеся данные</strong>.",we,ot,Fl="После такого начального <em>предварительного</em> обучения LLM могут быть дообучены для выполнения конкретных задач методами обучения с учителем. Например, некоторые модели обучаются разговорным структурам или использованию инструментов, в то время как другие сосредоточены на классификации или генерации кода.",Ee,vt,ye,Mt,zl="У вас есть два основных варианта:",ke,xt,Rl="<li><p><strong>Запустить локально</strong> (если у вас достаточно аппаратных ресурсов).</p></li> <li><p><strong>Использовать облако/API</strong> (например, через Hugging Face Serverless Inference API).</p></li>",Ae,_t,Gl="На протяжении всего курса мы будем использовать модели через API на Hugging Face Hub. Позже мы изучим, как запустить эти модели локально на вашем оборудовании.",Ie,dt,Se,$t,jl="LLM являются ключевым компонентом агентов искусственного интеллекта, <strong>обеспечивая основу для понимания и генерации человеческого языка</strong>.",Fe,Ct,ql="Они могут интерпретировать инструкции пользователя, поддерживать контекст в разговоре, определять план и решать, какие инструменты использовать.",ze,Tt,Ol="Мы рассмотрим эти шаги более подробно в данном Разделе, а пока вам нужно понять, что LLM - это <strong>мозг агента</strong>.",Re,Ge,je,Ht,Bl="Это был большой объем информации! Мы рассмотрели основы того, что такое LLM, как они функционируют и какова их роль в работе AI агентов.",qe,ht,Ul='Если вы хотите еще глубже погрузиться в увлекательный мир языковых моделей и обработки естественного языка, не поленитесь ознакомиться с нашим <a href="https://huggingface.co/learn/nlp-course/chapter1/1" target="_blank">бесплатным курсом по NLP</a>.',Oe,Pt,Dl="Теперь, когда мы поняли, как работают LLM, пришло время увидеть <strong>как LLM структурируют свою генерацию в разговорном контексте</strong>.",Be,ct,Nl='Чтобы запустить <a href="https://huggingface.co/agents-course/notebooks/blob/main/unit1/dummy_agent_library.ipynb" target="_blank">этот блокнот</a>, <strong>вам понадобится токен Hugging Face</strong> который вы можете получить из <a href="https://hf.co/settings/tokens" target="_blank">https://hf.co/settings/tokens</a>.',Ue,bt,Jl='Более подробную информацию о том, как запустить блокноты Jupyter, изучите <a href="https://huggingface.co/docs/hub/notebooks">Блокноты Jupyter на Hugging Face Hub</a>.',De,wt,Kl='Вам также необходимо запросить доступ к <a href="https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct" target="_blank">модели Meta Llama</a>.',Ne,Et,Je,At,Ke;return b=new P({props:{title:"Что такое LLM?",local:"что-такое-llm",headingTag:"h1"}}),A=new P({props:{title:"## Что такое Большая Языковая Модель?",local:"-что-такое-большая-языковая-модель",headingTag:"h2"}}),C=new sn({props:{$$slots:{default:[pn]},$$scope:{ctx:St}}}),Q=new P({props:{title:"Понимание предсказания следующего токена.",local:"понимание-предсказания-следующего-токена",headingTag:"h2"}}),it=new P({props:{title:"Внимание - это все, что вам нужно",local:"внимание---это-все-что-вам-нужно",headingTag:"h2"}}),ut=new P({props:{title:"Подсказки для LLM очень важны",local:"подсказки-для-llm-очень-важны",headingTag:"h2"}}),gt=new P({props:{title:"Как обучаются LLM?",local:"как-обучаются-llm",headingTag:"h2"}}),vt=new P({props:{title:"Как я могу использовать LLM?",local:"как-я-могу-использовать-llm",headingTag:"h2"}}),dt=new P({props:{title:"Как LLM используются в AI Агентах?",local:"как-llm-используются-в-ai-агентах",headingTag:"h2"}}),Et=new rn({props:{source:"https://github.com/huggingface/agents-course/blob/main/units/ru-RU/unit1/what-are-llms.mdx"}}),{c(){a=r("meta"),c=i(),g=r("p"),kt=i(),v(b.$$.fragment),Ft=i(),w=r("img"),zt=i(),E=r("p"),E.innerHTML=Ve,Rt=i(),y=r("p"),y.textContent=We,Gt=i(),k=r("p"),k.innerHTML=Xe,jt=i(),v(A.$$.fragment),qt=i(),I=r("p"),I.innerHTML=Ye,Ot=i(),S=r("p"),S.innerHTML=Ze,Bt=i(),F=r("figure"),F.innerHTML=tl,Ut=i(),z=r("p"),z.textContent=el,Dt=i(),R=r("ol"),R.innerHTML=ll,Nt=i(),G=r("p"),G.textContent=nl,Jt=i(),j=r("table"),j.innerHTML=il,Kt=i(),q=r("p"),q.innerHTML=sl,Qt=i(),O=r("p"),O.textContent=rl,Vt=i(),B=r("p"),B.textContent=pl,Wt=i(),U=r("p"),U.textContent=ul,Xt=i(),m=r("iframe"),Yt=i(),D=r("p"),D.innerHTML=al,Zt=i(),N=r("p"),N.textContent=gl,te=i(),J=r("p"),J.textContent=ml,ee=i(),K=r("table"),K.innerHTML=Ll,le=i(),v(C.$$.fragment),ne=i(),v(Q.$$.fragment),ie=i(),V=r("p"),V.innerHTML=ol,se=i(),T=r("img"),re=i(),W=r("p"),W.textContent=Ml,pe=i(),X=r("p"),X.textContent=xl,ue=i(),Y=r("ul"),Y.innerHTML=_l,fe=i(),H=r("img"),ae=i(),Z=r("p"),Z.textContent=$l,ge=i(),tt=r("ul"),tt.innerHTML=Cl,me=i(),et=r("p"),et.innerHTML=Tl,Le=i(),L=r("iframe"),oe=i(),lt=r("ul"),lt.innerHTML=hl,ve=i(),o=r("iframe"),Me=i(),nt=r("p"),nt.innerHTML=cl,xe=i(),v(it.$$.fragment),_e=i(),st=r("p"),st.innerHTML=bl,de=i(),h=r("img"),$e=tn(`
Этот процесс определения наиболее релевантных слов для предсказания следующего токена оказался невероятно эффективным.
`),rt=r("p"),rt.textContent=El,Ce=i(),pt=r("p"),pt.innerHTML=yl,Te=i(),v(ut.$$.fragment),He=i(),ft=r("p"),ft.textContent=kl,he=i(),at=r("p"),at.innerHTML=Al,Pe=i(),v(gt.$$.fragment),ce=i(),mt=r("p"),mt.textContent=Il,be=i(),Lt=r("p"),Lt.innerHTML=Sl,we=i(),ot=r("p"),ot.innerHTML=Fl,Ee=i(),v(vt.$$.fragment),ye=i(),Mt=r("p"),Mt.textContent=zl,ke=i(),xt=r("ol"),xt.innerHTML=Rl,Ae=i(),_t=r("p"),_t.textContent=Gl,Ie=i(),v(dt.$$.fragment),Se=i(),$t=r("p"),$t.innerHTML=jl,Fe=i(),Ct=r("p"),Ct.textContent=ql,ze=i(),Tt=r("p"),Tt.innerHTML=Ol,Re=i(),Ge=r("hr"),je=i(),Ht=r("p"),Ht.textContent=Bl,qe=i(),ht=r("p"),ht.innerHTML=Ul,Oe=i(),Pt=r("p"),Pt.innerHTML=Dl,Be=i(),ct=r("p"),ct.innerHTML=Nl,Ue=i(),bt=r("p"),bt.innerHTML=Jl,De=i(),wt=r("p"),wt.innerHTML=Kl,Ne=i(),v(Et.$$.fragment),Je=i(),At=r("p"),this.h()},l(t){const e=en("svelte-u9bgzb",document.head);a=p(e,"META",{name:!0,content:!0}),e.forEach(l),c=s(t),g=p(t,"P",{}),It(g).forEach(l),kt=s(t),M(b.$$.fragment,t),Ft=s(t),w=p(t,"IMG",{src:!0,alt:!0}),zt=s(t),E=p(t,"P",{"data-svelte-h":!0}),u(E)!=="svelte-2pnibh"&&(E.innerHTML=Ve),Rt=s(t),y=p(t,"P",{"data-svelte-h":!0}),u(y)!=="svelte-36bzke"&&(y.textContent=We),Gt=s(t),k=p(t,"P",{"data-svelte-h":!0}),u(k)!=="svelte-1ut0xy4"&&(k.innerHTML=Xe),jt=s(t),M(A.$$.fragment,t),qt=s(t),I=p(t,"P",{"data-svelte-h":!0}),u(I)!=="svelte-1933cpz"&&(I.innerHTML=Ye),Ot=s(t),S=p(t,"P",{"data-svelte-h":!0}),u(S)!=="svelte-16y0emv"&&(S.innerHTML=Ze),Bt=s(t),F=p(t,"FIGURE",{"data-svelte-h":!0}),u(F)!=="svelte-1dmbz6h"&&(F.innerHTML=tl),Ut=s(t),z=p(t,"P",{"data-svelte-h":!0}),u(z)!=="svelte-1fxrro0"&&(z.textContent=el),Dt=s(t),R=p(t,"OL",{"data-svelte-h":!0}),u(R)!=="svelte-1b1u6nt"&&(R.innerHTML=ll),Nt=s(t),G=p(t,"P",{"data-svelte-h":!0}),u(G)!=="svelte-7mjybc"&&(G.textContent=nl),Jt=s(t),j=p(t,"TABLE",{"data-svelte-h":!0}),u(j)!=="svelte-19v7rkw"&&(j.innerHTML=il),Kt=s(t),q=p(t,"P",{"data-svelte-h":!0}),u(q)!=="svelte-12f9l17"&&(q.innerHTML=sl),Qt=s(t),O=p(t,"P",{"data-svelte-h":!0}),u(O)!=="svelte-1qxciym"&&(O.textContent=rl),Vt=s(t),B=p(t,"P",{"data-svelte-h":!0}),u(B)!=="svelte-109ri7d"&&(B.textContent=pl),Wt=s(t),U=p(t,"P",{"data-svelte-h":!0}),u(U)!=="svelte-1f74eyz"&&(U.textContent=ul),Xt=s(t),m=p(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),It(m).forEach(l),Yt=s(t),D=p(t,"P",{"data-svelte-h":!0}),u(D)!=="svelte-rx2tcv"&&(D.innerHTML=al),Zt=s(t),N=p(t,"P",{"data-svelte-h":!0}),u(N)!=="svelte-ildqzg"&&(N.textContent=gl),te=s(t),J=p(t,"P",{"data-svelte-h":!0}),u(J)!=="svelte-rjpjzr"&&(J.textContent=ml),ee=s(t),K=p(t,"TABLE",{"data-svelte-h":!0}),u(K)!=="svelte-oa6538"&&(K.innerHTML=Ll),le=s(t),M(C.$$.fragment,t),ne=s(t),M(Q.$$.fragment,t),ie=s(t),V=p(t,"P",{"data-svelte-h":!0}),u(V)!=="svelte-aplhxy"&&(V.innerHTML=ol),se=s(t),T=p(t,"IMG",{src:!0,alt:!0,width:!0}),re=s(t),W=p(t,"P",{"data-svelte-h":!0}),u(W)!=="svelte-13xsflf"&&(W.textContent=Ml),pe=s(t),X=p(t,"P",{"data-svelte-h":!0}),u(X)!=="svelte-x3zaun"&&(X.textContent=xl),ue=s(t),Y=p(t,"UL",{"data-svelte-h":!0}),u(Y)!=="svelte-gf8zn1"&&(Y.innerHTML=_l),fe=s(t),H=p(t,"IMG",{src:!0,alt:!0,width:!0}),ae=s(t),Z=p(t,"P",{"data-svelte-h":!0}),u(Z)!=="svelte-1eqrprl"&&(Z.textContent=$l),ge=s(t),tt=p(t,"UL",{"data-svelte-h":!0}),u(tt)!=="svelte-1nset1j"&&(tt.innerHTML=Cl),me=s(t),et=p(t,"P",{"data-svelte-h":!0}),u(et)!=="svelte-si064d"&&(et.innerHTML=Tl),Le=s(t),L=p(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),It(L).forEach(l),oe=s(t),lt=p(t,"UL",{"data-svelte-h":!0}),u(lt)!=="svelte-1ppak22"&&(lt.innerHTML=hl),ve=s(t),o=p(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),It(o).forEach(l),Me=s(t),nt=p(t,"P",{"data-svelte-h":!0}),u(nt)!=="svelte-1jp055l"&&(nt.innerHTML=cl),xe=s(t),M(it.$$.fragment,t),_e=s(t),st=p(t,"P",{"data-svelte-h":!0}),u(st)!=="svelte-ef367h"&&(st.innerHTML=bl),de=s(t),h=p(t,"IMG",{src:!0,alt:!0,width:!0}),$e=ln(t,`
Этот процесс определения наиболее релевантных слов для предсказания следующего токена оказался невероятно эффективным.
`),rt=p(t,"P",{"data-svelte-h":!0}),u(rt)!=="svelte-f4yvjz"&&(rt.textContent=El),Ce=s(t),pt=p(t,"P",{"data-svelte-h":!0}),u(pt)!=="svelte-ysq1n8"&&(pt.innerHTML=yl),Te=s(t),M(ut.$$.fragment,t),He=s(t),ft=p(t,"P",{"data-svelte-h":!0}),u(ft)!=="svelte-ifrxro"&&(ft.textContent=kl),he=s(t),at=p(t,"P",{"data-svelte-h":!0}),u(at)!=="svelte-16598tm"&&(at.innerHTML=Al),Pe=s(t),M(gt.$$.fragment,t),ce=s(t),mt=p(t,"P",{"data-svelte-h":!0}),u(mt)!=="svelte-18lovr6"&&(mt.textContent=Il),be=s(t),Lt=p(t,"P",{"data-svelte-h":!0}),u(Lt)!=="svelte-1ihfc49"&&(Lt.innerHTML=Sl),we=s(t),ot=p(t,"P",{"data-svelte-h":!0}),u(ot)!=="svelte-10a222u"&&(ot.innerHTML=Fl),Ee=s(t),M(vt.$$.fragment,t),ye=s(t),Mt=p(t,"P",{"data-svelte-h":!0}),u(Mt)!=="svelte-m67wga"&&(Mt.textContent=zl),ke=s(t),xt=p(t,"OL",{"data-svelte-h":!0}),u(xt)!=="svelte-awaolz"&&(xt.innerHTML=Rl),Ae=s(t),_t=p(t,"P",{"data-svelte-h":!0}),u(_t)!=="svelte-3vnptw"&&(_t.textContent=Gl),Ie=s(t),M(dt.$$.fragment,t),Se=s(t),$t=p(t,"P",{"data-svelte-h":!0}),u($t)!=="svelte-1bc9i6a"&&($t.innerHTML=jl),Fe=s(t),Ct=p(t,"P",{"data-svelte-h":!0}),u(Ct)!=="svelte-1nxy5cq"&&(Ct.textContent=ql),ze=s(t),Tt=p(t,"P",{"data-svelte-h":!0}),u(Tt)!=="svelte-l310f7"&&(Tt.innerHTML=Ol),Re=s(t),Ge=p(t,"HR",{}),je=s(t),Ht=p(t,"P",{"data-svelte-h":!0}),u(Ht)!=="svelte-8j483l"&&(Ht.textContent=Bl),qe=s(t),ht=p(t,"P",{"data-svelte-h":!0}),u(ht)!=="svelte-4l2emu"&&(ht.innerHTML=Ul),Oe=s(t),Pt=p(t,"P",{"data-svelte-h":!0}),u(Pt)!=="svelte-1u3kfgf"&&(Pt.innerHTML=Dl),Be=s(t),ct=p(t,"P",{"data-svelte-h":!0}),u(ct)!=="svelte-eb2tat"&&(ct.innerHTML=Nl),Ue=s(t),bt=p(t,"P",{"data-svelte-h":!0}),u(bt)!=="svelte-1uprhni"&&(bt.innerHTML=Jl),De=s(t),wt=p(t,"P",{"data-svelte-h":!0}),u(wt)!=="svelte-16sfyy7"&&(wt.innerHTML=Kl),Ne=s(t),M(Et.$$.fragment,t),Je=s(t),At=p(t,"P",{}),It(At).forEach(l),this.h()},h(){f(a,"name","hf:doc:metadata"),f(a,"content",fn),yt(w.src,Qe="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/whiteboard-check-1.jpg")||f(w,"src",Qe),f(w,"alt","Unit 1 planning"),yt(m.src,fl="https://agents-course-the-tokenizer-playground.static.hf.space")||f(m,"src",fl),f(m,"frameborder","0"),f(m,"width","850"),f(m,"height","450"),yt(T.src,vl="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AutoregressionSchema.gif")||f(T,"src",vl),f(T,"alt","Визуализация процесса авторегрессионного декодирования"),f(T,"width","60%"),yt(H.src,dl="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/DecodingFinal.gif")||f(H,"src",dl),f(H,"alt","Визуализация процесса декодирования"),f(H,"width","60%"),yt(L.src,Hl="https://agents-course-decoding-visualizer.hf.space")||f(L,"src",Hl),f(L,"frameborder","0"),f(L,"width","850"),f(L,"height","450"),yt(o.src,Pl="https://agents-course-beam-search-visualizer.hf.space")||f(o,"src",Pl),f(o,"frameborder","0"),f(o,"width","850"),f(o,"height","450"),yt(h.src,wl="https://huggingface.co/datasets/agents-course/course-images/resolve/main/en/unit1/AttentionSceneFinal.gif")||f(h,"src",wl),f(h,"alt","Визуализация механизма Внимания"),f(h,"width","60%")},m(t,e){nn(document.head,a),n(t,c,e),n(t,g,e),n(t,kt,e),x(b,t,e),n(t,Ft,e),n(t,w,e),n(t,zt,e),n(t,E,e),n(t,Rt,e),n(t,y,e),n(t,Gt,e),n(t,k,e),n(t,jt,e),x(A,t,e),n(t,qt,e),n(t,I,e),n(t,Ot,e),n(t,S,e),n(t,Bt,e),n(t,F,e),n(t,Ut,e),n(t,z,e),n(t,Dt,e),n(t,R,e),n(t,Nt,e),n(t,G,e),n(t,Jt,e),n(t,j,e),n(t,Kt,e),n(t,q,e),n(t,Qt,e),n(t,O,e),n(t,Vt,e),n(t,B,e),n(t,Wt,e),n(t,U,e),n(t,Xt,e),n(t,m,e),n(t,Yt,e),n(t,D,e),n(t,Zt,e),n(t,N,e),n(t,te,e),n(t,J,e),n(t,ee,e),n(t,K,e),n(t,le,e),x(C,t,e),n(t,ne,e),x(Q,t,e),n(t,ie,e),n(t,V,e),n(t,se,e),n(t,T,e),n(t,re,e),n(t,W,e),n(t,pe,e),n(t,X,e),n(t,ue,e),n(t,Y,e),n(t,fe,e),n(t,H,e),n(t,ae,e),n(t,Z,e),n(t,ge,e),n(t,tt,e),n(t,me,e),n(t,et,e),n(t,Le,e),n(t,L,e),n(t,oe,e),n(t,lt,e),n(t,ve,e),n(t,o,e),n(t,Me,e),n(t,nt,e),n(t,xe,e),x(it,t,e),n(t,_e,e),n(t,st,e),n(t,de,e),n(t,h,e),n(t,$e,e),n(t,rt,e),n(t,Ce,e),n(t,pt,e),n(t,Te,e),x(ut,t,e),n(t,He,e),n(t,ft,e),n(t,he,e),n(t,at,e),n(t,Pe,e),x(gt,t,e),n(t,ce,e),n(t,mt,e),n(t,be,e),n(t,Lt,e),n(t,we,e),n(t,ot,e),n(t,Ee,e),x(vt,t,e),n(t,ye,e),n(t,Mt,e),n(t,ke,e),n(t,xt,e),n(t,Ae,e),n(t,_t,e),n(t,Ie,e),x(dt,t,e),n(t,Se,e),n(t,$t,e),n(t,Fe,e),n(t,Ct,e),n(t,ze,e),n(t,Tt,e),n(t,Re,e),n(t,Ge,e),n(t,je,e),n(t,Ht,e),n(t,qe,e),n(t,ht,e),n(t,Oe,e),n(t,Pt,e),n(t,Be,e),n(t,ct,e),n(t,Ue,e),n(t,bt,e),n(t,De,e),n(t,wt,e),n(t,Ne,e),x(Et,t,e),n(t,Je,e),n(t,At,e),Ke=!0},p(t,[e]){const Ql={};e&2&&(Ql.$$scope={dirty:e,ctx:t}),C.$set(Ql)},i(t){Ke||(_(b.$$.fragment,t),_(A.$$.fragment,t),_(C.$$.fragment,t),_(Q.$$.fragment,t),_(it.$$.fragment,t),_(ut.$$.fragment,t),_(gt.$$.fragment,t),_(vt.$$.fragment,t),_(dt.$$.fragment,t),_(Et.$$.fragment,t),Ke=!0)},o(t){d(b.$$.fragment,t),d(A.$$.fragment,t),d(C.$$.fragment,t),d(Q.$$.fragment,t),d(it.$$.fragment,t),d(ut.$$.fragment,t),d(gt.$$.fragment,t),d(vt.$$.fragment,t),d(dt.$$.fragment,t),d(Et.$$.fragment,t),Ke=!1},d(t){t&&(l(c),l(g),l(kt),l(Ft),l(w),l(zt),l(E),l(Rt),l(y),l(Gt),l(k),l(jt),l(qt),l(I),l(Ot),l(S),l(Bt),l(F),l(Ut),l(z),l(Dt),l(R),l(Nt),l(G),l(Jt),l(j),l(Kt),l(q),l(Qt),l(O),l(Vt),l(B),l(Wt),l(U),l(Xt),l(m),l(Yt),l(D),l(Zt),l(N),l(te),l(J),l(ee),l(K),l(le),l(ne),l(ie),l(V),l(se),l(T),l(re),l(W),l(pe),l(X),l(ue),l(Y),l(fe),l(H),l(ae),l(Z),l(ge),l(tt),l(me),l(et),l(Le),l(L),l(oe),l(lt),l(ve),l(o),l(Me),l(nt),l(xe),l(_e),l(st),l(de),l(h),l($e),l(rt),l(Ce),l(pt),l(Te),l(He),l(ft),l(he),l(at),l(Pe),l(ce),l(mt),l(be),l(Lt),l(we),l(ot),l(Ee),l(ye),l(Mt),l(ke),l(xt),l(Ae),l(_t),l(Ie),l(Se),l($t),l(Fe),l(Ct),l(ze),l(Tt),l(Re),l(Ge),l(je),l(Ht),l(qe),l(ht),l(Oe),l(Pt),l(Be),l(ct),l(Ue),l(bt),l(De),l(wt),l(Ne),l(Je),l(At)),l(a),$(b,t),$(A,t),$(C,t),$(Q,t),$(it,t),$(ut,t),$(gt,t),$(vt,t),$(dt,t),$(Et,t)}}}const fn='{"title":"Что такое LLM?","local":"что-такое-llm","sections":[{"title":"## Что такое Большая Языковая Модель?","local":"-что-такое-большая-языковая-модель","sections":[],"depth":2},{"title":"Понимание предсказания следующего токена.","local":"понимание-предсказания-следующего-токена","sections":[],"depth":2},{"title":"Внимание - это все, что вам нужно","local":"внимание---это-все-что-вам-нужно","sections":[],"depth":2},{"title":"Подсказки для LLM очень важны","local":"подсказки-для-llm-очень-важны","sections":[],"depth":2},{"title":"Как обучаются LLM?","local":"как-обучаются-llm","sections":[],"depth":2},{"title":"Как я могу использовать LLM?","local":"как-я-могу-использовать-llm","sections":[],"depth":2},{"title":"Как LLM используются в AI Агентах?","local":"как-llm-используются-в-ai-агентах","sections":[],"depth":2}],"depth":1}';function an(St){return Wl(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class vn extends Yl{constructor(a){super(),Zl(this,a,an,un,Vl,{})}}export{vn as component};

Xet Storage Details

Size:
34.5 kB
·
Xet hash:
769226a81dbacc05b54672239d4f3ddd6cc1f74dd0cfd7829e8c7bda73758a1d

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.