Buckets:

rtrm's picture
download
raw
7.3 kB
import{s as Z,n as tt,o as et}from"../chunks/scheduler.37c15a92.js";import{S as nt,i as lt,g as m,s,r as L,A as st,h as p,f as n,c as a,j as X,u as b,x as P,k as Y,y as at,a as l,v as w,d as N,t as E,w as T}from"../chunks/index.2bf4358c.js";import{C as it}from"../chunks/CourseFloatingBanner.9ff4c771.js";import{H as R,E as mt}from"../chunks/getInferenceSnippets.2e662937.js";function pt(D){let i,M,v,q,r,y,o,H,f,I="Прежде, чем перейти к трансформерам, сделаем быстрый обзор того, что такое обработка естественного языка (NLP), и почему мы заинтересованы в этой сфере.",z,$,S,u,J="NLP - область лингвистики и машинного обучения, которая изучает все, что связано с естественными языками. Главная цель NLP не просто понимать отдельные слова, но и иметь возможность понимать контекст, в котором эти слова находятся.",k,g,K="Список типичных NLP-задач с некоторыми примерами:",A,_,Q="<li><strong>Классификация предложений</strong>: определить эмоциональную окраску отзыва, детектировать среди входящих писем спам, определить грамматическую правильность предложения или даже проверить, являются ли два предложения связанными между собой логически</li> <li><strong>Классификация каждого слова в предложении</strong>: вычленить грамматические составляющие предложения (существительное, глагол, прилагательное) или определить именованные сущности (персона, локация, организация)</li> <li><strong>Генерация текста</strong>: закончить предложение на основе некоторого запроса, заполнить пропуски в тексте, содержащем замаскированные слова</li> <li><strong>Сформулировать ответ на вопрос</strong>: получить ответ на заданный по тексту вопрос</li> <li><strong>Сгенерировать новое предложение исходя из предложенного</strong>: перевести текст с одного языка на другой, выполнить автоматическое реферирование текста</li>",U,x,V="NLP не ограничивается только письменным текстом. Есть множество сложных задач, связанных с распознаванием речи и компьютерным зрением, таких как транскрибирование аудио или описание изображений.",j,h,B,c,W="Компьютеры не обрабатывают информацию так же, как люди. Например, когда мы читаем предложение «Я голоден», мы можем легко понять его значение. Точно так же, имея два предложения, такие как «Я голоден» и «Мне грустно», мы можем легко определить, насколько они похожи. Для моделей машинного обучения (ML) такие задачи сложнее. Текст должен быть обработан так, чтобы модель могла учиться на нем. А поскольку язык сложен, нам нужно тщательно продумать, как должна выполняться эта обработка. Было проведено много исследований того, как представлять текст, и мы рассмотрим некоторые методы в следующей главе.",F,C,G,d,O;return r=new R({props:{title:"Обработка естественного языка",local:"обработка-естественного-языка",headingTag:"h1"}}),o=new it({props:{chapter:1,classNames:"absolute z-10 right-0 top-0"}}),$=new R({props:{title:"Что такое NLP?",local:"что-такое-nlp",headingTag:"h2"}}),h=new R({props:{title:"Почему это сложно?",local:"почему-это-сложно",headingTag:"h2"}}),C=new mt({props:{source:"https://github.com/huggingface/course/blob/main/chapters/ru/chapter1/2.mdx"}}),{c(){i=m("meta"),M=s(),v=m("p"),q=s(),L(r.$$.fragment),y=s(),L(o.$$.fragment),H=s(),f=m("p"),f.textContent=I,z=s(),L($.$$.fragment),S=s(),u=m("p"),u.textContent=J,k=s(),g=m("p"),g.textContent=K,A=s(),_=m("ul"),_.innerHTML=Q,U=s(),x=m("p"),x.textContent=V,j=s(),L(h.$$.fragment),B=s(),c=m("p"),c.textContent=W,F=s(),L(C.$$.fragment),G=s(),d=m("p"),this.h()},l(t){const e=st("svelte-u9bgzb",document.head);i=p(e,"META",{name:!0,content:!0}),e.forEach(n),M=a(t),v=p(t,"P",{}),X(v).forEach(n),q=a(t),b(r.$$.fragment,t),y=a(t),b(o.$$.fragment,t),H=a(t),f=p(t,"P",{"data-svelte-h":!0}),P(f)!=="svelte-1t9ne0p"&&(f.textContent=I),z=a(t),b($.$$.fragment,t),S=a(t),u=p(t,"P",{"data-svelte-h":!0}),P(u)!=="svelte-18quq2q"&&(u.textContent=J),k=a(t),g=p(t,"P",{"data-svelte-h":!0}),P(g)!=="svelte-1bld15h"&&(g.textContent=K),A=a(t),_=p(t,"UL",{"data-svelte-h":!0}),P(_)!=="svelte-pd7kd3"&&(_.innerHTML=Q),U=a(t),x=p(t,"P",{"data-svelte-h":!0}),P(x)!=="svelte-1pi3izm"&&(x.textContent=V),j=a(t),b(h.$$.fragment,t),B=a(t),c=p(t,"P",{"data-svelte-h":!0}),P(c)!=="svelte-1sh17lt"&&(c.textContent=W),F=a(t),b(C.$$.fragment,t),G=a(t),d=p(t,"P",{}),X(d).forEach(n),this.h()},h(){Y(i,"name","hf:doc:metadata"),Y(i,"content",rt)},m(t,e){at(document.head,i),l(t,M,e),l(t,v,e),l(t,q,e),w(r,t,e),l(t,y,e),w(o,t,e),l(t,H,e),l(t,f,e),l(t,z,e),w($,t,e),l(t,S,e),l(t,u,e),l(t,k,e),l(t,g,e),l(t,A,e),l(t,_,e),l(t,U,e),l(t,x,e),l(t,j,e),w(h,t,e),l(t,B,e),l(t,c,e),l(t,F,e),w(C,t,e),l(t,G,e),l(t,d,e),O=!0},p:tt,i(t){O||(N(r.$$.fragment,t),N(o.$$.fragment,t),N($.$$.fragment,t),N(h.$$.fragment,t),N(C.$$.fragment,t),O=!0)},o(t){E(r.$$.fragment,t),E(o.$$.fragment,t),E($.$$.fragment,t),E(h.$$.fragment,t),E(C.$$.fragment,t),O=!1},d(t){t&&(n(M),n(v),n(q),n(y),n(H),n(f),n(z),n(S),n(u),n(k),n(g),n(A),n(_),n(U),n(x),n(j),n(B),n(c),n(F),n(G),n(d)),n(i),T(r,t),T(o,t),T($,t),T(h,t),T(C,t)}}}const rt='{"title":"Обработка естественного языка","local":"обработка-естественного-языка","sections":[{"title":"Что такое NLP?","local":"что-такое-nlp","sections":[],"depth":2},{"title":"Почему это сложно?","local":"почему-это-сложно","sections":[],"depth":2}],"depth":1}';function ot(D){return et(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class _t extends nt{constructor(i){super(),lt(this,i,ot,pt,Z,{})}}export{_t as component};

Xet Storage Details

Size:
7.3 kB
·
Xet hash:
48c0dc0fa553e014db868082c79efee4abef350bb6f6e211eb95a7f3128b0177

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.