Buckets:

rtrm's picture
download
raw
8.38 kB
import{s as ge,n as ve,o as xe}from"../chunks/scheduler.893fe8c9.js";import{S as $e,i as be,e as l,s as n,c as T,h as Le,a as u,d as i,b as r,f as fe,g as w,j as s,k as de,l as Ce,m as a,n as j,t as N,o as A,p as y}from"../chunks/index.6ee278c6.js";import{C as ze,H as te,E as Pe}from"../chunks/MermaidChart.svelte_svelte_type_style_lang.278b228a.js";import{C as _e}from"../chunks/CourseFloatingBanner.b51f5100.js";function he(ie){let o,S,H,D,m,G,c,q,p,k,f,ae="Înainte de a trece la modelele Transformer, haideți să facem o prezentare scurtă despre ce este procesarea limbajului natural și de ce ne interesează.",U,d,B,g,ne="NLP este un domeniu al lingvisticii și al învățării automate axat pe înțelegerea a tot ceea ce este legat de limbajul uman. Scopul sarcinilor NLP nu este doar înțelegerea individuală a cuvintelor, ci și capacitatea de a înțelege contextul acelor cuvinte.",F,v,re="În continuare urmează o listă a sarcinilor obișnuite de NLP, cu câteva exemple pentru fiecare:",I,x,le="<li><strong>Clasificarea propozițiilor întregi</strong>: Determinarea caracterului unei recenzii, detectarea dacă un e-mail este spam, determinarea dacă o propoziție este corectă gramatical sau dacă două propoziții sunt legate logic sau nu</li> <li><strong>Clasificarea fiecărui cuvânt dintr-o propoziție</strong>: Identificarea componentelor gramaticale ale unei propoziții (substantiv, verb, adjectiv) sau a entităților nominalizate (persoană, locație, organizație)</li> <li><strong>Generarea conținutului de text</strong>: Completarea unui prompt cu text generat automat, completarea spațiilor goale dintr-un text cu cuvinte mascate</li> <li><strong>Extragerea unui răspuns dintr-un text</strong>: Având o întrebare și un context, se extrage răspunsul la întrebare pe baza informațiilor furnizate în context</li> <li><strong>Generarea unei propoziții noi dintr-un text de intrare</strong>: Traducerea unui text într-o altă limbă, rezumarea textului</li>",O,$,ue="NLP nu se limitează însă la textul scris. De asemenea, NLP abordează provocări complexe în domeniul recunoașterii vorbirii și al viziunii computerizate, cum ar fi generarea unei transcrieri a unui fragment audio sau a unei descrieri a unei imagini.",R,b,J,L,se='În ultimii ani, domeniul NLP a fost revoluționat de Large Language Models (LLM-uri). Aceste modele, care includ arhitecturi precum GPT (Generative Pre-trained Transformer) și <a href="https://huggingface.co/meta-llama" rel="nofollow">Llama</a>, au transformat ceea ce este posibil în procesarea limbajului.',K,C,oe="LLM-urile se caracterizează prin:",Q,z,me="<li><strong>Mărime</strong>: Conțin milioane, miliarde sau chiar sute de miliarde de parametri</li> <li><strong>Capacități generale</strong>: Pot realiza multiple sarcini fără antrenament specific pentru fiecare sarcină</li> <li><strong>Învățare în context</strong>: Pot învăța din exemplele oferite în prompt</li> <li><strong>Abilități emergente</strong>: Pe măsură ce aceste modele cresc în dimensiune, demonstrează capacități care nu au fost programate sau anticipate în mod explicit</li>",V,P,ce="Apariția LLM-urilor a schimbat paradigma de la construirea unor modele specializate pentru sarcini NLP specifice la utilizarea unui singur model mare care poate fi direcționat prin prompturi sau ajustat pentru a aborda o gamă largă de sarcini lingvistice. Acest lucru a făcut procesarea sofisticată a limbajului mai accesibilă, dar a introdus și noi provocări în domenii precum eficiența, etica și implementarea.",W,_,X,h,pe="Computerele nu procesează informațiile în același mod ca oamenii. De exemplu, atunci când citim propoziția „Mi-e foame”, îi putem înțelege cu ușurință semnificația. În mod similar, având în vedere două propoziții precum „Mi-e foame” și „Sunt trist”, suntem capabili să determinăm cu ușurință cât de asemănătoare sunt acestea. Pentru modelele de învățare automată (ML), astfel de sarcini sunt mai dificile. Textul trebuie prelucrat într-un mod care să permită modelului să învețe din conținutul său. Și deoarece limbajul este complex, trebuie să ne gândim cu atenție la modul optim de a realiza această procesare. Au fost efectuate numeroase cercetări cu privire la modul de reprezentare a textului și vom analiza câteva metode în capitolul următor.",Y,M,Z,E,ee;return m=new ze({props:{containerStyle:"float: right; margin-left: 10px; display: inline-flex; position: relative; z-index: 10;"}}),c=new te({props:{title:"Procesarea limbajului natural",local:"procesarea-limbajului-natural",headingTag:"h1"}}),p=new _e({props:{chapter:1,classNames:"absolute z-10 right-0 top-0"}}),d=new te({props:{title:"Ce este NLP?",local:"ce-este-nlp",headingTag:"h2"}}),b=new te({props:{title:"Ascensiunea a Large Language Models (LLM-uri)",local:"rise-of-llms",headingTag:"h2"}}),_=new te({props:{title:"De ce este o provocare?",local:"de-ce-este-o-provocare",headingTag:"h2"}}),M=new Pe({props:{source:"https://github.com/huggingface/course/blob/main/chapters/ro/chapter1/2.mdx"}}),{c(){o=l("meta"),S=n(),H=l("p"),D=n(),T(m.$$.fragment),G=n(),T(c.$$.fragment),q=n(),T(p.$$.fragment),k=n(),f=l("p"),f.textContent=ae,U=n(),T(d.$$.fragment),B=n(),g=l("p"),g.textContent=ne,F=n(),v=l("p"),v.textContent=re,I=n(),x=l("ul"),x.innerHTML=le,O=n(),$=l("p"),$.textContent=ue,R=n(),T(b.$$.fragment),J=n(),L=l("p"),L.innerHTML=se,K=n(),C=l("p"),C.textContent=oe,Q=n(),z=l("ul"),z.innerHTML=me,V=n(),P=l("p"),P.textContent=ce,W=n(),T(_.$$.fragment),X=n(),h=l("p"),h.textContent=pe,Y=n(),T(M.$$.fragment),Z=n(),E=l("p"),this.h()},l(e){const t=Le("svelte-u9bgzb",document.head);o=u(t,"META",{name:!0,content:!0}),t.forEach(i),S=r(e),H=u(e,"P",{}),fe(H).forEach(i),D=r(e),w(m.$$.fragment,e),G=r(e),w(c.$$.fragment,e),q=r(e),w(p.$$.fragment,e),k=r(e),f=u(e,"P",{"data-svelte-h":!0}),s(f)!=="svelte-fmbegq"&&(f.textContent=ae),U=r(e),w(d.$$.fragment,e),B=r(e),g=u(e,"P",{"data-svelte-h":!0}),s(g)!=="svelte-8sq7wi"&&(g.textContent=ne),F=r(e),v=u(e,"P",{"data-svelte-h":!0}),s(v)!=="svelte-wl0akb"&&(v.textContent=re),I=r(e),x=u(e,"UL",{"data-svelte-h":!0}),s(x)!=="svelte-11rvr2i"&&(x.innerHTML=le),O=r(e),$=u(e,"P",{"data-svelte-h":!0}),s($)!=="svelte-o1yxna"&&($.textContent=ue),R=r(e),w(b.$$.fragment,e),J=r(e),L=u(e,"P",{"data-svelte-h":!0}),s(L)!=="svelte-t2pbhi"&&(L.innerHTML=se),K=r(e),C=u(e,"P",{"data-svelte-h":!0}),s(C)!=="svelte-1xugikh"&&(C.textContent=oe),Q=r(e),z=u(e,"UL",{"data-svelte-h":!0}),s(z)!=="svelte-7j2qxw"&&(z.innerHTML=me),V=r(e),P=u(e,"P",{"data-svelte-h":!0}),s(P)!=="svelte-1lmscm4"&&(P.textContent=ce),W=r(e),w(_.$$.fragment,e),X=r(e),h=u(e,"P",{"data-svelte-h":!0}),s(h)!=="svelte-1p2hnvv"&&(h.textContent=pe),Y=r(e),w(M.$$.fragment,e),Z=r(e),E=u(e,"P",{}),fe(E).forEach(i),this.h()},h(){de(o,"name","hf:doc:metadata"),de(o,"content",Me)},m(e,t){Ce(document.head,o),a(e,S,t),a(e,H,t),a(e,D,t),j(m,e,t),a(e,G,t),j(c,e,t),a(e,q,t),j(p,e,t),a(e,k,t),a(e,f,t),a(e,U,t),j(d,e,t),a(e,B,t),a(e,g,t),a(e,F,t),a(e,v,t),a(e,I,t),a(e,x,t),a(e,O,t),a(e,$,t),a(e,R,t),j(b,e,t),a(e,J,t),a(e,L,t),a(e,K,t),a(e,C,t),a(e,Q,t),a(e,z,t),a(e,V,t),a(e,P,t),a(e,W,t),j(_,e,t),a(e,X,t),a(e,h,t),a(e,Y,t),j(M,e,t),a(e,Z,t),a(e,E,t),ee=!0},p:ve,i(e){ee||(N(m.$$.fragment,e),N(c.$$.fragment,e),N(p.$$.fragment,e),N(d.$$.fragment,e),N(b.$$.fragment,e),N(_.$$.fragment,e),N(M.$$.fragment,e),ee=!0)},o(e){A(m.$$.fragment,e),A(c.$$.fragment,e),A(p.$$.fragment,e),A(d.$$.fragment,e),A(b.$$.fragment,e),A(_.$$.fragment,e),A(M.$$.fragment,e),ee=!1},d(e){e&&(i(S),i(H),i(D),i(G),i(q),i(k),i(f),i(U),i(B),i(g),i(F),i(v),i(I),i(x),i(O),i($),i(R),i(J),i(L),i(K),i(C),i(Q),i(z),i(V),i(P),i(W),i(X),i(h),i(Y),i(Z),i(E)),i(o),y(m,e),y(c,e),y(p,e),y(d,e),y(b,e),y(_,e),y(M,e)}}}const Me='{"title":"Procesarea limbajului natural","local":"procesarea-limbajului-natural","sections":[{"title":"Ce este NLP?","local":"ce-este-nlp","sections":[],"depth":2},{"title":"Ascensiunea a Large Language Models (LLM-uri)","local":"rise-of-llms","sections":[],"depth":2},{"title":"De ce este o provocare?","local":"de-ce-este-o-provocare","sections":[],"depth":2}],"depth":1}';function Te(ie){return xe(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class ye extends $e{constructor(o){super(),be(this,o,Te,he,ge,{})}}export{ye as component};

Xet Storage Details

Size:
8.38 kB
·
Xet hash:
ff91d8ce106cf25a2c89aa1182199a3d650457004ed0141487b243cedb72a1fe

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.