Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / course /pr_1108 /te /_app /immutable /nodes /6.d4fafbcf.js

rtrm's picture

about 2 months ago

16.8 kB

import{s as dt,n as ct,o as yt}from"../chunks/scheduler.c9113122.js";import{S as Ht,i as zt,e as i,s,c as z,h as Et,a as r,d as l,b as a,f as Nt,g as E,j as g,l as mt,m as Ut,n,o as U,p as k,q,r as I}from"../chunks/index.582126dc.js";import{Y as kt}from"../chunks/Youtube.d108bf3a.js";import{C as qt}from"../chunks/CourseFloatingBanner.38cd785d.js";import{H as ut,E as It}from"../chunks/MermaidChart.svelte_svelte_type_style_lang.59d6f068.js";function jt(pt){let u,G,j,O,p,S,o,B,f,ot="Transformer మోడల్స్‌లోకి వెళ్లే ముందు, Natural Language Processing అంటే ఏమిటి, Large Language Models ఈ రంగాన్ని ఎలా మార్చాయి మరియు మనం దాని గురించి ఎందుకు శ్రద్ధ వహించాలి అనే దానిపై త్వరగా ఒక అవలోకనం చేద్దాం.",Y,L,F,$,K,v,ft="NLP అనేది మానవ భాషకు సంబంధించిన ప్రతిదాన్ని అర్థం చేసుకోవడంపై దృష్టి సారించే భాషాశాస్త్రం మరియు మెషిన్ లెర్నింగ్ రంగం. NLP పనుల లక్ష్యం కేవలం ఒక్కొక్క పదాన్ని వ్యక్తిగతంగా అర్థం చేసుకోవడం మాత్రమే కాదు, ఆ పదాల సందర్భాన్ని అర్థం చేసుకోగలగడం.",Q,x,Lt="సాధారణ NLP పనుల జాబితా క్రింద ఇవ్వబడింది, ప్రతిదానికి కొన్ని ఉదాహరణలతో:",R,C,$t="<li><strong>మొత్తం వాక్యాలను వర్గీకరించడం</strong>: ఒక సమీక్ష యొక్క భావనను పొందడం, ఒక ఇమెయిల్ స్పామా కాదా అని గుర్తించడం, ఒక వాక్యం వ్యాకరణపరంగా సరైనదా లేదా రెండు వాక్యాలు తార్కికంగా సంబంధం కలిగి ఉన్నాయా లేదా అని నిర్ణయించడం.</li> <li><strong>ఒక వాక్యంలో ప్రతి పదాన్ని వర్గీకరించడం</strong>: ఒక వాక్యం యొక్క వ్యాకరణ భాగాలను (నామవాచకం, క్రియ, విశేషణం) లేదా పేరున్న ఎంటిటీలను (వ్యక్తి, స్థలం, సంస్థ) గుర్తించడం</li> <li><strong>వచన కంటెంట్‌ను రూపొందించడం</strong>: స్వయంచాలకంగా సృష్టించబడిన వచనంతో ఒక ప్రాంప్ట్‌ను పూర్తి చేయడం, మాస్క్ చేయబడిన పదాలతో ఒక వచనంలో ఖాళీలను పూరించడం.</li> <li><strong>ఒక వచనం నుండి సమాధానాన్ని సేకరించడం</strong>: ఒక ప్రశ్న మరియు సందర్భం ఇచ్చినప్పుడు, సందర్భంలో అందించబడిన సమాచారం ఆధారంగా ప్రశ్నకు సమాధానాన్ని సేకరించడం.</li> <li><strong>ఇన్‌పుట్ వచనం నుండి కొత్త వాక్యాన్ని రూపొందించడం</strong>: ఒక వచనాన్ని మరొక భాషలోకి అనువదించడం, ఒక వచనాన్ని సంగ్రహించడం.</li>",W,P,vt="NLP కేవలం వ్రాతపూర్వక వచనానికి మాత్రమే పరిమితం కాదు. ఇది ప్రసంగ గుర్తింపు మరియు కంప్యూటర్ విజన్‌లో సంక్లిష్ట సవాళ్లను కూడా పరిష్కరిస్తుంది, ఉదాహరణకు ఆడియో నమూనా యొక్క ట్రాన్స్‌క్రిప్ట్ లేదా చిత్రం యొక్క వివరణను రూపొందించడం వంటివి.",D,M,J,_,xt='ఇటీవలి సంవత్సరాలలో, NLP రంగం Large Language Models (LLMs) ద్వారా విప్లవాత్మకంగా మారింది. GPT (Generative Pre-trained Transformer) మరియు <a href="https://huggingface.co/meta-llama" rel="nofollow">Llama</a>, వంటి ఆర్కిటెక్చర్లను కలిగి ఉన్న ఈ మోడల్స్, భాషా ప్రాసెసింగ్‌లో సాధ్యమయ్యే వాటిని మార్చాయి.',V,m,Ct="<p>ఒక Large Language Model (LLM) అనేది భారీ మొత్తంలో వచన డేటాపై శిక్షణ పొందిన ఒక AI మోడల్, ఇది మానవ-వంటి వచనాన్ని అర్థం చేసుకోగలదు మరియు ఉత్పత్తి చేయగలదు, భాషలో నమూనాలను గుర్తించగలదు మరియు టాస్క్-నిర్దిష్ట శిక్షణ లేకుండా విస్తృత శ్రేణి భాషా పనులను చేయగలదు. అవి Natural Language Processing (NLP) రంగంలో గణనీయమైన పురోగతిని సూచిస్తాయి.</p>",X,w,Pt="LLMలు వీటి ద్వారా వర్గీకరించబడతాయి:",Z,h,Mt="<li><strong>ప్రమాణం</strong>: ఇవి లక్షల, బిలియన్ల లేదా సెంట్స్ బిలియన్ల పరామితులను కలిగి ఉంటాయి</li> <li><strong>సామాన్య సామర్థ్యాలు</strong>: ఇవి టాస్క్-నిర్దిష్ట శిక్షణ లేకుండా అనేక పనులను నిర్వహించగలవు</li> <li><strong>ఇన్-కాంటెక్స్ట్ లెర్నింగ్</strong>: ఇవి ప్రాంప్ట్‌లో అందించిన ఉదాహరణల నుండి నేర్చుకోవచ్చు</li> <li><strong>ఉద్భవించే సామర్థ్యాలు</strong>: ఈ మోడల్స్ పరిమాణంలో పెరిగేకొద్దీ, అవి స్పష్టంగా ప్రోగ్రామ్ చేయబడని లేదా ఊహించని సామర్థ్యాలను ప్రదర్శిస్తాయి</li>",tt,T,_t="LLMల ఉద్భవం, ప్రత్యేక NLP పనుల కోసం ప్రత్యేక మోడల్స్‌ను నిర్మించడంనుంచి, విస్తృత శ్రేణా భాషా పనులను పరిష్కరించడానికి ప్రాంప్ట్ చేయబడిన లేదా ఫైన్-ట్యూన్ చేయబడిన ఒక పెద్ద మోడల్‌ను ఉపయోగించడం వరకు మార్పు తీసుకువచ్చింది. ఇది సాంకేతిక భాషా ప్రాసెసింగ్‌ను మరింత అందుబాటులోకి తెచ్చింది, కానీ సమర్థత, నైతికత మరియు అమలు వంటి కొత్త సవాళ్లను కూడా పరిచయం చేసింది.",et,b,wt="LLMలు కూడా ముఖ్యమైన పరిమితులను కలిగి ఉంటాయి:",lt,N,ht="<li><strong>హాల్యూసినేషన్స్</strong>: అవి తప్పు సమాచారాన్ని నమ్మకంగా ఉత్పత్తి చేయగలవు</li> <li><strong>నిజమైన అర్థం లేకపోవడం</strong>: అవి ప్రపంచాన్ని నిజంగా అర్థం చేసుకోలేవు మరియు కేవలం గణాంక నమూనాలపై పనిచేస్తాయి</li> <li><strong>పక్షపాతం</strong>: అవి శిక్షణ డేటా లేదా ఇన్‌పుట్‌లో ఉన్న పక్షపాతాన్ని పునరావృతించవచ్చు</li> <li><strong>కాంటెక్స్ట్ విండోలు</strong>: అవి పరిమిత సందర్భ విండోలను కలిగి ఉంటాయి (అయితే ఇది మెరుగుపడుతోంది)</li> <li><strong>కంప్యూటేషనల్ వనరులు</strong>: అవి గణనీయమైన కంప్యూటేషనల్ వనరులను అవసరం</li>",nt,d,st,c,Tt="కంప్యూటర్లు మానవులు ప్రాసెస్ చేసే విధంగా సమాచారాన్ని ప్రాసెస్ చేయవు. ఉదాహరణకు, మనం “I am hungry” అనే వాక్యాన్ని చదివినప్పుడు, మనం దాని అర్థాన్ని సులభంగా అర్థం చేసుకోగలం. అదేవిధంగా, “I am hungry” మరియు “I am sad” వంటి రెండు వాక్యాలు ఇచ్చినప్పుడు, అవి ఎంత సారూప్యంగా ఉన్నాయో మనం సులభంగా నిర్ణయించగలం. మెషిన్ లెర్నింగ్ (ML) మోడల్స్‌కు, అటువంటి పనులు మరింత కష్టం. మోడల్ దాని నుండి నేర్చుకోవడానికి వీలుగా వచనాన్ని ప్రాసెస్ చేయాలి. మరియు భాష సంక్లిష్టంగా ఉన్నందున, ఈ ప్రాసెసింగ్ ఎలా చేయబడాలి అనే దాని గురించి మనం జాగ్రత్తగా ఆలోచించాలి. వచనాన్ని ఎలా సూచించాలో చాలా పరిశోధనలు జరిగాయి, మరియు తదుపరి అధ్యాయంలో కొన్ని పద్ధతులను చూద్దాం.",at,y,bt="LLMలలో పురోగతి ఉన్నప్పటికీ, అనేక ప్రాథమిక సవాళ్లు అలాగే ఉన్నాయి. వీటిలో అస్పష్టత, సాంస్కృతిక సందర్భం, వ్యంగ్యం మరియు హాస్యం అర్థం చేసుకోవడం ఉన్నాయి. LLMలు విభిన్న డేటాసెట్‌లపై భారీ శిక్షణ ద్వారా ఈ సవాళ్లను పరిష్కరిస్తాయి, అయితే అనేక సంక్లిష్ట దృశ్యాలలో మానవ-స్థాయి అవగాహనకు తరచుగా తక్కువగా ఉంటాయి.",it,H,rt,A,gt;return p=new ut({props:{title:"Natural Language Processing (NLP) మరియు Large Language Models (LLMs)",local:"natural-language-processing-and-large-language-models",headingTag:"h1"}}),o=new qt({props:{chapter:1,classNames:"absolute z-10 right-0 top-0"}}),L=new ut({props:{title:"NLP అంటే ఏమిటి?",local:"what-is-nlp",headingTag:"h2"}}),$=new kt({props:{id:"iNzlxWUAjd4"}}),M=new ut({props:{title:"Large Language Models (LLMs) పెరుగుదల",local:"rise-of-llms",headingTag:"h2"}}),d=new ut({props:{title:"భాషా ప్రాసెసింగ్ ఎందుకు సవాలుగా ఉంది?",local:"why-is-it-challenging",headingTag:"h2"}}),H=new It({props:{source:"https://github.com/huggingface/course/blob/main/chapters/te/chapter1/2.mdx"}}),{c(){u=i("meta"),G=s(),j=i("p"),O=s(),z(p.$$.fragment),S=s(),z(o.$$.fragment),B=s(),f=i("p"),f.textContent=ot,Y=s(),z(L.$$.fragment),F=s(),z($.$$.fragment),K=s(),v=i("p"),v.textContent=ft,Q=s(),x=i("p"),x.textContent=Lt,R=s(),C=i("ul"),C.innerHTML=$t,W=s(),P=i("p"),P.textContent=vt,D=s(),z(M.$$.fragment),J=s(),_=i("p"),_.innerHTML=xt,V=s(),m=i("blockquote"),m.innerHTML=Ct,X=s(),w=i("p"),w.textContent=Pt,Z=s(),h=i("ul"),h.innerHTML=Mt,tt=s(),T=i("p"),T.textContent=_t,et=s(),b=i("p"),b.textContent=wt,lt=s(),N=i("ul"),N.innerHTML=ht,nt=s(),z(d.$$.fragment),st=s(),c=i("p"),c.textContent=Tt,at=s(),y=i("p"),y.textContent=bt,it=s(),z(H.$$.fragment),rt=s(),A=i("p"),this.h()},l(t){const e=Et("svelte-u9bgzb",document.head);u=r(e,"META",{name:!0,content:!0}),e.forEach(l),G=a(t),j=r(t,"P",{}),Nt(j).forEach(l),O=a(t),E(p.$$.fragment,t),S=a(t),E(o.$$.fragment,t),B=a(t),f=r(t,"P",{"data-svelte-h":!0}),g(f)!=="svelte-1ybvyhz"&&(f.textContent=ot),Y=a(t),E(L.$$.fragment,t),F=a(t),E($.$$.fragment,t),K=a(t),v=r(t,"P",{"data-svelte-h":!0}),g(v)!=="svelte-uucd1y"&&(v.textContent=ft),Q=a(t),x=r(t,"P",{"data-svelte-h":!0}),g(x)!=="svelte-13p6vuc"&&(x.textContent=Lt),R=a(t),C=r(t,"UL",{"data-svelte-h":!0}),g(C)!=="svelte-1bifuc"&&(C.innerHTML=$t),W=a(t),P=r(t,"P",{"data-svelte-h":!0}),g(P)!=="svelte-1t14zwz"&&(P.textContent=vt),D=a(t),E(M.$$.fragment,t),J=a(t),_=r(t,"P",{"data-svelte-h":!0}),g(_)!=="svelte-1pcvz1v"&&(_.innerHTML=xt),V=a(t),m=r(t,"BLOCKQUOTE",{class:!0,"data-svelte-h":!0}),g(m)!=="svelte-1k3av7"&&(m.innerHTML=Ct),X=a(t),w=r(t,"P",{"data-svelte-h":!0}),g(w)!=="svelte-1bah405"&&(w.textContent=Pt),Z=a(t),h=r(t,"UL",{"data-svelte-h":!0}),g(h)!=="svelte-1wlfw0e"&&(h.innerHTML=Mt),tt=a(t),T=r(t,"P",{"data-svelte-h":!0}),g(T)!=="svelte-iq2opf"&&(T.textContent=_t),et=a(t),b=r(t,"P",{"data-svelte-h":!0}),g(b)!=="svelte-1wogwhj"&&(b.textContent=wt),lt=a(t),N=r(t,"UL",{"data-svelte-h":!0}),g(N)!=="svelte-zr04zt"&&(N.innerHTML=ht),nt=a(t),E(d.$$.fragment,t),st=a(t),c=r(t,"P",{"data-svelte-h":!0}),g(c)!=="svelte-1ldwk5o"&&(c.textContent=Tt),at=a(t),y=r(t,"P",{"data-svelte-h":!0}),g(y)!=="svelte-15zw7yk"&&(y.textContent=bt),it=a(t),E(H.$$.fragment,t),rt=a(t),A=r(t,"P",{}),Nt(A).forEach(l),this.h()},h(){mt(u,"name","hf:doc:metadata"),mt(u,"content",At),mt(m,"class","tip")},m(t,e){Ut(document.head,u),n(t,G,e),n(t,j,e),n(t,O,e),U(p,t,e),n(t,S,e),U(o,t,e),n(t,B,e),n(t,f,e),n(t,Y,e),U(L,t,e),n(t,F,e),U($,t,e),n(t,K,e),n(t,v,e),n(t,Q,e),n(t,x,e),n(t,R,e),n(t,C,e),n(t,W,e),n(t,P,e),n(t,D,e),U(M,t,e),n(t,J,e),n(t,_,e),n(t,V,e),n(t,m,e),n(t,X,e),n(t,w,e),n(t,Z,e),n(t,h,e),n(t,tt,e),n(t,T,e),n(t,et,e),n(t,b,e),n(t,lt,e),n(t,N,e),n(t,nt,e),U(d,t,e),n(t,st,e),n(t,c,e),n(t,at,e),n(t,y,e),n(t,it,e),U(H,t,e),n(t,rt,e),n(t,A,e),gt=!0},p:ct,i(t){gt||(k(p.$$.fragment,t),k(o.$$.fragment,t),k(L.$$.fragment,t),k($.$$.fragment,t),k(M.$$.fragment,t),k(d.$$.fragment,t),k(H.$$.fragment,t),gt=!0)},o(t){q(p.$$.fragment,t),q(o.$$.fragment,t),q(L.$$.fragment,t),q($.$$.fragment,t),q(M.$$.fragment,t),q(d.$$.fragment,t),q(H.$$.fragment,t),gt=!1},d(t){t&&(l(G),l(j),l(O),l(S),l(B),l(f),l(Y),l(F),l(K),l(v),l(Q),l(x),l(R),l(C),l(W),l(P),l(D),l(J),l(_),l(V),l(m),l(X),l(w),l(Z),l(h),l(tt),l(T),l(et),l(b),l(lt),l(N),l(nt),l(st),l(c),l(at),l(y),l(it),l(rt),l(A)),l(u),I(p,t),I(o,t),I(L,t),I($,t),I(M,t),I(d,t),I(H,t)}}}const At='{"title":"Natural Language Processing (NLP) మరియు Large Language Models (LLMs)","local":"natural-language-processing-and-large-language-models","sections":[{"title":"NLP అంటే ఏమిటి?","local":"what-is-nlp","sections":[],"depth":2},{"title":"Large Language Models (LLMs) పెరుగుదల","local":"rise-of-llms","sections":[],"depth":2},{"title":"భాషా ప్రాసెసింగ్ ఎందుకు సవాలుగా ఉంది?","local":"why-is-it-challenging","sections":[],"depth":2}],"depth":1}';function Gt(pt){return yt(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class Kt extends Ht{constructor(u){super(),zt(this,u,Gt,jt,dt,{})}}export{Kt as component};

Xet Storage Details

Size:: 16.8 kB
Xet hash:: f03c9571e6fd039f173de5c0e2b9e379c423385d870912221a578f56189be6e0

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.