Buckets:

rtrm's picture
download
raw
47 kB
import{s as Kl,f as Ql,o as Nl,n as Dt}from"../chunks/scheduler.1d51f4c0.js";import{S as Vl,i as Yl,g as r,s as f,r as a,A as Jl,h as m,f as l,c as i,j as We,u as o,x as $,k as w,y as Wl,a as n,v as d,d as u,t as v,w as x}from"../chunks/index.85d39492.js";import{T as yt,Y as Xe}from"../chunks/Youtube.4f1624ff.js";import{C as Xl}from"../chunks/CourseFloatingBanner.5978eac6.js";import{H as L,E as Zl}from"../chunks/getInferenceSnippets.3734ed7d.js";function tn(h){let s,C="చాలా Transformer నమూనాలు మూడు నిర్మాణాలలో ఒకదాన్ని ఉపయోగిస్తాయని గుర్తుంచుకోండి: ఎన్‌కోడర్-మాత్రమే, డీకోడర్-మాత్రమే లేదా ఎన్‌కోడర్-డీకోడర్ (సీక్వెన్స్-టు-సీక్వెన్స్). ఈ తేడాలను అర్థం చేసుకోవడం మీ నిర్దిష్ట పనికి సరైన నమూనాను ఎంచుకోవడంలో మీకు సహాయపడుతుంది.";return{c(){s=r("p"),s.textContent=C},l(p){s=m(p,"P",{"data-svelte-h":!0}),$(s)!=="svelte-1irj6s7"&&(s.textContent=C)},m(p,_){n(p,s,_)},p:Dt,d(p){p&&l(s)}}}function en(h){let s,C='<a href="/chapter1/5">How 🤗 Transformers solve tasks</a>, లో మనం చూసినట్లుగా, BERT వంటి ఎన్‌కోడర్ నమూనాలు టెక్స్ట్‌ను అర్థం చేసుకోవడంలో రాణిస్తాయి ఎందుకంటే అవి రెండు దిశలలోని మొత్తం సందర్భాన్ని చూడగలవు. ఇది మొత్తం ఇన్‌పుట్ యొక్క గ్రహణశక్తి ముఖ్యమైన పనులకు వాటిని పరిపూర్ణంగా చేస్తుంది.';return{c(){s=r("p"),s.innerHTML=C},l(p){s=m(p,"P",{"data-svelte-h":!0}),$(s)!=="svelte-jao7d8"&&(s.innerHTML=C)},m(p,_){n(p,s,_)},p:Dt,d(p){p&&l(s)}}}function ln(h){let s,C='GPT వంటి డీకోడర్ నమూనాలు ఒక సమయంలో ఒక టోకెన్‌ను అంచనా వేయడం ద్వారా టెక్స్ట్‌ను ఉత్పత్తి చేయడానికి రూపొందించబడ్డాయి. <a href="/chapter1/5">How 🤗 Transformers solve tasks</a> లో మనం అన్వేషించినట్లుగా, అవి మునుపటి టోకెన్‌లను మాత్రమే చూడగలవు, ఇది సృజనాత్మక టెక్స్ట్ జనరేషన్‌కు వాటిని అద్భుతంగా చేస్తుంది కానీ ద్విదిశాత్మక అవగాహన అవసరమయ్యే పనులకు అంత ఆదర్శవంతంగా ఉండదు.';return{c(){s=r("p"),s.innerHTML=C},l(p){s=m(p,"P",{"data-svelte-h":!0}),$(s)!=="svelte-fszmlt"&&(s.innerHTML=C)},m(p,_){n(p,s,_)},p:Dt,d(p){p&&l(s)}}}function nn(h){let s,C='<a href="/chapter1/5">How 🤗 Transformers solve tasks</a>,లో మనం చూసినట్లుగా, BART మరియు T5 వంటి ఎన్‌కోడర్-డీకోడర్ నమూనాలు రెండు నిర్మాణాల యొక్క బలాలను మిళితం చేస్తాయి. ఎన్‌కోడర్ ఇన్‌పుట్ యొక్క లోతైన ద్విదిశాత్మక అవగాహనను అందిస్తుంది, అయితే డీకోడర్ తగిన అవుట్‌పుట్ టెక్స్ట్‌ను ఉత్పత్తి చేస్తుంది. ఇది ఒక సీక్వెన్స్‌ను మరొకదానికి మార్చే పనులకు, అనువాదం లేదా సారాంశీకరణ వంటి వాటికి వాటిని పరిపూర్ణంగా చేస్తుంది.';return{c(){s=r("p"),s.innerHTML=C},l(p){s=m(p,"P",{"data-svelte-h":!0}),$(s)!=="svelte-1sfz4pi"&&(s.innerHTML=C)},m(p,_){n(p,s,_)},p:Dt,d(p){p&&l(s)}}}function fn(h){let s,C="ఏ నమూనాను ఉపయోగించాలో సందేహంలో ఉన్నప్పుడు, పరిగణించండి:",p,_,M="<li>మీ పనికి ఎలాంటి అవగాహన అవసరం? (ద్విదిశాత్మక లేదా ఏకదిశాత్మక)</li> <li>మీరు కొత్త టెక్స్ట్‌ను ఉత్పత్తి చేస్తున్నారా లేదా ఉన్న టెక్స్ట్‌ను విశ్లేషిస్తున్నారా?</li> <li>మీరు ఒక సీక్వెన్స్‌ను మరొకదానికి మార్చాల్సిన అవసరం ఉందా?</li>",H,g,S="ఈ ప్రశ్నలకు సమాధానాలు మిమ్మల్ని సరైన నిర్మాణం వైపు నడిపిస్తాయి.";return{c(){s=r("p"),s.textContent=C,p=f(),_=r("ol"),_.innerHTML=M,H=f(),g=r("p"),g.textContent=S},l(T){s=m(T,"P",{"data-svelte-h":!0}),$(s)!=="svelte-nc2e7r"&&(s.textContent=C),p=i(T),_=m(T,"OL",{"data-svelte-h":!0}),$(_)!=="svelte-14l26hv"&&(_.innerHTML=M),H=i(T),g=m(T,"P",{"data-svelte-h":!0}),$(g)!=="svelte-nvzt3d"&&(g.textContent=S)},m(T,b){n(T,s,b),n(T,p,b),n(T,_,b),n(T,H,b),n(T,g,b)},p:Dt,d(T){T&&(l(s),l(p),l(_),l(H),l(g))}}}function sn(h){let s,C="ప్రామాణిక శ్రద్ధా యంత్రాంగాలు O(n²) యొక్క గణన సంక్లిష్టతను కలిగి ఉంటాయి, ఇక్కడ n సీక్వెన్స్ పొడవు. చాలా పొడవైన సీక్వెన్స్‌లకు ఇది సమస్యాత్మకంగా మారుతుంది. కింద పేర్కొన్న ప్రత్యేక శ్రద్ధా యంత్రాంగాలు ఈ పరిమితిని పరిష్కరించడంలో సహాయపడతాయి.";return{c(){s=r("p"),s.textContent=C},l(p){s=m(p,"P",{"data-svelte-h":!0}),$(s)!=="svelte-1jxrpnq"&&(s.textContent=C)},m(p,_){n(p,s,_)},p:Dt,d(p){p&&l(s)}}}function rn(h){let s,C,p,_,M,H,g,S,T,b="మునుపటి విభాగాలలో, మేము సాధారణ Transformer ఆర్కిటెక్చర్‌ను పరిచయం చేసాము మరియు ఈ నమూనాలు వివిధ పనులను ఎలా పరిష్కరించగలవో అన్వేషించాము. ఇప్పుడు, Transformer నమూనాల యొక్క మూడు ప్రధాన నిర్మాణ వైవిధ్యాలను నిశితంగా పరిశీలిద్దాం మరియు ప్రతి ఒక్కటి ఎప్పుడు ఉపయోగించాలో అర్థం చేసుకుందాం. ఆపై, ఆ నిర్మాణాలు వేర్వేరు భాషా పనులకు ఎలా వర్తింపజేయబడతాయో చూశాము.",zt,y,Ze="ఈ విభాగంలో, మేము Transformer నమూనాల యొక్క మూడు ప్రధాన నిర్మాణ వైవిధ్యాలను లోతుగా పరిశీలించబోతున్నాము మరియు ప్రతి ఒక్కటి ఎప్పుడు ఉపయోగించాలో అర్థం చేసుకుంటాము.",It,E,Ut,D,Ft,G,Ot,z,tl="ఎన్‌కోడర్ నమూనాలు Transformer నమూనా యొక్క ఎన్‌కోడర్‌ను మాత్రమే ఉపయోగిస్తాయి. ప్రతి దశలో, శ్రద్ధా పొరలు ప్రారంభ వాక్యంలోని అన్ని పదాలను యాక్సెస్ చేయగలవు. ఈ నమూనాలు తరచుగా “ద్విదిశాత్మక” శ్రద్ధను కలిగి ఉన్నాయని వర్గీకరించబడతాయి మరియు తరచుగా ఆటో-ఎన్‌కోడింగ్ నమూనాలు అని పిలువబడతాయి.",Qt,I,el="ఈ నమూనాల యొక్క ప్రీ-ట్రైనింగ్ సాధారణంగా ఇచ్చిన వాక్యాన్ని ఏదో ఒక విధంగా పాడు చేయడం (ఉదాహరణకు, యాదృచ్ఛిక పదాలను మాస్క్ చేయడం ద్వారా) మరియు ప్రారంభ వాక్యాన్ని కనుగొనడం లేదా పునర్నిర్మించడం నమూనా యొక్క పని.",Kt,U,ll="వాక్య వర్గీకరణ, పేరున్న ఎంటిటీ గుర్తింపు (మరియు సాధారణంగా పద వర్గీకరణ), మరియు సంగ్రాహక ప్రశ్న-సమాధానం వంటి పూర్తి వాక్యం యొక్క అవగాహన అవసరమయ్యే పనులకు ఎన్‌కోడర్ నమూనాలు ఉత్తమంగా సరిపోతాయి.",Nt,R,Vt,F,nl="ఈ నమూనాల కుటుంబం యొక్క ప్రతినిధులు:",Yt,O,fl='<li><a href="https://huggingface.co/docs/transformers/model_doc/bert" rel="nofollow">BERT</a></li> <li><a href="https://huggingface.co/docs/transformers/model_doc/distilbert" rel="nofollow">DistilBERT</a></li> <li><a href="https://huggingface.co/docs/transformers/en/model_doc/modernbert" rel="nofollow">ModernBERT</a></li>',Jt,Q,Wt,K,Xt,N,il="డీకోడర్ నమూనాలు Transformer నమూనా యొక్క డీకోడర్‌ను మాత్రమే ఉపయోగిస్తాయి. ప్రతి దశలో, ఇచ్చిన పదం కోసం శ్రద్ధా పొరలు వాక్యంలో దాని ముందు ఉన్న పదాలను మాత్రమే యాక్సెస్ చేయగలవు. ఈ నమూనాలను తరచుగా ఆటో-రిగ్రెసివ్ నమూనాలు అని పిలుస్తారు.",Zt,V,sl="డీకోడర్ నమూనాల యొక్క ప్రీ-ట్రైనింగ్ సాధారణంగా వాక్యంలోని తదుపరి పదాన్ని అంచనా వేయడం చుట్టూ తిరుగుతుంది.",te,Y,rl="ఈ నమూనాలు టెక్స్ట్ జనరేషన్ వంటి పనులకు ఉత్తమంగా సరిపోతాయి.",ee,B,le,J,ml="ఈ నమూనాల కుటుంబం యొక్క ప్రతినిధులు:",ne,W,$l='<li><a href="https://huggingface.co/HuggingFaceTB/SmolLM2-1.7B-Instruct" rel="nofollow">Hugging Face SmolLM Series</a></li> <li><a href="https://huggingface.co/docs/transformers/en/model_doc/llama4" rel="nofollow">Meta’s Llama Series</a></li> <li><a href="https://huggingface.co/docs/transformers/main/en/model_doc/gemma3" rel="nofollow">Google’s Gemma Series</a></li> <li><a href="https://huggingface.co/deepseek-ai/DeepSeek-V3" rel="nofollow">DeepSeek’s V3</a></li>',fe,X,ie,Z,pl="చాలా ఆధునిక Large Language Models (LLMలు) డీకోడర్-మాత్రమే నిర్మాణాన్ని ఉపయోగిస్తాయి. ఈ నమూనాలు గత కొన్ని సంవత్సరాలుగా పరిమాణం మరియు సామర్థ్యాలలో నాటకీయంగా పెరిగాయి, అతిపెద్ద నమూనాలలో కొన్ని వందల బిలియన్ల పారామితులు ఉన్నాయి.",se,tt,al="ఆధునిక LLMలు సాధారణంగా రెండు దశలలో శిక్షణ పొందుతాయి:",re,et,ol="<li><strong>ప్రీ-ట్రైనింగ్</strong>: నమూనా విస్తారమైన టెక్స్ట్ డేటాపై తదుపరి టోకెన్‌ను అంచనా వేయడం నేర్చుకుంటుంది</li> <li><strong>ఇన్‌స్ట్రక్షన్ ట్యూనింగ్</strong>: నమూనా సూచనలను అనుసరించడానికి మరియు సహాయకరమైన ప్రతిస్పందనలను ఉత్పత్తి చేయడానికి ఫైన్-ట్యూన్ చేయబడుతుంది</li>",me,lt,dl="ఈ విధానం అనేక రకాల అంశాలు మరియు పనులలో మానవ-లాంటి టెక్స్ట్‌ను అర్థం చేసుకుని, ఉత్పత్తి చేయగల నమూనాలకు దారితీసింది.",$e,nt,pe,ft,ul="ఆధునిక డీకోడర్-ఆధారిత LLMలు ఆకట్టుకునే సామర్థ్యాలను ప్రదర్శించాయి:",ae,it,vl="<thead><tr><th>సామర్థ్యం</th> <th>వివరణ</th> <th>ఉదాహరణ</th></tr></thead> <tbody><tr><td>టెక్స్ట్ జనరేషన్</td> <td>పొందికైన మరియు సందర్భోచితమైన టెక్స్ట్‌ను సృష్టించడం</td> <td>వ్యాసాలు, కథలు లేదా ఈమెయిల్‌లు రాయడం</td></tr> <tr><td>సారాంశీకరణ</td> <td>పొడవైన పత్రాలను చిన్న వెర్షన్‌లుగా కుదించడం</td> <td>నివేదికల కార్యనిర్వాహక సారాంశాలను సృష్టించడం</td></tr> <tr><td>అనువాదం</td> <td>భాషల మధ్య టెక్స్ట్‌ను మార్చడం</td> <td>ఇంగ్లీష్‌ను స్పానిష్‌లోకి అనువదించడం</td></tr> <tr><td>ప్రశ్న-సమాధానం</td> <td>వాస్తవ ప్రశ్నలకు సమాధానాలు అందించడం</td> <td>“ఫ్రాన్స్ రాజధాని ఏది?”</td></tr> <tr><td>కోడ్ జనరేషన్</td> <td>కోడ్ స్నిప్పెట్‌లను రాయడం లేదా పూర్తి చేయడం</td> <td>వివరణ ఆధారంగా ఒక ఫంక్షన్‌ను సృష్టించడం</td></tr> <tr><td>తార్కికం (Reasoning)</td> <td>సమస్యలను దశలవారీగా పరిష్కరించడం</td> <td>గణిత సమస్యలు లేదా తార్కిక పజిల్స్‌ను పరిష్కరించడం</td></tr> <tr><td>ఫ్యూ-షాట్ లెర్నింగ్</td> <td>ప్రాంప్ట్‌లోని కొన్ని ఉదాహరణల నుండి నేర్చుకోవడం</td> <td>కేవలం 2-3 ఉదాహరణలు చూసిన తర్వాత టెక్స్ట్‌ను వర్గీకరించడం</td></tr></tbody>",oe,st,xl='మీరు బ్రౌజర్‌లో నేరుగా హబ్‌లోని నమూనా రిపో పేజీల ద్వారా డీకోడర్-ఆధారిత LLMలతో ప్రయోగాలు చేయవచ్చు. ఇక్కడ క్లాసిక్ <a href="https://huggingface.co/openai-community/gpt2" rel="nofollow">GPT-2</a> (OpenAI యొక్క అత్యుత్తమ ఓపెన్ సోర్స్ నమూనా!) తో ఒక ఉదాహరణ ఉంది:',de,P,Cl,ue,rt,ve,mt,xe,$t,_l="ఎన్‌కోడర్-డీకోడర్ నమూనాలు (సీక్వెన్స్-టు-సీక్వెన్స్ నమూనాలు అని కూడా పిలుస్తారు) Transformer నిర్మాణం యొక్క రెండు భాగాలను ఉపయోగిస్తాయి. ప్రతి దశలో, ఎన్‌కోడర్ యొక్క శ్రద్ధా పొరలు ప్రారంభ వాక్యంలోని అన్ని పదాలను యాక్సెస్ చేయగలవు, అయితే డీకోడర్ యొక్క శ్రద్ధా పొరలు ఇన్‌పుట్‌లో ఇచ్చిన పదం ముందు ఉన్న పదాలను మాత్రమే యాక్సెస్ చేయగలవు.",Ce,pt,Tl="ఈ నమూనాల యొక్క ప్రీ-ట్రైనింగ్ వివిధ రూపాలను తీసుకోవచ్చు, కానీ ఇది తరచుగా ఇన్‌పుట్ ఏదో ఒక విధంగా పాడు చేయబడిన వాక్యాన్ని పునర్నిర్మించడం (ఉదాహరణకు యాదృచ్ఛిక పదాలను మాస్క్ చేయడం ద్వారా) ఉంటుంది. T5 నమూనా యొక్క ప్రీ-ట్రైనింగ్ యాదృచ్ఛిక టెక్స్ట్ స్పాన్‌లను (ఇవి అనేక పదాలను కలిగి ఉండవచ్చు) ఒకే మాస్క్ ప్రత్యేక టోకెన్‌తో భర్తీ చేయడం, మరియు అప్పుడు ఈ మాస్క్ టోకెన్ భర్తీ చేసే టెక్స్ట్‌ను అంచనా వేయడం పని.",_e,at,gl="సీక్వెన్స్-టు-సీక్వెన్స్ నమూనాలు సారాంశీకరణ, అనువాదం, లేదా సృజనాత్మక ప్రశ్న-సమాధానం వంటి ఇచ్చిన ఇన్‌పుట్‌పై ఆధారపడి కొత్త వాక్యాలను ఉత్పత్తి చేయడం చుట్టూ తిరిగే పనులకు ఉత్తమంగా సరిపోతాయి.",Te,q,ge,ot,he,dt,hl="సీక్వెన్స్-టు-సీక్వెన్స్ నమూనాలు అర్థాన్ని కాపాడుకుంటూ ఒక రూపంలోని టెక్స్ట్‌ను మరొక రూపంలోకి మార్చాల్సిన పనులలో రాణిస్తాయి. కొన్ని ఆచరణాత్మక అనువర్తనాలు:",Le,ut,Ll="<thead><tr><th>అనువర్తనం</th> <th>వివరణ</th> <th>ఉదాహరణ నమూనా</th></tr></thead> <tbody><tr><td>యంత్ర అనువాదం</td> <td>భాషల మధ్య టెక్స్ట్‌ను మార్చడం</td> <td>Marian, T5</td></tr> <tr><td>టెక్స్ట్ సారాంశీకరణ</td> <td>పొడవైన టెక్స్ట్‌ల క్లుప్త సారాంశాలను సృష్టించడం</td> <td>BART, T5</td></tr> <tr><td>డేటా-టు-టెక్స్ట్ జనరేషన్</td> <td>నిర్మాణాత్మక డేటాను సహజ భాషలోకి మార్చడం</td> <td>T5</td></tr> <tr><td>వ్యాకరణ దిద్దుబాటు</td> <td>టెక్స్ట్‌లోని వ్యాకరణ దోషాలను సరిచేయడం</td> <td>T5</td></tr></tbody>",we,vt,wl="ఈ నమూనాల కుటుంబం యొక్క ప్రతినిధులు:",Me,c,Ml,Pe,xt,Pl="Representatives of this family of models include:",ce,Ct,cl='<li><a href="https://huggingface.co/docs/transformers/model_doc/bart" rel="nofollow">BART</a></li> <li><a href="https://huggingface.co/docs/transformers/model_doc/mbart" rel="nofollow">mBART</a></li> <li><a href="https://huggingface.co/docs/transformers/model_doc/marian" rel="nofollow">Marian</a></li> <li><a href="https://huggingface.co/docs/transformers/model_doc/t5" rel="nofollow">T5</a></li>',He,_t,be,Tt,Hl="ఒక నిర్దిష్ట NLP పనిలో పనిచేస్తున్నప్పుడు, మీరు ఏ నిర్మాణాన్ని ఉపయోగించాలో ఎలా నిర్ణయిస్తారు? ఇక్కడ ఒక శీఘ్ర మార్గదర్శి ఉంది:",Ee,gt,bl="<thead><tr><th>పని</th> <th>సూచించిన నిర్మాణం</th> <th>ఉదాహరణలు</th></tr></thead> <tbody><tr><td>టెక్స్ట్ వర్గీకరణ (భావోద్వేగం, అంశం)</td> <td>Encoder</td> <td>BERT, RoBERTa</td></tr> <tr><td>టెక్స్ట్ ఉత్పత్తి (సృజనాత్మక రచన)</td> <td>Decoder</td> <td>GPT, LLaMA</td></tr> <tr><td>అనువాదం</td> <td>Encoder-Decoder</td> <td>T5, BART</td></tr> <tr><td>సంక్షిప్తీకరణ</td> <td>Encoder-Decoder</td> <td>BART, T5</td></tr> <tr><td>పేరుతో గుర్తింపు</td> <td>Encoder</td> <td>BERT, RoBERTa</td></tr> <tr><td>ప్రశ్నలకు సమాధానం (ఎక్స్‌ట్రాక్టివ్)</td> <td>Encoder</td> <td>BERT, RoBERTa</td></tr> <tr><td>ప్రశ్నలకు సమాధానం (జనరేటివ్)</td> <td>Encoder-Decoder or Decoder</td> <td>T5, GPT</td></tr> <tr><td>సంభాషణ AI</td> <td>Decoder</td> <td>GPT, LLaMA</td></tr></tbody>",Re,j,Be,ht,qe,Lt,El="పెద్ద భాషా నమూనాలు ఇటీవలి సంవత్సరాలలో వేగంగా అభివృద్ధి చెందాయి, ప్రతి తరం సామర్థ్యాలలో గణనీయమైన మెరుగుదలలను తీసుకువచ్చింది.",je,wt,ke,Mt,Rl="చాలా ట్రాన్స్‌ఫార్మర్ నమూనాలు పూర్తి శ్రద్ధను ఉపయోగిస్తాయి, అంటే శ్రద్ధా మాత్రిక చతురస్రాకారంలో ఉంటుంది. మీకు పొడవైన టెక్స్ట్‌లు ఉన్నప్పుడు ఇది ఒక పెద్ద గణన అవరోధంగా ఉంటుంది. లాంగ్‌ఫార్మర్ మరియు రిఫార్మర్ అనే నమూనాలు మరింత సమర్థవంతంగా ఉండటానికి ప్రయత్నిస్తాయి మరియు శిక్షణను వేగవంతం చేయడానికి శ్రద్ధా మాత్రిక యొక్క స్పాన్ వెర్షన్‌ను ఉపయోగిస్తాయి.",Ae,k,Se,Pt,ye,ct,Bl='<a href="https://huggingface.co/docs/transformers/model_doc/reformer" rel="nofollow">Reformer</a> LSH అటెన్షన్ ఉపయోగిస్తుంది. సాఫ్ట్‌మాక్స్(QK^t)లో, మాత్రిక QK^t యొక్క అతిపెద్ద అంశాలు మాత్రమే (సాఫ్ట్‌మాక్స్ డైమెన్షన్‌లో) ఉపయోగకరమైన సహకారం అందిస్తాయి. కాబట్టి Q లోని ప్రతి క్వెరీ q కోసం, మనం K లో q కు దగ్గరగా ఉన్న కీలను మాత్రమే పరిగణించవచ్చు. q మరియు k దగ్గరగా ఉన్నాయో లేదో నిర్ధారించడానికి ఒక హాష్ ఫంక్షన్ ఉపయోగించబడుతుంది. ప్రస్తుత టోకెన్‌ను మాస్క్ చేయడానికి శ్రద్ధా మాస్క్ సవరించబడింది (మొదటి స్థానంలో తప్ప), ఎందుకంటే ఇది సమానమైన క్వెరీ మరియు కీని ఇస్తుంది (కాబట్టి ఒకదానికొకటి చాలా పోలి ఉంటుంది). హాష్ కొంచెం యాదృచ్ఛికంగా ఉండగలదు కాబట్టి, ఆచరణలో అనేక హాష్ ఫంక్షన్లు ఉపయోగించబడతాయి (n_rounds పారామితి ద్వారా నిర్ధారించబడతాయి) మరియు తరువాత అవి సగటు చేయబడతాయి.',De,Ht,Ge,bt,ql='<a href="https://huggingface.co/docs/transformers/model_doc/longformer" rel="nofollow">Longformer</a> స్థానిక శ్రద్ధను ఉపయోగిస్తుంది: తరచుగా, స్థానిక సందర్భం (ఉదా., ఎడమ మరియు కుడి వైపున ఉన్న రెండు టోకెన్‌లు ఏమిటి?) ఒక నిర్దిష్ట టోకెన్ కోసం చర్య తీసుకోవడానికి సరిపోతుంది. అలాగే, చిన్న విండో ఉన్న శ్రద్ధా పొరలను పేర్చడం ద్వారా, చివరి పొర కేవలం విండోలోని టోకెన్‌ల కంటే ఎక్కువ గ్రహణ క్షేత్రాన్ని కలిగి ఉంటుంది, ఇది మొత్తం వాక్యం యొక్క ప్రాతినిధ్యాన్ని నిర్మించడానికి వీలు కల్పిస్తుంది.',ze,Et,jl="కొన్ని ముందుగా ఎంచుకున్న ఇన్‌పుట్ టోకెన్‌లకు గ్లోబల్ అటెన్షన్ కూడా ఇవ్వబడుతుంది: ఆ కొన్ని టోకెన్‌ల కోసం, శ్రద్ధా మాత్రిక అన్ని టోకెన్‌లను యాక్సెస్ చేయగలదు మరియు ఈ ప్రక్రియ సుష్టంగా ఉంటుంది: అన్ని ఇతర టోకెన్‌లు ఆ నిర్దిష్ట టోకెన్‌లకు యాక్సెస్ కలిగి ఉంటాయి (వాటి స్థానిక విండోలోని వాటితో పాటు). ఇది పేపర్‌లోని ఫిగర్ 2డిలో చూపబడింది, ఒక నమూనా శ్రద్ధా మాస్క్ కోసం కింద చూడండి:",Ie,A,kl='<img scale="50 %" align="center" src="https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/local_attention_mask.png"/>',Ue,Rt,Al="తక్కువ పారామితులతో ఆ Attention matrix ఉపయోగించడం వలన నమూనా పెద్ద సీక్వెన్స్ పొడవు ఉన్న ఇన్‌పుట్‌లను కలిగి ఉండటానికి వీలు కల్పిస్తుంది.",Fe,Bt,Oe,qt,Sl='<a href="https://huggingface.co/docs/transformers/model_doc/reformer" rel="nofollow">Reformer</a> యాక్సియల్ పొజిషనల్ ఎన్‌కోడింగ్‌లను ఉపయోగిస్తుంది: సాంప్రదాయ ట్రాన్స్‌ఫార్మర్ నమూనాలలో, పొజిషనల్ ఎన్‌కోడింగ్ E అనేది (l) బై (d) పరిమాణంలో ఒక మాత్రిక, ఇక్కడ (l) సీక్వెన్స్ పొడవు మరియు (d) దాగి ఉన్న స్థితి యొక్క డైమెన్షన్. మీకు చాలా పొడవైన టెక్స్ట్‌లు ఉంటే, ఈ మాత్రిక చాలా పెద్దదిగా ఉండవచ్చు మరియు GPUలో చాలా ఎక్కువ స్థలాన్ని తీసుకుంటుంది. దానిని తగ్గించడానికి, యాక్సియల్ పొజిషనల్ ఎన్‌కోడింగ్‌లు ఆ పెద్ద మాత్రిక E ని రెండు చిన్న మాత్రికలు E1 మరియు E2 గా విభజించడం, వాటి డైమెన్షన్లు (l<em>{1} \\times d</em>{1}) మరియు (l<em>{2} \\times d</em>{2}), ఇక్కడ (l<em>{1} \\times l</em>{2} = l) మరియు (d<em>{1} + d</em>{2} = d) (పొడవుల కోసం గుణకారంతో, ఇది చాలా చిన్నదిగా ముగుస్తుంది). E లో సమయ దశ (j) కోసం ఎంబెడ్డింగ్ E1 లో సమయ దశ (j % l1) మరియు E2 లో (j // l1) కోసం ఎంబెడ్డింగ్‌లను కలపడం ద్వారా పొందబడుతుంది.',Qe,jt,Ke,kt,yl="ఈ విభాగంలో, మేము మూడు ప్రధాన Transformer నిర్మాణాలను మరియు కొన్ని ప్రత్యేక శ్రద్ధా యంత్రాంగాలను అన్వేషించాము. మీ నిర్దిష్ట NLP పని కోసం సరైన నమూనాను ఎంచుకోవడానికి ఈ నిర్మాణ తేడాలను అర్థం చేసుకోవడం చాలా ముఖ్యం.",Ne,At,Dl="కోర్సులో మనం ముందుకు సాగుతున్నప్పుడు, మీరు ఈ విభిన్న నిర్మాణాలతో ప్రత్యక్ష అనుభవాన్ని పొందుతారు మరియు మీ నిర్దిష్ట అవసరాలకు వాటిని ఎలా ఫైన్-ట్యూన్ చేయాలో నేర్చుకుంటారు. తదుపరి విభాగంలో, మనం ఈ నమూనాలలో ఉన్న కొన్ని పరిమితులు మరియు పక్షపాతాలను పరిశీలిస్తాము, వాటిని అమలు చేస్తున్నప్పుడు మీరు తెలుసుకోవాలి.",Ve,St,Ye,Gt,Je;return M=new Xl({props:{chapter:1,classNames:"absolute z-10 right-0 top-0"}}),g=new L({props:{title:"ట్రాన్స్‌ఫార్మర్ ఆర్కిటెక్చర్లు",local:"transformer-architectures",headingTag:"h1"}}),E=new yt({props:{$$slots:{default:[tn]},$$scope:{ctx:h}}}),D=new L({props:{title:"ఎన్‌కోడర్ నమూనాలు",local:"encoder-models",headingTag:"h2"}}),G=new Xe({props:{id:"MUqNwgPjJvQ"}}),R=new yt({props:{$$slots:{default:[en]},$$scope:{ctx:h}}}),Q=new L({props:{title:"డీకోడర్ నమూనాలు",local:"decoder-models",headingTag:"h2"}}),K=new Xe({props:{id:"d_ixlCubqQw"}}),B=new yt({props:{$$slots:{default:[ln]},$$scope:{ctx:h}}}),X=new L({props:{title:"ఆధునిక లార్జ్ లాంగ్వేజ్ మోడల్స్ (LLMలు)",local:"ఆధనక-లరజ-లగవజ-మడలస-llmల",headingTag:"h3"}}),nt=new L({props:{title:"ఆధునిక LLMల యొక్క ముఖ్య సామర్థ్యాలు",local:"ఆధనక-llmల-యకక-మఖయ-సమరథయల",headingTag:"h4"}}),rt=new L({props:{title:"సీక్వెన్స్-టు-సీక్వెన్స్ నమూనాలు",local:"sequence-to-sequence-models",headingTag:"h2"}}),mt=new Xe({props:{id:"0_4KEb08xrE"}}),q=new yt({props:{$$slots:{default:[nn]},$$scope:{ctx:h}}}),ot=new L({props:{title:"ఆచరణాత్మక అనువర్తనాలు",local:"ఆచరణతమక-అనవరతనల",headingTag:"h3"}}),_t=new L({props:{title:"సరైన నిర్మాణాన్ని ఎంచుకోవడం",local:"choosing-the-right-architecture",headingTag:"h2"}}),j=new yt({props:{$$slots:{default:[fn]},$$scope:{ctx:h}}}),ht=new L({props:{title:"LLMల పరిణామం",local:"llmల-పరణమ",headingTag:"h2"}}),wt=new L({props:{title:"అటెన్షన్ మెకానిజమ్స్",local:"attention-mechanisms",headingTag:"h2"}}),k=new yt({props:{$$slots:{default:[sn]},$$scope:{ctx:h}}}),Pt=new L({props:{title:"LSH అటెన్షన్",local:"lsh-అటనషన",headingTag:"h3"}}),Ht=new L({props:{title:"లోకల్ అటెన్షన్",local:"లకల-అటనషన",headingTag:"h3"}}),Bt=new L({props:{title:"యాక్సియల్ పొజిషనల్ ఎన్‌కోడింగ్స్",local:"యకసయల-పజషనల-ఎనకడగస",headingTag:"h3"}}),jt=new L({props:{title:"ముగింపు",local:"conclusion",headingTag:"h2"}}),St=new Zl({props:{source:"https://github.com/huggingface/course/blob/main/chapters/te/chapter1/6.mdx"}}),{c(){s=r("meta"),C=f(),p=r("p"),_=f(),a(M.$$.fragment),H=f(),a(g.$$.fragment),S=f(),T=r("p"),T.textContent=b,zt=f(),y=r("p"),y.textContent=Ze,It=f(),a(E.$$.fragment),Ut=f(),a(D.$$.fragment),Ft=f(),a(G.$$.fragment),Ot=f(),z=r("p"),z.textContent=tl,Qt=f(),I=r("p"),I.textContent=el,Kt=f(),U=r("p"),U.textContent=ll,Nt=f(),a(R.$$.fragment),Vt=f(),F=r("p"),F.textContent=nl,Yt=f(),O=r("ul"),O.innerHTML=fl,Jt=f(),a(Q.$$.fragment),Wt=f(),a(K.$$.fragment),Xt=f(),N=r("p"),N.textContent=il,Zt=f(),V=r("p"),V.textContent=sl,te=f(),Y=r("p"),Y.textContent=rl,ee=f(),a(B.$$.fragment),le=f(),J=r("p"),J.textContent=ml,ne=f(),W=r("ul"),W.innerHTML=$l,fe=f(),a(X.$$.fragment),ie=f(),Z=r("p"),Z.textContent=pl,se=f(),tt=r("p"),tt.textContent=al,re=f(),et=r("ol"),et.innerHTML=ol,me=f(),lt=r("p"),lt.textContent=dl,$e=f(),a(nt.$$.fragment),pe=f(),ft=r("p"),ft.textContent=ul,ae=f(),it=r("table"),it.innerHTML=vl,oe=f(),st=r("p"),st.innerHTML=xl,de=f(),P=r("iframe"),ue=f(),a(rt.$$.fragment),ve=f(),a(mt.$$.fragment),xe=f(),$t=r("p"),$t.textContent=_l,Ce=f(),pt=r("p"),pt.textContent=Tl,_e=f(),at=r("p"),at.textContent=gl,Te=f(),a(q.$$.fragment),ge=f(),a(ot.$$.fragment),he=f(),dt=r("p"),dt.textContent=hl,Le=f(),ut=r("table"),ut.innerHTML=Ll,we=f(),vt=r("p"),vt.textContent=wl,Me=f(),c=r("iframe"),Pe=f(),xt=r("p"),xt.textContent=Pl,ce=f(),Ct=r("ul"),Ct.innerHTML=cl,He=f(),a(_t.$$.fragment),be=f(),Tt=r("p"),Tt.textContent=Hl,Ee=f(),gt=r("table"),gt.innerHTML=bl,Re=f(),a(j.$$.fragment),Be=f(),a(ht.$$.fragment),qe=f(),Lt=r("p"),Lt.textContent=El,je=f(),a(wt.$$.fragment),ke=f(),Mt=r("p"),Mt.textContent=Rl,Ae=f(),a(k.$$.fragment),Se=f(),a(Pt.$$.fragment),ye=f(),ct=r("p"),ct.innerHTML=Bl,De=f(),a(Ht.$$.fragment),Ge=f(),bt=r("p"),bt.innerHTML=ql,ze=f(),Et=r("p"),Et.textContent=jl,Ie=f(),A=r("div"),A.innerHTML=kl,Ue=f(),Rt=r("p"),Rt.textContent=Al,Fe=f(),a(Bt.$$.fragment),Oe=f(),qt=r("p"),qt.innerHTML=Sl,Qe=f(),a(jt.$$.fragment),Ke=f(),kt=r("p"),kt.textContent=yl,Ne=f(),At=r("p"),At.textContent=Dl,Ve=f(),a(St.$$.fragment),Ye=f(),Gt=r("p"),this.h()},l(t){const e=Jl("svelte-u9bgzb",document.head);s=m(e,"META",{name:!0,content:!0}),e.forEach(l),C=i(t),p=m(t,"P",{}),We(p).forEach(l),_=i(t),o(M.$$.fragment,t),H=i(t),o(g.$$.fragment,t),S=i(t),T=m(t,"P",{"data-svelte-h":!0}),$(T)!=="svelte-ld80qf"&&(T.textContent=b),zt=i(t),y=m(t,"P",{"data-svelte-h":!0}),$(y)!=="svelte-3b2l7o"&&(y.textContent=Ze),It=i(t),o(E.$$.fragment,t),Ut=i(t),o(D.$$.fragment,t),Ft=i(t),o(G.$$.fragment,t),Ot=i(t),z=m(t,"P",{"data-svelte-h":!0}),$(z)!=="svelte-cld8kd"&&(z.textContent=tl),Qt=i(t),I=m(t,"P",{"data-svelte-h":!0}),$(I)!=="svelte-10ff5jj"&&(I.textContent=el),Kt=i(t),U=m(t,"P",{"data-svelte-h":!0}),$(U)!=="svelte-v5iyr2"&&(U.textContent=ll),Nt=i(t),o(R.$$.fragment,t),Vt=i(t),F=m(t,"P",{"data-svelte-h":!0}),$(F)!=="svelte-6tk3po"&&(F.textContent=nl),Yt=i(t),O=m(t,"UL",{"data-svelte-h":!0}),$(O)!=="svelte-vv3q6"&&(O.innerHTML=fl),Jt=i(t),o(Q.$$.fragment,t),Wt=i(t),o(K.$$.fragment,t),Xt=i(t),N=m(t,"P",{"data-svelte-h":!0}),$(N)!=="svelte-evgje0"&&(N.textContent=il),Zt=i(t),V=m(t,"P",{"data-svelte-h":!0}),$(V)!=="svelte-1mzo68g"&&(V.textContent=sl),te=i(t),Y=m(t,"P",{"data-svelte-h":!0}),$(Y)!=="svelte-tojya9"&&(Y.textContent=rl),ee=i(t),o(B.$$.fragment,t),le=i(t),J=m(t,"P",{"data-svelte-h":!0}),$(J)!=="svelte-6tk3po"&&(J.textContent=ml),ne=i(t),W=m(t,"UL",{"data-svelte-h":!0}),$(W)!=="svelte-1plq41k"&&(W.innerHTML=$l),fe=i(t),o(X.$$.fragment,t),ie=i(t),Z=m(t,"P",{"data-svelte-h":!0}),$(Z)!=="svelte-vwf9qd"&&(Z.textContent=pl),se=i(t),tt=m(t,"P",{"data-svelte-h":!0}),$(tt)!=="svelte-1q3s2w0"&&(tt.textContent=al),re=i(t),et=m(t,"OL",{"data-svelte-h":!0}),$(et)!=="svelte-1crt3ax"&&(et.innerHTML=ol),me=i(t),lt=m(t,"P",{"data-svelte-h":!0}),$(lt)!=="svelte-frga8z"&&(lt.textContent=dl),$e=i(t),o(nt.$$.fragment,t),pe=i(t),ft=m(t,"P",{"data-svelte-h":!0}),$(ft)!=="svelte-113gx7k"&&(ft.textContent=ul),ae=i(t),it=m(t,"TABLE",{"data-svelte-h":!0}),$(it)!=="svelte-1kxedhs"&&(it.innerHTML=vl),oe=i(t),st=m(t,"P",{"data-svelte-h":!0}),$(st)!=="svelte-4y5yba"&&(st.innerHTML=xl),de=i(t),P=m(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),We(P).forEach(l),ue=i(t),o(rt.$$.fragment,t),ve=i(t),o(mt.$$.fragment,t),xe=i(t),$t=m(t,"P",{"data-svelte-h":!0}),$($t)!=="svelte-1lwnvea"&&($t.textContent=_l),Ce=i(t),pt=m(t,"P",{"data-svelte-h":!0}),$(pt)!=="svelte-gaje93"&&(pt.textContent=Tl),_e=i(t),at=m(t,"P",{"data-svelte-h":!0}),$(at)!=="svelte-sjr5nq"&&(at.textContent=gl),Te=i(t),o(q.$$.fragment,t),ge=i(t),o(ot.$$.fragment,t),he=i(t),dt=m(t,"P",{"data-svelte-h":!0}),$(dt)!=="svelte-1vfvazt"&&(dt.textContent=hl),Le=i(t),ut=m(t,"TABLE",{"data-svelte-h":!0}),$(ut)!=="svelte-1akvdg1"&&(ut.innerHTML=Ll),we=i(t),vt=m(t,"P",{"data-svelte-h":!0}),$(vt)!=="svelte-6tk3po"&&(vt.textContent=wl),Me=i(t),c=m(t,"IFRAME",{src:!0,frameborder:!0,width:!0,height:!0}),We(c).forEach(l),Pe=i(t),xt=m(t,"P",{"data-svelte-h":!0}),$(xt)!=="svelte-s27rrg"&&(xt.textContent=Pl),ce=i(t),Ct=m(t,"UL",{"data-svelte-h":!0}),$(Ct)!=="svelte-sn73k4"&&(Ct.innerHTML=cl),He=i(t),o(_t.$$.fragment,t),be=i(t),Tt=m(t,"P",{"data-svelte-h":!0}),$(Tt)!=="svelte-tjy662"&&(Tt.textContent=Hl),Ee=i(t),gt=m(t,"TABLE",{"data-svelte-h":!0}),$(gt)!=="svelte-1no6fsx"&&(gt.innerHTML=bl),Re=i(t),o(j.$$.fragment,t),Be=i(t),o(ht.$$.fragment,t),qe=i(t),Lt=m(t,"P",{"data-svelte-h":!0}),$(Lt)!=="svelte-5wuomm"&&(Lt.textContent=El),je=i(t),o(wt.$$.fragment,t),ke=i(t),Mt=m(t,"P",{"data-svelte-h":!0}),$(Mt)!=="svelte-2g6ho0"&&(Mt.textContent=Rl),Ae=i(t),o(k.$$.fragment,t),Se=i(t),o(Pt.$$.fragment,t),ye=i(t),ct=m(t,"P",{"data-svelte-h":!0}),$(ct)!=="svelte-1ej0vyv"&&(ct.innerHTML=Bl),De=i(t),o(Ht.$$.fragment,t),Ge=i(t),bt=m(t,"P",{"data-svelte-h":!0}),$(bt)!=="svelte-1x5forl"&&(bt.innerHTML=ql),ze=i(t),Et=m(t,"P",{"data-svelte-h":!0}),$(Et)!=="svelte-12i8efd"&&(Et.textContent=jl),Ie=i(t),A=m(t,"DIV",{class:!0,"data-svelte-h":!0}),$(A)!=="svelte-h9npcw"&&(A.innerHTML=kl),Ue=i(t),Rt=m(t,"P",{"data-svelte-h":!0}),$(Rt)!=="svelte-1x3i9r3"&&(Rt.textContent=Al),Fe=i(t),o(Bt.$$.fragment,t),Oe=i(t),qt=m(t,"P",{"data-svelte-h":!0}),$(qt)!=="svelte-1nocj7w"&&(qt.innerHTML=Sl),Qe=i(t),o(jt.$$.fragment,t),Ke=i(t),kt=m(t,"P",{"data-svelte-h":!0}),$(kt)!=="svelte-tvfqrb"&&(kt.textContent=yl),Ne=i(t),At=m(t,"P",{"data-svelte-h":!0}),$(At)!=="svelte-4ah776"&&(At.textContent=Dl),Ve=i(t),o(St.$$.fragment,t),Ye=i(t),Gt=m(t,"P",{}),We(Gt).forEach(l),this.h()},h(){w(s,"name","hf:doc:metadata"),w(s,"content",mn),Ql(P.src,Cl="https://huggingface.co/openai-community/gpt2")||w(P,"src",Cl),w(P,"frameborder","0"),w(P,"width","100%"),w(P,"height","450"),Ql(c.src,Ml="https://course-demos-speech-to-speech-translation.hf.space")||w(c,"src",Ml),w(c,"frameborder","0"),w(c,"width","850"),w(c,"height","450"),w(A,"class","flex justify-center")},m(t,e){Wl(document.head,s),n(t,C,e),n(t,p,e),n(t,_,e),d(M,t,e),n(t,H,e),d(g,t,e),n(t,S,e),n(t,T,e),n(t,zt,e),n(t,y,e),n(t,It,e),d(E,t,e),n(t,Ut,e),d(D,t,e),n(t,Ft,e),d(G,t,e),n(t,Ot,e),n(t,z,e),n(t,Qt,e),n(t,I,e),n(t,Kt,e),n(t,U,e),n(t,Nt,e),d(R,t,e),n(t,Vt,e),n(t,F,e),n(t,Yt,e),n(t,O,e),n(t,Jt,e),d(Q,t,e),n(t,Wt,e),d(K,t,e),n(t,Xt,e),n(t,N,e),n(t,Zt,e),n(t,V,e),n(t,te,e),n(t,Y,e),n(t,ee,e),d(B,t,e),n(t,le,e),n(t,J,e),n(t,ne,e),n(t,W,e),n(t,fe,e),d(X,t,e),n(t,ie,e),n(t,Z,e),n(t,se,e),n(t,tt,e),n(t,re,e),n(t,et,e),n(t,me,e),n(t,lt,e),n(t,$e,e),d(nt,t,e),n(t,pe,e),n(t,ft,e),n(t,ae,e),n(t,it,e),n(t,oe,e),n(t,st,e),n(t,de,e),n(t,P,e),n(t,ue,e),d(rt,t,e),n(t,ve,e),d(mt,t,e),n(t,xe,e),n(t,$t,e),n(t,Ce,e),n(t,pt,e),n(t,_e,e),n(t,at,e),n(t,Te,e),d(q,t,e),n(t,ge,e),d(ot,t,e),n(t,he,e),n(t,dt,e),n(t,Le,e),n(t,ut,e),n(t,we,e),n(t,vt,e),n(t,Me,e),n(t,c,e),n(t,Pe,e),n(t,xt,e),n(t,ce,e),n(t,Ct,e),n(t,He,e),d(_t,t,e),n(t,be,e),n(t,Tt,e),n(t,Ee,e),n(t,gt,e),n(t,Re,e),d(j,t,e),n(t,Be,e),d(ht,t,e),n(t,qe,e),n(t,Lt,e),n(t,je,e),d(wt,t,e),n(t,ke,e),n(t,Mt,e),n(t,Ae,e),d(k,t,e),n(t,Se,e),d(Pt,t,e),n(t,ye,e),n(t,ct,e),n(t,De,e),d(Ht,t,e),n(t,Ge,e),n(t,bt,e),n(t,ze,e),n(t,Et,e),n(t,Ie,e),n(t,A,e),n(t,Ue,e),n(t,Rt,e),n(t,Fe,e),d(Bt,t,e),n(t,Oe,e),n(t,qt,e),n(t,Qe,e),d(jt,t,e),n(t,Ke,e),n(t,kt,e),n(t,Ne,e),n(t,At,e),n(t,Ve,e),d(St,t,e),n(t,Ye,e),n(t,Gt,e),Je=!0},p(t,[e]){const Gl={};e&2&&(Gl.$$scope={dirty:e,ctx:t}),E.$set(Gl);const zl={};e&2&&(zl.$$scope={dirty:e,ctx:t}),R.$set(zl);const Il={};e&2&&(Il.$$scope={dirty:e,ctx:t}),B.$set(Il);const Ul={};e&2&&(Ul.$$scope={dirty:e,ctx:t}),q.$set(Ul);const Fl={};e&2&&(Fl.$$scope={dirty:e,ctx:t}),j.$set(Fl);const Ol={};e&2&&(Ol.$$scope={dirty:e,ctx:t}),k.$set(Ol)},i(t){Je||(u(M.$$.fragment,t),u(g.$$.fragment,t),u(E.$$.fragment,t),u(D.$$.fragment,t),u(G.$$.fragment,t),u(R.$$.fragment,t),u(Q.$$.fragment,t),u(K.$$.fragment,t),u(B.$$.fragment,t),u(X.$$.fragment,t),u(nt.$$.fragment,t),u(rt.$$.fragment,t),u(mt.$$.fragment,t),u(q.$$.fragment,t),u(ot.$$.fragment,t),u(_t.$$.fragment,t),u(j.$$.fragment,t),u(ht.$$.fragment,t),u(wt.$$.fragment,t),u(k.$$.fragment,t),u(Pt.$$.fragment,t),u(Ht.$$.fragment,t),u(Bt.$$.fragment,t),u(jt.$$.fragment,t),u(St.$$.fragment,t),Je=!0)},o(t){v(M.$$.fragment,t),v(g.$$.fragment,t),v(E.$$.fragment,t),v(D.$$.fragment,t),v(G.$$.fragment,t),v(R.$$.fragment,t),v(Q.$$.fragment,t),v(K.$$.fragment,t),v(B.$$.fragment,t),v(X.$$.fragment,t),v(nt.$$.fragment,t),v(rt.$$.fragment,t),v(mt.$$.fragment,t),v(q.$$.fragment,t),v(ot.$$.fragment,t),v(_t.$$.fragment,t),v(j.$$.fragment,t),v(ht.$$.fragment,t),v(wt.$$.fragment,t),v(k.$$.fragment,t),v(Pt.$$.fragment,t),v(Ht.$$.fragment,t),v(Bt.$$.fragment,t),v(jt.$$.fragment,t),v(St.$$.fragment,t),Je=!1},d(t){t&&(l(C),l(p),l(_),l(H),l(S),l(T),l(zt),l(y),l(It),l(Ut),l(Ft),l(Ot),l(z),l(Qt),l(I),l(Kt),l(U),l(Nt),l(Vt),l(F),l(Yt),l(O),l(Jt),l(Wt),l(Xt),l(N),l(Zt),l(V),l(te),l(Y),l(ee),l(le),l(J),l(ne),l(W),l(fe),l(ie),l(Z),l(se),l(tt),l(re),l(et),l(me),l(lt),l($e),l(pe),l(ft),l(ae),l(it),l(oe),l(st),l(de),l(P),l(ue),l(ve),l(xe),l($t),l(Ce),l(pt),l(_e),l(at),l(Te),l(ge),l(he),l(dt),l(Le),l(ut),l(we),l(vt),l(Me),l(c),l(Pe),l(xt),l(ce),l(Ct),l(He),l(be),l(Tt),l(Ee),l(gt),l(Re),l(Be),l(qe),l(Lt),l(je),l(ke),l(Mt),l(Ae),l(Se),l(ye),l(ct),l(De),l(Ge),l(bt),l(ze),l(Et),l(Ie),l(A),l(Ue),l(Rt),l(Fe),l(Oe),l(qt),l(Qe),l(Ke),l(kt),l(Ne),l(At),l(Ve),l(Ye),l(Gt)),l(s),x(M,t),x(g,t),x(E,t),x(D,t),x(G,t),x(R,t),x(Q,t),x(K,t),x(B,t),x(X,t),x(nt,t),x(rt,t),x(mt,t),x(q,t),x(ot,t),x(_t,t),x(j,t),x(ht,t),x(wt,t),x(k,t),x(Pt,t),x(Ht,t),x(Bt,t),x(jt,t),x(St,t)}}}const mn='{"title":"ట్రాన్స్‌ఫార్మర్ ఆర్కిటెక్చర్లు","local":"transformer-architectures","sections":[{"title":"ఎన్‌కోడర్ నమూనాలు","local":"encoder-models","sections":[],"depth":2},{"title":"డీకోడర్ నమూనాలు","local":"decoder-models","sections":[{"title":"ఆధునిక లార్జ్ లాంగ్వేజ్ మోడల్స్ (LLMలు)","local":"ఆధనక-లరజ-లగవజ-మడలస-llmల","sections":[{"title":"ఆధునిక LLMల యొక్క ముఖ్య సామర్థ్యాలు","local":"ఆధనక-llmల-యకక-మఖయ-సమరథయల","sections":[],"depth":4}],"depth":3}],"depth":2},{"title":"సీక్వెన్స్-టు-సీక్వెన్స్ నమూనాలు","local":"sequence-to-sequence-models","sections":[{"title":"ఆచరణాత్మక అనువర్తనాలు","local":"ఆచరణతమక-అనవరతనల","sections":[],"depth":3}],"depth":2},{"title":"సరైన నిర్మాణాన్ని ఎంచుకోవడం","local":"choosing-the-right-architecture","sections":[],"depth":2},{"title":"LLMల పరిణామం","local":"llmల-పరణమ","sections":[],"depth":2},{"title":"అటెన్షన్ మెకానిజమ్స్","local":"attention-mechanisms","sections":[{"title":"LSH అటెన్షన్","local":"lsh-అటనషన","sections":[],"depth":3},{"title":"లోకల్ అటెన్షన్","local":"లకల-అటనషన","sections":[],"depth":3},{"title":"యాక్సియల్ పొజిషనల్ ఎన్‌కోడింగ్స్","local":"యకసయల-పజషనల-ఎనకడగస","sections":[],"depth":3}],"depth":2},{"title":"ముగింపు","local":"conclusion","sections":[],"depth":2}],"depth":1}';function $n(h){return Nl(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class vn extends Vl{constructor(s){super(),Yl(this,s,$n,rn,Kl,{})}}export{vn as component};

Xet Storage Details

Size:
47 kB
·
Xet hash:
6a9cbe471a984a670054184a18b8cace7d6e93013cacf44b2a0998647784c2a6

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.