Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / course /pr_1069 /rum /_app /immutable /nodes /37.f004afc8.js

rtrm's picture

about 1 month ago

29.8 kB

	import{s as Ml,o as $l}from"../chunks/scheduler.37c15a92.js";import{S as yl,i as kl,g as d,s as c,r as M,A as hl,h as b,f as r,c as u,j as fl,u as $,x as _,k as dl,y as Tl,a as i,v as y,t as m,b as Je,d as p,w as k,p as je}from"../chunks/index.2bf4358c.js";import{Y as bl}from"../chunks/Youtube.1e50a667.js";import{C as g}from"../chunks/CodeBlock.4e987730.js";import{C as _l}from"../chunks/CourseFloatingBanner.6add7356.js";import{F as gl}from"../chunks/FrameworkSwitchCourse.8d4d4ab6.js";import{H as Ve,E as wl}from"../chunks/getInferenceSnippets.24b50994.js";function vl(f){let l,a;return l=new _l({props:{chapter:2,classNames:"absolute z-10 right-0 top-0",notebooks:[{label:"Google Colab",value:"https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"},{label:"Aws Studio",value:"https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_tf.ipynb"}]}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Jl(f){let l,a;return l=new _l({props:{chapter:2,classNames:"absolute z-10 right-0 top-0",notebooks:[{label:"Google Colab",value:"https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"},{label:"Aws Studio",value:"https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section3_pt.ipynb"}]}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function jl(f){let l,a;return l=new bl({props:{id:"d3JVgghSOew"}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Cl(f){let l,a;return l=new bl({props:{id:"AhChOFRegn4"}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Ul(f){let l,a="În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom utiliza clasa <code>TFAutoModel</code>, care este utilă atunci când doriți să instanțați un model dintr-un checkpoint.",t,s,h="Clasa <code>TFAutoModel</code> și toate clasele înrudite cu aceasta sunt de fapt simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.";return{c(){l=d("p"),l.innerHTML=a,t=c(),s=d("p"),s.innerHTML=h},l(o){l=b(o,"P",{"data-svelte-h":!0}),_(l)!=="svelte-b7aa80"&&(l.innerHTML=a),t=u(o),s=b(o,"P",{"data-svelte-h":!0}),_(s)!=="svelte-qkexty"&&(s.innerHTML=h)},m(o,T){i(o,l,T),i(o,t,T),i(o,s,T)},d(o){o&&(r(l),r(t),r(s))}}}function zl(f){let l,a="În această secțiune vom analiza mai detaliat crearea și utilizarea unui model. Vom folosi clasa <code>AutoModel</code>, care este utilă atunci când doriți să instanțiați orice model dintr-un checkpoint.",t,s,h="Clasa <code>AutoModel</code> și toate celelalte clase înrudite sunt, de fapt, simple wrappere ale gamei largi de modele disponibile în bibliotecă. Este un wrapper inteligent, deoarece poate ghici automat arhitectura modelului corespunzător pentru checkpoint-ul dumneavoastră și apoi instanțiază un model cu această arhitectură.";return{c(){l=d("p"),l.innerHTML=a,t=c(),s=d("p"),s.innerHTML=h},l(o){l=b(o,"P",{"data-svelte-h":!0}),_(l)!=="svelte-1denuzc"&&(l.innerHTML=a),t=u(o),s=b(o,"P",{"data-svelte-h":!0}),_(s)!=="svelte-1wbp86k"&&(s.innerHTML=h)},m(o,T){i(o,l,T),i(o,t,T),i(o,s,T)},d(o){o&&(r(l),r(t),r(s))}}}function Zl(f){let l,a;return l=new g({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEJlcnRDb25maWclMkMlMjBURkJlcnRNb2RlbCUwQSUwQSUyMyUyMENvbnN0cnVpcmVhJTIwY29uZmlndXJhJUM4JTlCaWVpJTBBY29uZmlnJTIwJTNEJTIwQmVydENvbmZpZygpJTBBJTBBJTIzJTIwJTIwQ29uc3RydWlyZWElMjBtb2RlbHVsdWklMjBwb3JuaW5kJTIwZGUlMjBsYSUyMGNvbmZpZ3VyYSVDOCU5QmllJTBBbW9kZWwlMjAlM0QlMjBURkJlcnRNb2RlbChjb25maWcp",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> BertConfig, TFBertModel

	<span class="hljs-comment"># Construirea configurației</span>
	config = BertConfig()

	<span class="hljs-comment"># Construirea modelului pornind de la configurație</span>
	model = TFBertModel(config)`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Wl(f){let l,a;return l=new g({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEJlcnRDb25maWclMkMlMjBCZXJ0TW9kZWwlMEElMEElMjMlMjBDb25zdHJ1aXJlYSUyMGNvbmZpZ3VyYSVDOCU5QmllaSUwQWNvbmZpZyUyMCUzRCUyMEJlcnRDb25maWcoKSUwQSUwQSUyMyUyMENvbnN0cnVpcmVhJTIwbW9kZWx1bHVpJTIwcG9ybmluZCUyMGRlJTIwbGElMjBjb25maWd1cmElQzglOUJpZSUwQW1vZGVsJTIwJTNEJTIwQmVydE1vZGVsKGNvbmZpZyk=",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> BertConfig, BertModel

	<span class="hljs-comment"># Construirea configurației</span>
	config = BertConfig()

	<span class="hljs-comment"># Construirea modelului pornind de la configurație</span>
	model = BertModel(config)`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Bl(f){let l,a;return l=new g({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEJlcnRDb25maWclMkMlMjBURkJlcnRNb2RlbCUwQSUwQWNvbmZpZyUyMCUzRCUyMEJlcnRDb25maWcoKSUwQW1vZGVsJTIwJTNEJTIwVEZCZXJ0TW9kZWwoY29uZmlnKSUwQSUwQSUyMyUyME1vZGVsdWwlMjBlc3RlJTIwaW5pJUM4JTlCaWFsaXphdCUyMGFsZWF0b3JpdSE=",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> BertConfig, TFBertModel

	config = BertConfig()
	model = TFBertModel(config)

	<span class="hljs-comment"># Modelul este inițializat aleatoriu!</span>`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function El(f){let l,a;return l=new g({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEJlcnRDb25maWclMkMlMjBCZXJ0TW9kZWwlMEElMEFjb25maWclMjAlM0QlMjBCZXJ0Q29uZmlnKCklMEFtb2RlbCUyMCUzRCUyMEJlcnRNb2RlbChjb25maWcpJTBBJTBBJTIzJTIwTW9kZWx1bCUyMGVzdGUlMjBpbmklQzglOUJpYWxpemF0JTIwYWxlYXRvcml1IQ==",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> BertConfig, BertModel

	config = BertConfig()
	model = BertModel(config)

	<span class="hljs-comment"># Modelul este inițializat aleatoriu!</span>`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function xl(f){let l,a,t,s="După cum ați văzut mai devreme, am putea înlocui <code>BertModel</code> cu clasa <code>AutoModel</code> echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod independent de checkpoint-uri; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).",h;return l=new g({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMFRGQmVydE1vZGVsJTBBJTBBbW9kZWwlMjAlM0QlMjBURkJlcnRNb2RlbC5mcm9tX3ByZXRyYWluZWQoJTIyYmVydC1iYXNlLWNhc2VkJTIyKQ==",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> TFBertModel

	model = TFBertModel.from_pretrained(<span class="hljs-string">"bert-base-cased"</span>)`,wrap:!1}}),{c(){M(l.$$.fragment),a=c(),t=d("p"),t.innerHTML=s},l(o){$(l.$$.fragment,o),a=u(o),t=b(o,"P",{"data-svelte-h":!0}),_(t)!=="svelte-p4tc5j"&&(t.innerHTML=s)},m(o,T){y(l,o,T),i(o,a,T),i(o,t,T),h=!0},i(o){h\|\|(p(l.$$.fragment,o),h=!0)},o(o){m(l.$$.fragment,o),h=!1},d(o){o&&(r(a),r(t)),k(l,o)}}}function Il(f){let l,a,t,s="După cum ați văzut mai devreme, am putea înlocui <code>BertModel</code> cu clasa <code>AutoModel</code> echivalentă. Vom face acest lucru în continuare, deoarece acest lucru produce un cod independent de checkpoint-uri; dacă codul dumneavoastră funcționează pentru un checkpoint, ar trebui să funcționeze fără probleme pentru altul. Acest lucru este valabil chiar dacă arhitectura este diferită, atât timp cât checkpoint-ul a fost instruit pentru o sarcină similară (de exemplu, o sarcină de analiză a sentimentelor).",h;return l=new g({props:{code:"ZnJvbSUyMHRyYW5zZm9ybWVycyUyMGltcG9ydCUyMEJlcnRNb2RlbCUwQSUwQW1vZGVsJTIwJTNEJTIwQmVydE1vZGVsLmZyb21fcHJldHJhaW5lZCglMjJiZXJ0LWJhc2UtY2FzZWQlMjIp",highlighted:`<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> BertModel

	model = BertModel.from_pretrained(<span class="hljs-string">"bert-base-cased"</span>)`,wrap:!1}}),{c(){M(l.$$.fragment),a=c(),t=d("p"),t.innerHTML=s},l(o){$(l.$$.fragment,o),a=u(o),t=b(o,"P",{"data-svelte-h":!0}),_(t)!=="svelte-p4tc5j"&&(t.innerHTML=s)},m(o,T){y(l,o,T),i(o,a,T),i(o,t,T),h=!0},i(o){h\|\|(p(l.$$.fragment,o),h=!0)},o(o){m(l.$$.fragment,o),h=!1},d(o){o&&(r(a),r(t)),k(l,o)}}}function Vl(f){let l,a;return l=new g({props:{code:"bHMlMjBkaXJlY3Rvcnlfb25fbXlfY29tcHV0ZXIlMEElMEFjb25maWcuanNvbiUyMHRmX21vZGVsLmg1",highlighted:`ls <span class="hljs-keyword">directory_on_my_computer
	</span>
	<span class="hljs-built_in">config</span>.<span class="hljs-keyword">json </span>tf_model.h5`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Rl(f){let l,a;return l=new g({props:{code:"bHMlMjBkaXJlY3Rvcnlfb25fbXlfY29tcHV0ZXIlMEElMEFjb25maWcuanNvbiUyMHB5dG9yY2hfbW9kZWwuc2FmZXRlbnNvcnM=",highlighted:`ls <span class="hljs-keyword">directory_on_my_computer
	</span>
	<span class="hljs-built_in">config</span>.<span class="hljs-keyword">json </span>pytorch_model.safetensors`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Hl(f){let l,a="Fișierul <em>tf_model.h5</em> este cunoscut sub numele de <em>state dictionary</em>; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.";return{c(){l=d("p"),l.innerHTML=a},l(t){l=b(t,"P",{"data-svelte-h":!0}),_(l)!=="svelte-14k6es9"&&(l.innerHTML=a)},m(t,s){i(t,l,s)},d(t){t&&r(l)}}}function Nl(f){let l,a="Fișierul <em>pytorch_model.safetensors</em> este cunoscut sub numele de <em>state dictionary</em>; acesta conține toate weight-urile modelului dumneavoastră. Cele două fișiere merg mână în mână; configurația este necesară pentru a cunoaște arhitectura modelului, în timp ce weight-urile modelului sunt parametrii modelului.";return{c(){l=d("p"),l.innerHTML=a},l(t){l=b(t,"P",{"data-svelte-h":!0}),_(l)!=="svelte-qjxs0s"&&(l.innerHTML=a)},m(t,s){i(t,l,s)},d(t){t&&r(l)}}}function Al(f){let l,a;return l=new g({props:{code:"aW1wb3J0JTIwdGVuc29yZmxvdyUyMGFzJTIwdGYlMEElMEFtb2RlbF9pbnB1dHMlMjAlM0QlMjB0Zi5jb25zdGFudChlbmNvZGVkX3NlcXVlbmNlcyk=",highlighted:`<span class="hljs-keyword">import</span> tensorflow <span class="hljs-keyword">as</span> tf

	model_inputs = tf.constant(encoded_sequences)`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Gl(f){let l,a;return l=new g({props:{code:"aW1wb3J0JTIwdG9yY2glMEElMEFtb2RlbF9pbnB1dHMlMjAlM0QlMjB0b3JjaC50ZW5zb3IoZW5jb2RlZF9zZXF1ZW5jZXMp",highlighted:`<span class="hljs-keyword">import</span> torch

	model_inputs = torch.tensor(encoded_sequences)`,wrap:!1}}),{c(){M(l.$$.fragment)},l(t){$(l.$$.fragment,t)},m(t,s){y(l,t,s),a=!0},i(t){a\|\|(p(l.$$.fragment,t),a=!0)},o(t){m(l.$$.fragment,t),a=!1},d(t){k(l,t)}}}function Ql(f){let l,a,t,s,h,o,T,He,w,v,Ce,J,j,Ue,ze,N,Ut="Cu toate acestea, dacă știți ce tip de model doriți să utilizați, puteți folosi direct clasa care definește arhitectura acestuia. Să aruncăm o privire la modul în care funcționează acest lucru cu un model BERT.",Ne,A,Ae,G,zt="Primul lucru pe care va trebui să îl facem pentru a inițializa un model BERT este să încărcăm un obiect de configurare:",Ge,C,U,Ze,Q,Zt="Configurația conține multe atribute care sunt utilizate pentru a construi modelul:",Qe,L,Le,F,Fe,S,Wt="Deși nu ați văzut încă ce fac toate aceste atribute, ar trebui să recunoașteți unele dintre ele: atributul <code>hidden_size</code> definește dimensiunea vectorului <code>hidden_states</code>, iar <code>num_hidden_layers</code> definește numărul de straturi pe care le are modelul Transformer.",Se,P,Pe,D,Bt="Crearea unui model din configurația implicită îl inițializează cu valori aleatorii:",De,z,Z,We,X,Et='Modelul poate fi utilizat în această stare, dar va produce rezultate neclare; mai întâi trebuie să fie antrenat. Am putea antrena modelul de la zero pentru sarcina în cauză, dar, după cum ați văzut în <a href="/course/chapter1">Capitolul 1</a>, acest lucru ar necesita mult timp și o mulțime de date și ar avea un impact semnificativ asupra mediului. Pentru a evita efortul inutil, este esențial să puteți partaja și reutiliza modelele care au fost deja antrenate.',Xe,Y,xt="Încărcarea unui model Transformer care este deja instruit este simplă - putem face acest lucru utilizând metoda <code>from_pretrained()</code>, care este analogă metodei <code>from_pretrained()</code> în PyTorch:",Ye,W,B,Be,q,It='În exemplul de cod de mai sus nu am utilizat <code>BertConfig</code> și, în loc de acesta, am încărcat un model preantrenat prin intermediul identificatorului <code>bert-base-cased</code>. Acesta este un checkpoint al modelului care a fost antrenat chiar de autorii BERT; puteți găsi mai multe detalii despre acesta în <a href="https://huggingface.co/bert-base-cased" rel="nofollow">model card</a>.',qe,O,Vt="Acest model este acum inițializat cu toate weight-urile din checkpoint. Acesta poate fi utilizat direct pentru inferență pe sarcinile pe care a fost antrenat și poate fi, de asemenea, ajustat pe o sarcină nouă. Prin antrenarea cu weight-uri preantrenate în prealabil, putem obține rapid rezultate bune.",Oe,K,Rt="Greutățile au fost descărcate și stocate în memorie cache (astfel încât apelurile viitoare la metoda <code>from_pretrained()</code> nu le vor descărca din nou) în folderul cache, care are ca valoare implicită <em>~/.cache/huggingface/transformers</em>. Puteți personaliza folderul cache prin setarea variabilei de mediu <code>HF_HOME</code>.",Ke,ee,Ht='Identificatorul utilizat pentru încărcarea modelului poate fi identificatorul oricărui model de pe Model Hub, atâta timp cât acesta este compatibil cu arhitectura BERT. Lista completă a checkpoint-urilor BERT disponibile poate fi găsită <a href="https://huggingface.co/models?filter=bert" rel="nofollow">aici</a>.',et,te,tt,le,Nt="Salvarea unui model este la fel de ușoară ca încărcarea unuia - folosim metoda <code>save_pretrained()</code>, care este analogă metodei <code>from_pretrained()</code>:",lt,ne,nt,ae,At="Se salvează două fișiere pe disc:",at,E,x,Ee,re,Gt="Dacă aruncați o privire la fișierul <em>config.json</em>, veți recunoaște atributele necesare pentru construirea arhitecturii modelului. Acest fișier conține, de asemenea, unele metadate, cum ar fi locul de origine al checkpoint-ului și ce versiune 🤗 Transformers ați folosit când ați salvat ultima dată checkpoint-ul.",rt,xe,ie,it,se,Qt="Acum că știți cum să încărcați și să salvați un model, să încercăm să îl folosim pentru a face câteva predicții. Modelele Transformer pot procesa doar numere - numere pe care le generează tokenizatorul. Dar înainte de a discuta despre tokenizeri, să explorăm ce intrări acceptă modelul.",st,oe,Lt="Tokenizerii se pot ocupa de transformarea intrărilor în tensori ai framework-ului corespunzător, dar pentru a vă ajuta să înțelegeți ce se întâmplă, vom arunca o privire rapidă la ceea ce trebuie făcut înainte de trimiterea intrărilor către model.",ot,ce,Ft="Să spunem că avem câteva secvențe:",ct,ue,ut,me,St="Tokenizatorul le convertește în indici de vocabular care sunt denumiți în mod obișnuit <em>input IDs</em>. Fiecare secvență este acum o listă de numere! Rezultatul este:",mt,pe,pt,fe,Pt="Aceasta este o listă de secvențe codificate: o listă de liste. Tensorii acceptă numai forme dreptunghiulare (gândiți-vă la matrici). Acest “array” are deja o formă dreptunghiulară, astfel încât convertirea sa într-un tensor este ușoară:",ft,I,V,Ie,de,dt,be,Dt="Utilizarea tensorilor cu ajutorul modelului este extrem de simplă - trebuie doar să apelăm modelul cu intrările:",bt,_e,_t,Me,Xt=`Deși modelul acceptă o mulțime de argumente diferite, doar ID-urile de intrare sunt necesare. Vom explica mai târziu ce fac celelalte argumente și când sunt necesare,
	dar mai întâi trebuie să aruncăm o privire mai atentă la tokenizerii care construiesc intrările pe care un model Transformer le poate înțelege.`,Mt,$e,$t,Re,yt;h=new gl({props:{fw:f[0]}}),T=new Ve({props:{title:"Modele",local:"modele",headingTag:"h1"}});const Yt=[Jl,vl],ye=[];function qt(e,n){return e[0]==="pt"?0:1}w=qt(f),v=ye[w]=Yt[w](f);const Ot=[Cl,jl],ke=[];function Kt(e,n){return e[0]==="pt"?0:1}J=Kt(f),j=ke[J]=Ot[J](f);function el(e,n){return e[0]==="pt"?zl:Ul}let kt=el(f),R=kt(f);A=new Ve({props:{title:"Crearea unui Transformer",local:"crearea-unui-transformer",headingTag:"h2"}});const tl=[Wl,Zl],he=[];function ll(e,n){return e[0]==="pt"?0:1}C=ll(f),U=he[C]=tl[C](f),L=new g({props:{code:"cHJpbnQoY29uZmlnKQ==",highlighted:'<span class="hljs-built_in">print</span>(config)',wrap:!1}}),F=new g({props:{code:"QmVydENvbmZpZyUyMCU3QiUwQSUyMCUyMCU1Qi4uLiU1RCUwQSUyMCUyMCUyMmhpZGRlbl9zaXplJTIyJTNBJTIwNzY4JTJDJTBBJTIwJTIwJTIyaW50ZXJtZWRpYXRlX3NpemUlMjIlM0ElMjAzMDcyJTJDJTBBJTIwJTIwJTIybWF4X3Bvc2l0aW9uX2VtYmVkZGluZ3MlMjIlM0ElMjA1MTIlMkMlMEElMjAlMjAlMjJudW1fYXR0ZW50aW9uX2hlYWRzJTIyJTNBJTIwMTIlMkMlMEElMjAlMjAlMjJudW1faGlkZGVuX2xheWVycyUyMiUzQSUyMDEyJTJDJTBBJTIwJTIwJTVCLi4uJTVEJTBBJTdE",highlighted:`BertConfig {
	[...]
	<span class="hljs-string">"hidden_size"</span>: <span class="hljs-number">768</span>,
	<span class="hljs-string">"intermediate_size"</span>: <span class="hljs-number">3072</span>,
	<span class="hljs-string">"max_position_embeddings"</span>: <span class="hljs-number">512</span>,
	<span class="hljs-string">"num_attention_heads"</span>: <span class="hljs-number">12</span>,
	<span class="hljs-string">"num_hidden_layers"</span>: <span class="hljs-number">12</span>,
	[...]
	}`,wrap:!1}}),P=new Ve({props:{title:"Diferite metode de încărcare",local:"diferite-metode-de-încărcare",headingTag:"h3"}});const nl=[El,Bl],Te=[];function al(e,n){return e[0]==="pt"?0:1}z=al(f),Z=Te[z]=nl[z](f);const rl=[Il,xl],ge=[];function il(e,n){return e[0]==="pt"?0:1}W=il(f),B=ge[W]=rl[W](f),te=new Ve({props:{title:"Metode de salvare",local:"metode-de-salvare",headingTag:"h3"}}),ne=new g({props:{code:"bW9kZWwuc2F2ZV9wcmV0cmFpbmVkKCUyMmRpcmVjdG9yeV9vbl9teV9jb21wdXRlciUyMik=",highlighted:'model.save_pretrained(<span class="hljs-string">"directory_on_my_computer"</span>)',wrap:!1}});const sl=[Rl,Vl],we=[];function ol(e,n){return e[0]==="pt"?0:1}E=ol(f),x=we[E]=sl[E](f);function cl(e,n){return e[0]==="pt"?Nl:Hl}let ht=cl(f),H=ht(f);ie=new Ve({props:{title:"Utilizarea unui model Transformer pentru inferență",local:"utilizarea-unui-model-transformer-pentru-inferență",headingTag:"h2"}}),ue=new g({props:{code:"c2VxdWVuY2VzJTIwJTNEJTIwJTVCJTIySGVsbG8hJTIyJTJDJTIwJTIyQ29vbC4lMjIlMkMlMjAlMjJOaWNlISUyMiU1RA==",highlighted:'sequences = [<span class="hljs-string">"Hello!"</span>, <span class="hljs-string">"Cool."</span>, <span class="hljs-string">"Nice!"</span>]',wrap:!1}}),pe=new g({props:{code:"ZW5jb2RlZF9zZXF1ZW5jZXMlMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIxMDElMkMlMjA3NTkyJTJDJTIwOTk5JTJDJTIwMTAyJTVEJTJDJTBBJTIwJTIwJTIwJTIwJTVCMTAxJTJDJTIwNDY1OCUyQyUyMDEwMTIlMkMlMjAxMDIlNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIxMDElMkMlMjAzODM1JTJDJTIwOTk5JTJDJTIwMTAyJTVEJTJDJTBBJTVE",highlighted:`encoded_sequences = [
	[<span class="hljs-number">101</span>, <span class="hljs-number">7592</span>, <span class="hljs-number">999</span>, <span class="hljs-number">102</span>],
	[<span class="hljs-number">101</span>, <span class="hljs-number">4658</span>, <span class="hljs-number">1012</span>, <span class="hljs-number">102</span>],
	[<span class="hljs-number">101</span>, <span class="hljs-number">3835</span>, <span class="hljs-number">999</span>, <span class="hljs-number">102</span>],
	]`,wrap:!1}});const ul=[Gl,Al],ve=[];function ml(e,n){return e[0]==="pt"?0:1}return I=ml(f),V=ve[I]=ul[I](f),de=new Ve({props:{title:"Utilizarea tensorilor ca intrări în model",local:"utilizarea-tensorilor-ca-intrări-în-model",headingTag:"h3"}}),_e=new g({props:{code:"b3V0cHV0JTIwJTNEJTIwbW9kZWwobW9kZWxfaW5wdXRzKQ==",highlighted:"output = model(model_inputs)",wrap:!1}}),$e=new wl({props:{source:"https://github.com/huggingface/course/blob/main/chapters/rum/chapter2/3.mdx"}}),{c(){l=d("meta"),a=c(),t=d("p"),s=c(),M(h.$$.fragment),o=c(),M(T.$$.fragment),He=c(),v.c(),Ce=c(),j.c(),Ue=c(),R.c(),ze=c(),N=d("p"),N.textContent=Ut,Ne=c(),M(A.$$.fragment),Ae=c(),G=d("p"),G.textContent=zt,Ge=c(),U.c(),Ze=c(),Q=d("p"),Q.textContent=Zt,Qe=c(),M(L.$$.fragment),Le=c(),M(F.$$.fragment),Fe=c(),S=d("p"),S.innerHTML=Wt,Se=c(),M(P.$$.fragment),Pe=c(),D=d("p"),D.textContent=Bt,De=c(),Z.c(),We=c(),X=d("p"),X.innerHTML=Et,Xe=c(),Y=d("p"),Y.innerHTML=xt,Ye=c(),B.c(),Be=c(),q=d("p"),q.innerHTML=It,qe=c(),O=d("p"),O.textContent=Vt,Oe=c(),K=d("p"),K.innerHTML=Rt,Ke=c(),ee=d("p"),ee.innerHTML=Ht,et=c(),M(te.$$.fragment),tt=c(),le=d("p"),le.innerHTML=Nt,lt=c(),M(ne.$$.fragment),nt=c(),ae=d("p"),ae.textContent=At,at=c(),x.c(),Ee=c(),re=d("p"),re.innerHTML=Gt,rt=c(),H.c(),xe=c(),M(ie.$$.fragment),it=c(),se=d("p"),se.textContent=Qt,st=c(),oe=d("p"),oe.textContent=Lt,ot=c(),ce=d("p"),ce.textContent=Ft,ct=c(),M(ue.$$.fragment),ut=c(),me=d("p"),me.innerHTML=St,mt=c(),M(pe.$$.fragment),pt=c(),fe=d("p"),fe.textContent=Pt,ft=c(),V.c(),Ie=c(),M(de.$$.fragment),dt=c(),be=d("p"),be.textContent=Dt,bt=c(),M(_e.$$.fragment),_t=c(),Me=d("p"),Me.textContent=Xt,Mt=c(),M($e.$$.fragment),$t=c(),Re=d("p"),this.h()},l(e){const n=hl("svelte-u9bgzb",document.head);l=b(n,"META",{name:!0,content:!0}),n.forEach(r),a=u(e),t=b(e,"P",{}),fl(t).forEach(r),s=u(e),$(h.$$.fragment,e),o=u(e),$(T.$$.fragment,e),He=u(e),v.l(e),Ce=u(e),j.l(e),Ue=u(e),R.l(e),ze=u(e),N=b(e,"P",{"data-svelte-h":!0}),_(N)!=="svelte-wrgk0v"&&(N.textContent=Ut),Ne=u(e),$(A.$$.fragment,e),Ae=u(e),G=b(e,"P",{"data-svelte-h":!0}),_(G)!=="svelte-1su4aqc"&&(G.textContent=zt),Ge=u(e),U.l(e),Ze=u(e),Q=b(e,"P",{"data-svelte-h":!0}),_(Q)!=="svelte-1q56w5h"&&(Q.textContent=Zt),Qe=u(e),$(L.$$.fragment,e),Le=u(e),$(F.$$.fragment,e),Fe=u(e),S=b(e,"P",{"data-svelte-h":!0}),_(S)!=="svelte-ocfq36"&&(S.innerHTML=Wt),Se=u(e),$(P.$$.fragment,e),Pe=u(e),D=b(e,"P",{"data-svelte-h":!0}),_(D)!=="svelte-n920qh"&&(D.textContent=Bt),De=u(e),Z.l(e),We=u(e),X=b(e,"P",{"data-svelte-h":!0}),_(X)!=="svelte-16cf2kl"&&(X.innerHTML=Et),Xe=u(e),Y=b(e,"P",{"data-svelte-h":!0}),_(Y)!=="svelte-rt4u8c"&&(Y.innerHTML=xt),Ye=u(e),B.l(e),Be=u(e),q=b(e,"P",{"data-svelte-h":!0}),_(q)!=="svelte-18vhbbp"&&(q.innerHTML=It),qe=u(e),O=b(e,"P",{"data-svelte-h":!0}),_(O)!=="svelte-1vogkl6"&&(O.textContent=Vt),Oe=u(e),K=b(e,"P",{"data-svelte-h":!0}),_(K)!=="svelte-1mjjruz"&&(K.innerHTML=Rt),Ke=u(e),ee=b(e,"P",{"data-svelte-h":!0}),_(ee)!=="svelte-11yh9v2"&&(ee.innerHTML=Ht),et=u(e),$(te.$$.fragment,e),tt=u(e),le=b(e,"P",{"data-svelte-h":!0}),_(le)!=="svelte-1j9ayn7"&&(le.innerHTML=Nt),lt=u(e),$(ne.$$.fragment,e),nt=u(e),ae=b(e,"P",{"data-svelte-h":!0}),_(ae)!=="svelte-k0x63"&&(ae.textContent=At),at=u(e),x.l(e),Ee=u(e),re=b(e,"P",{"data-svelte-h":!0}),_(re)!=="svelte-o0a46v"&&(re.innerHTML=Gt),rt=u(e),H.l(e),xe=u(e),$(ie.$$.fragment,e),it=u(e),se=b(e,"P",{"data-svelte-h":!0}),_(se)!=="svelte-1xgki2u"&&(se.textContent=Qt),st=u(e),oe=b(e,"P",{"data-svelte-h":!0}),_(oe)!=="svelte-18f99cr"&&(oe.textContent=Lt),ot=u(e),ce=b(e,"P",{"data-svelte-h":!0}),_(ce)!=="svelte-1xjuqha"&&(ce.textContent=Ft),ct=u(e),$(ue.$$.fragment,e),ut=u(e),me=b(e,"P",{"data-svelte-h":!0}),_(me)!=="svelte-imsdi8"&&(me.innerHTML=St),mt=u(e),$(pe.$$.fragment,e),pt=u(e),fe=b(e,"P",{"data-svelte-h":!0}),_(fe)!=="svelte-133z32a"&&(fe.textContent=Pt),ft=u(e),V.l(e),Ie=u(e),$(de.$$.fragment,e),dt=u(e),be=b(e,"P",{"data-svelte-h":!0}),_(be)!=="svelte-rcvdct"&&(be.textContent=Dt),bt=u(e),$(_e.$$.fragment,e),_t=u(e),Me=b(e,"P",{"data-svelte-h":!0}),_(Me)!=="svelte-1eymbdf"&&(Me.textContent=Xt),Mt=u(e),$($e.$$.fragment,e),$t=u(e),Re=b(e,"P",{}),fl(Re).forEach(r),this.h()},h(){dl(l,"name","hf:doc:metadata"),dl(l,"content",Ll)},m(e,n){Tl(document.head,l),i(e,a,n),i(e,t,n),i(e,s,n),y(h,e,n),i(e,o,n),y(T,e,n),i(e,He,n),ye[w].m(e,n),i(e,Ce,n),ke[J].m(e,n),i(e,Ue,n),R.m(e,n),i(e,ze,n),i(e,N,n),i(e,Ne,n),y(A,e,n),i(e,Ae,n),i(e,G,n),i(e,Ge,n),he[C].m(e,n),i(e,Ze,n),i(e,Q,n),i(e,Qe,n),y(L,e,n),i(e,Le,n),y(F,e,n),i(e,Fe,n),i(e,S,n),i(e,Se,n),y(P,e,n),i(e,Pe,n),i(e,D,n),i(e,De,n),Te[z].m(e,n),i(e,We,n),i(e,X,n),i(e,Xe,n),i(e,Y,n),i(e,Ye,n),ge[W].m(e,n),i(e,Be,n),i(e,q,n),i(e,qe,n),i(e,O,n),i(e,Oe,n),i(e,K,n),i(e,Ke,n),i(e,ee,n),i(e,et,n),y(te,e,n),i(e,tt,n),i(e,le,n),i(e,lt,n),y(ne,e,n),i(e,nt,n),i(e,ae,n),i(e,at,n),we[E].m(e,n),i(e,Ee,n),i(e,re,n),i(e,rt,n),H.m(e,n),i(e,xe,n),y(ie,e,n),i(e,it,n),i(e,se,n),i(e,st,n),i(e,oe,n),i(e,ot,n),i(e,ce,n),i(e,ct,n),y(ue,e,n),i(e,ut,n),i(e,me,n),i(e,mt,n),y(pe,e,n),i(e,pt,n),i(e,fe,n),i(e,ft,n),ve[I].m(e,n),i(e,Ie,n),y(de,e,n),i(e,dt,n),i(e,be,n),i(e,bt,n),y(_e,e,n),i(e,_t,n),i(e,Me,n),i(e,Mt,n),y($e,e,n),i(e,$t,n),i(e,Re,n),yt=!0},p(e,[n]){const pl={};n&1&&(pl.fw=e[0]),h.$set(pl);let Tt=w;w=qt(e),w!==Tt&&(je(),m(ye[Tt],1,1,()=>{ye[Tt]=null}),Je(),v=ye[w],v\|\|(v=ye[w]=Yt[w](e),v.c()),p(v,1),v.m(Ce.parentNode,Ce));let gt=J;J=Kt(e),J!==gt&&(je(),m(ke[gt],1,1,()=>{ke[gt]=null}),Je(),j=ke[J],j\|\|(j=ke[J]=Ot[J](e),j.c()),p(j,1),j.m(Ue.parentNode,Ue)),kt!==(kt=el(e))&&(R.d(1),R=kt(e),R&&(R.c(),R.m(ze.parentNode,ze)));let wt=C;C=ll(e),C!==wt&&(je(),m(he[wt],1,1,()=>{he[wt]=null}),Je(),U=he[C],U\|\|(U=he[C]=tl[C](e),U.c()),p(U,1),U.m(Ze.parentNode,Ze));let vt=z;z=al(e),z!==vt&&(je(),m(Te[vt],1,1,()=>{Te[vt]=null}),Je(),Z=Te[z],Z\|\|(Z=Te[z]=nl[z](e),Z.c()),p(Z,1),Z.m(We.parentNode,We));let Jt=W;W=il(e),W!==Jt&&(je(),m(ge[Jt],1,1,()=>{ge[Jt]=null}),Je(),B=ge[W],B\|\|(B=ge[W]=rl[W](e),B.c()),p(B,1),B.m(Be.parentNode,Be));let jt=E;E=ol(e),E!==jt&&(je(),m(we[jt],1,1,()=>{we[jt]=null}),Je(),x=we[E],x\|\|(x=we[E]=sl[E](e),x.c()),p(x,1),x.m(Ee.parentNode,Ee)),ht!==(ht=cl(e))&&(H.d(1),H=ht(e),H&&(H.c(),H.m(xe.parentNode,xe)));let Ct=I;I=ml(e),I!==Ct&&(je(),m(ve[Ct],1,1,()=>{ve[Ct]=null}),Je(),V=ve[I],V\|\|(V=ve[I]=ul[I](e),V.c()),p(V,1),V.m(Ie.parentNode,Ie))},i(e){yt\|\|(p(h.$$.fragment,e),p(T.$$.fragment,e),p(v),p(j),p(A.$$.fragment,e),p(U),p(L.$$.fragment,e),p(F.$$.fragment,e),p(P.$$.fragment,e),p(Z),p(B),p(te.$$.fragment,e),p(ne.$$.fragment,e),p(x),p(ie.$$.fragment,e),p(ue.$$.fragment,e),p(pe.$$.fragment,e),p(V),p(de.$$.fragment,e),p(_e.$$.fragment,e),p($e.$$.fragment,e),yt=!0)},o(e){m(h.$$.fragment,e),m(T.$$.fragment,e),m(v),m(j),m(A.$$.fragment,e),m(U),m(L.$$.fragment,e),m(F.$$.fragment,e),m(P.$$.fragment,e),m(Z),m(B),m(te.$$.fragment,e),m(ne.$$.fragment,e),m(x),m(ie.$$.fragment,e),m(ue.$$.fragment,e),m(pe.$$.fragment,e),m(V),m(de.$$.fragment,e),m(_e.$$.fragment,e),m($e.$$.fragment,e),yt=!1},d(e){e&&(r(a),r(t),r(s),r(o),r(He),r(Ce),r(Ue),r(ze),r(N),r(Ne),r(Ae),r(G),r(Ge),r(Ze),r(Q),r(Qe),r(Le),r(Fe),r(S),r(Se),r(Pe),r(D),r(De),r(We),r(X),r(Xe),r(Y),r(Ye),r(Be),r(q),r(qe),r(O),r(Oe),r(K),r(Ke),r(ee),r(et),r(tt),r(le),r(lt),r(nt),r(ae),r(at),r(Ee),r(re),r(rt),r(xe),r(it),r(se),r(st),r(oe),r(ot),r(ce),r(ct),r(ut),r(me),r(mt),r(pt),r(fe),r(ft),r(Ie),r(dt),r(be),r(bt),r(_t),r(Me),r(Mt),r($t),r(Re)),r(l),k(h,e),k(T,e),ye[w].d(e),ke[J].d(e),R.d(e),k(A,e),he[C].d(e),k(L,e),k(F,e),k(P,e),Te[z].d(e),ge[W].d(e),k(te,e),k(ne,e),we[E].d(e),H.d(e),k(ie,e),k(ue,e),k(pe,e),ve[I].d(e),k(de,e),k(_e,e),k($e,e)}}}const Ll='{"title":"Modele","local":"modele","sections":[{"title":"Crearea unui Transformer","local":"crearea-unui-transformer","sections":[{"title":"Diferite metode de încărcare","local":"diferite-metode-de-încărcare","sections":[],"depth":3},{"title":"Metode de salvare","local":"metode-de-salvare","sections":[],"depth":3}],"depth":2},{"title":"Utilizarea unui model Transformer pentru inferență","local":"utilizarea-unui-model-transformer-pentru-inferență","sections":[{"title":"Utilizarea tensorilor ca intrări în model","local":"utilizarea-tensorilor-ca-intrări-în-model","sections":[],"depth":3}],"depth":2}],"depth":1}';function Fl(f,l,a){let t="pt";return $l(()=>{const s=new URLSearchParams(window.location.search);a(0,t=s.get("fw")\|\|"pt")}),[t]}class Kl extends yl{constructor(l){super(),kl(this,l,Fl,Ql,Ml,{})}}export{Kl as component};

Xet Storage Details

Size:: 29.8 kB
Xet hash:: b9b1e87f22853b305ac6bc2647d412f42239e3ff97dbe8c36e6fce69e65d974c

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.