Buckets:

rtrm's picture
download
raw
50.2 kB
import{s as Ce,o as Ie,n as ke}from"../chunks/scheduler.37c15a92.js";import{S as Ve,i as Ae,g as d,s as i,r as b,A as Ze,h as J,f as p,c as u,j as Te,u as j,x as T,k as he,y as Qe,a as M,v as y,t as c,b as v,d as m,w as f,p as B}from"../chunks/index.2bf4358c.js";import{T as we}from"../chunks/Tip.363c041f.js";import{Y as _e}from"../chunks/Youtube.1e50a667.js";import{C as h}from"../chunks/CodeBlock.4e987730.js";import{C as $e}from"../chunks/CourseFloatingBanner.9ff4c771.js";import{F as Ee}from"../chunks/FrameworkSwitchCourse.8d4d4ab6.js";import{H as Xl,E as Ne}from"../chunks/getInferenceSnippets.ebf8be91.js";function ge(o){let e,a;return e=new $e({props:{chapter:2,classNames:"absolute z-10 right-0 top-0",notebooks:[{label:"Google Colab",value:"https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"},{label:"Aws Studio",value:"https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_tf.ipynb"}]}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function We(o){let e,a;return e=new $e({props:{chapter:2,classNames:"absolute z-10 right-0 top-0",notebooks:[{label:"Google Colab",value:"https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"},{label:"Aws Studio",value:"https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter2/section5_pt.ipynb"}]}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function Re(o){let e,a;return e=new _e({props:{id:"ROxrFOEbsQE"}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function Ge(o){let e,a;return e=new _e({props:{id:"M6adb1j2jPI"}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function ze(o){let e,a,s,r;return e=new h({props:{code:"aW1wb3J0JTIwdGVuc29yZmxvdyUyMGFzJTIwdGYlMEFmcm9tJTIwdHJhbnNmb3JtZXJzJTIwaW1wb3J0JTIwQXV0b1Rva2VuaXplciUyQyUyMFRGQXV0b01vZGVsRm9yU2VxdWVuY2VDbGFzc2lmaWNhdGlvbiUwQSUwQWNoZWNrcG9pbnQlMjAlM0QlMjAlMjJkaXN0aWxiZXJ0LWJhc2UtdW5jYXNlZC1maW5ldHVuZWQtc3N0LTItZW5nbGlzaCUyMiUwQXRva2VuaXplciUyMCUzRCUyMEF1dG9Ub2tlbml6ZXIuZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQpJTBBbW9kZWwlMjAlM0QlMjBURkF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQpJTBBJTBBc2VxdWVuY2UlMjAlM0QlMjAlMjJJJ3ZlJTIwYmVlbiUyMHdhaXRpbmclMjBmb3IlMjBhJTIwSHVnZ2luZ0ZhY2UlMjBjb3Vyc2UlMjBteSUyMHdob2xlJTIwbGlmZS4lMjIlMEElMEF0b2tlbnMlMjAlM0QlMjB0b2tlbml6ZXIudG9rZW5pemUoc2VxdWVuY2UpJTBBaWRzJTIwJTNEJTIwdG9rZW5pemVyLmNvbnZlcnRfdG9rZW5zX3RvX2lkcyh0b2tlbnMpJTBBaW5wdXRfaWRzJTIwJTNEJTIwdGYuY29uc3RhbnQoaWRzKSUwQSUyMyUyMCVEMCVBRCVEMSU4MiVEMCVCMCUyMCVEMSU4MSVEMSU4MiVEMSU4MCVEMCVCRSVEMCVCQSVEMCVCMCUyMCVEMCVCMiVEMSU4QiVEMCVCNCVEMCVCMCVEMSU4MSVEMSU4MiUyMCVEMCVCRSVEMSU4OCVEMCVCOCVEMCVCMSVEMCVCQSVEMSU4My4lMEFtb2RlbChpbnB1dF9pZHMp",highlighted:`<span class="hljs-keyword">import</span> tensorflow <span class="hljs-keyword">as</span> tf
<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoTokenizer, TFAutoModelForSequenceClassification
checkpoint = <span class="hljs-string">&quot;distilbert-base-uncased-finetuned-sst-2-english&quot;</span>
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
sequence = <span class="hljs-string">&quot;I&#x27;ve been waiting for a HuggingFace course my whole life.&quot;</span>
tokens = tokenizer.tokenize(sequence)
ids = tokenizer.convert_tokens_to_ids(tokens)
input_ids = tf.constant(ids)
<span class="hljs-comment"># Эта строка выдаст ошибку.</span>
model(input_ids)`,wrap:!1}}),s=new h({props:{code:"SW52YWxpZEFyZ3VtZW50RXJyb3IlM0ElMjBJbnB1dCUyMHRvJTIwcmVzaGFwZSUyMGlzJTIwYSUyMHRlbnNvciUyMHdpdGglMjAxNCUyMHZhbHVlcyUyQyUyMGJ1dCUyMHRoZSUyMHJlcXVlc3RlZCUyMHNoYXBlJTIwaGFzJTIwMTk2JTIwJTVCT3AlM0FSZXNoYXBlJTVE",highlighted:'InvalidArgumentError: Input to reshape <span class="hljs-keyword">is</span> a tensor <span class="hljs-keyword">with</span> <span class="hljs-number">14</span> values, but the requested shape has <span class="hljs-number">196</span> [Op:Reshape]',wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function Xe(o){let e,a,s,r;return e=new h({props:{code:"aW1wb3J0JTIwdG9yY2glMEFmcm9tJTIwdHJhbnNmb3JtZXJzJTIwaW1wb3J0JTIwQXV0b1Rva2VuaXplciUyQyUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24lMEElMEFjaGVja3BvaW50JTIwJTNEJTIwJTIyZGlzdGlsYmVydC1iYXNlLXVuY2FzZWQtZmluZXR1bmVkLXNzdC0yLWVuZ2xpc2glMjIlMEF0b2tlbml6ZXIlMjAlM0QlMjBBdXRvVG9rZW5pemVyLmZyb21fcHJldHJhaW5lZChjaGVja3BvaW50KSUwQW1vZGVsJTIwJTNEJTIwQXV0b01vZGVsRm9yU2VxdWVuY2VDbGFzc2lmaWNhdGlvbi5mcm9tX3ByZXRyYWluZWQoY2hlY2twb2ludCklMEElMEFzZXF1ZW5jZSUyMCUzRCUyMCUyMkkndmUlMjBiZWVuJTIwd2FpdGluZyUyMGZvciUyMGElMjBIdWdnaW5nRmFjZSUyMGNvdXJzZSUyMG15JTIwd2hvbGUlMjBsaWZlLiUyMiUwQSUwQXRva2VucyUyMCUzRCUyMHRva2VuaXplci50b2tlbml6ZShzZXF1ZW5jZSklMEFpZHMlMjAlM0QlMjB0b2tlbml6ZXIuY29udmVydF90b2tlbnNfdG9faWRzKHRva2VucyklMEFpbnB1dF9pZHMlMjAlM0QlMjB0b3JjaC50ZW5zb3IoaWRzKSUwQSUyMyUyMCVEMCVBRCVEMSU4MiVEMCVCMCUyMCVEMSU4MSVEMSU4MiVEMSU4MCVEMCVCRSVEMCVCQSVEMCVCMCUyMCVEMCVCMiVEMSU4QiVEMCVCNCVEMCVCMCVEMSU4MSVEMSU4MiUyMCVEMCVCRSVEMSU4OCVEMCVCOCVEMCVCMSVEMCVCQSVEMSU4My4lMEFtb2RlbChpbnB1dF9pZHMp",highlighted:`<span class="hljs-keyword">import</span> torch
<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoTokenizer, AutoModelForSequenceClassification
checkpoint = <span class="hljs-string">&quot;distilbert-base-uncased-finetuned-sst-2-english&quot;</span>
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
sequence = <span class="hljs-string">&quot;I&#x27;ve been waiting for a HuggingFace course my whole life.&quot;</span>
tokens = tokenizer.tokenize(sequence)
ids = tokenizer.convert_tokens_to_ids(tokens)
input_ids = torch.tensor(ids)
<span class="hljs-comment"># Эта строка выдаст ошибку.</span>
model(input_ids)`,wrap:!1}}),s=new h({props:{code:"SW5kZXhFcnJvciUzQSUyMERpbWVuc2lvbiUyMG91dCUyMG9mJTIwcmFuZ2UlMjAoZXhwZWN0ZWQlMjB0byUyMGJlJTIwaW4lMjByYW5nZSUyMG9mJTIwJTVCLTElMkMlMjAwJTVEJTJDJTIwYnV0JTIwZ290JTIwMSk=",highlighted:'IndexError: Dimension out of <span class="hljs-built_in">range</span> (expected to be <span class="hljs-keyword">in</span> <span class="hljs-built_in">range</span> of [-<span class="hljs-number">1</span>, <span class="hljs-number">0</span>], but got <span class="hljs-number">1</span>)',wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function ve(o){let e,a,s,r;return e=new h({props:{code:"dG9rZW5pemVkX2lucHV0cyUyMCUzRCUyMHRva2VuaXplcihzZXF1ZW5jZSUyQyUyMHJldHVybl90ZW5zb3JzJTNEJTIydGYlMjIpJTBBcHJpbnQodG9rZW5pemVkX2lucHV0cyU1QiUyMmlucHV0X2lkcyUyMiU1RCk=",highlighted:`tokenized_inputs = tokenizer(sequence, return_tensors=<span class="hljs-string">&quot;tf&quot;</span>)
<span class="hljs-built_in">print</span>(tokenized_inputs[<span class="hljs-string">&quot;input_ids&quot;</span>])`,wrap:!1}}),s=new h({props:{code:"JTNDdGYuVGVuc29yJTNBJTIwc2hhcGUlM0QoMSUyQyUyMDE2KSUyQyUyMGR0eXBlJTNEaW50MzIlMkMlMjBudW1weSUzRCUwQWFycmF5KCU1QiU1QiUyMCUyMDEwMSUyQyUyMCUyMDEwNDUlMkMlMjAlMjAxMDA1JTJDJTIwJTIwMjMxMCUyQyUyMCUyMDIwNDIlMkMlMjAlMjAzNDAzJTJDJTIwJTIwMjAwNSUyQyUyMCUyMDEwMzclMkMlMjAxNzY2MiUyQyUwQSUyMCUyMCUyMCUyMCUyMCUyMCUyMCUyMDEyMTcyJTJDJTIwJTIwMjYwNyUyQyUyMCUyMDIwMjYlMkMlMjAlMjAyODc4JTJDJTIwJTIwMjE2NiUyQyUyMCUyMDEwMTIlMkMlMjAlMjAlMjAxMDIlNUQlNUQlMkMlMjBkdHlwZSUzRGludDMyKSUzRQ==",highlighted:`&lt;tf.Tensor: shape=(<span class="hljs-number">1</span>, <span class="hljs-number">16</span>), dtype=int32, numpy=
array([[ <span class="hljs-number">101</span>, <span class="hljs-number">1045</span>, <span class="hljs-number">1005</span>, <span class="hljs-number">2310</span>, <span class="hljs-number">2042</span>, <span class="hljs-number">3403</span>, <span class="hljs-number">2005</span>, <span class="hljs-number">1037</span>, <span class="hljs-number">17662</span>,
<span class="hljs-number">12172</span>, <span class="hljs-number">2607</span>, <span class="hljs-number">2026</span>, <span class="hljs-number">2878</span>, <span class="hljs-number">2166</span>, <span class="hljs-number">1012</span>, <span class="hljs-number">102</span>]], dtype=int32)&gt;`,wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function Be(o){let e,a,s,r;return e=new h({props:{code:"dG9rZW5pemVkX2lucHV0cyUyMCUzRCUyMHRva2VuaXplcihzZXF1ZW5jZSUyQyUyMHJldHVybl90ZW5zb3JzJTNEJTIycHQlMjIpJTBBcHJpbnQodG9rZW5pemVkX2lucHV0cyU1QiUyMmlucHV0X2lkcyUyMiU1RCk=",highlighted:`tokenized_inputs = tokenizer(sequence, return_tensors=<span class="hljs-string">&quot;pt&quot;</span>)
<span class="hljs-built_in">print</span>(tokenized_inputs[<span class="hljs-string">&quot;input_ids&quot;</span>])`,wrap:!1}}),s=new h({props:{code:"dGVuc29yKCU1QiU1QiUyMCUyMDEwMSUyQyUyMCUyMDEwNDUlMkMlMjAlMjAxMDA1JTJDJTIwJTIwMjMxMCUyQyUyMCUyMDIwNDIlMkMlMjAlMjAzNDAzJTJDJTIwJTIwMjAwNSUyQyUyMCUyMDEwMzclMkMlMjAxNzY2MiUyQyUyMDEyMTcyJTJDJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwMjYwNyUyQyUyMCUyMDIwMjYlMkMlMjAlMjAyODc4JTJDJTIwJTIwMjE2NiUyQyUyMCUyMDEwMTIlMkMlMjAlMjAlMjAxMDIlNUQlNUQp",highlighted:`tensor([[ <span class="hljs-number">101</span>, <span class="hljs-number">1045</span>, <span class="hljs-number">1005</span>, <span class="hljs-number">2310</span>, <span class="hljs-number">2042</span>, <span class="hljs-number">3403</span>, <span class="hljs-number">2005</span>, <span class="hljs-number">1037</span>, <span class="hljs-number">17662</span>, <span class="hljs-number">12172</span>,
<span class="hljs-number">2607</span>, <span class="hljs-number">2026</span>, <span class="hljs-number">2878</span>, <span class="hljs-number">2166</span>, <span class="hljs-number">1012</span>, <span class="hljs-number">102</span>]])`,wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function De(o){let e,a;return e=new h({props:{code:"aW1wb3J0JTIwdGVuc29yZmxvdyUyMGFzJTIwdGYlMEFmcm9tJTIwdHJhbnNmb3JtZXJzJTIwaW1wb3J0JTIwQXV0b1Rva2VuaXplciUyQyUyMFRGQXV0b01vZGVsRm9yU2VxdWVuY2VDbGFzc2lmaWNhdGlvbiUwQSUwQWNoZWNrcG9pbnQlMjAlM0QlMjAlMjJkaXN0aWxiZXJ0LWJhc2UtdW5jYXNlZC1maW5ldHVuZWQtc3N0LTItZW5nbGlzaCUyMiUwQXRva2VuaXplciUyMCUzRCUyMEF1dG9Ub2tlbml6ZXIuZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQpJTBBbW9kZWwlMjAlM0QlMjBURkF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQpJTBBJTBBc2VxdWVuY2UlMjAlM0QlMjAlMjJJJ3ZlJTIwYmVlbiUyMHdhaXRpbmclMjBmb3IlMjBhJTIwSHVnZ2luZ0ZhY2UlMjBjb3Vyc2UlMjBteSUyMHdob2xlJTIwbGlmZS4lMjIlMEElMEF0b2tlbnMlMjAlM0QlMjB0b2tlbml6ZXIudG9rZW5pemUoc2VxdWVuY2UpJTBBaWRzJTIwJTNEJTIwdG9rZW5pemVyLmNvbnZlcnRfdG9rZW5zX3RvX2lkcyh0b2tlbnMpJTBBJTBBaW5wdXRfaWRzJTIwJTNEJTIwdGYuY29uc3RhbnQoJTVCaWRzJTVEKSUwQXByaW50KCUyMklucHV0JTIwSURzJTNBJTIyJTJDJTIwaW5wdXRfaWRzKSUwQSUwQW91dHB1dCUyMCUzRCUyMG1vZGVsKGlucHV0X2lkcyklMEFwcmludCglMjJMb2dpdHMlM0ElMjIlMkMlMjBvdXRwdXQubG9naXRzKQ==",highlighted:`<span class="hljs-keyword">import</span> tensorflow <span class="hljs-keyword">as</span> tf
<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoTokenizer, TFAutoModelForSequenceClassification
checkpoint = <span class="hljs-string">&quot;distilbert-base-uncased-finetuned-sst-2-english&quot;</span>
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
sequence = <span class="hljs-string">&quot;I&#x27;ve been waiting for a HuggingFace course my whole life.&quot;</span>
tokens = tokenizer.tokenize(sequence)
ids = tokenizer.convert_tokens_to_ids(tokens)
input_ids = tf.constant([ids])
<span class="hljs-built_in">print</span>(<span class="hljs-string">&quot;Input IDs:&quot;</span>, input_ids)
output = model(input_ids)
<span class="hljs-built_in">print</span>(<span class="hljs-string">&quot;Logits:&quot;</span>, output.logits)`,wrap:!1}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function Se(o){let e,a;return e=new h({props:{code:"aW1wb3J0JTIwdG9yY2glMEFmcm9tJTIwdHJhbnNmb3JtZXJzJTIwaW1wb3J0JTIwQXV0b1Rva2VuaXplciUyQyUyMEF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24lMEElMEFjaGVja3BvaW50JTIwJTNEJTIwJTIyZGlzdGlsYmVydC1iYXNlLXVuY2FzZWQtZmluZXR1bmVkLXNzdC0yLWVuZ2xpc2glMjIlMEF0b2tlbml6ZXIlMjAlM0QlMjBBdXRvVG9rZW5pemVyLmZyb21fcHJldHJhaW5lZChjaGVja3BvaW50KSUwQW1vZGVsJTIwJTNEJTIwQXV0b01vZGVsRm9yU2VxdWVuY2VDbGFzc2lmaWNhdGlvbi5mcm9tX3ByZXRyYWluZWQoY2hlY2twb2ludCklMEElMEFzZXF1ZW5jZSUyMCUzRCUyMCUyMkkndmUlMjBiZWVuJTIwd2FpdGluZyUyMGZvciUyMGElMjBIdWdnaW5nRmFjZSUyMGNvdXJzZSUyMG15JTIwd2hvbGUlMjBsaWZlLiUyMiUwQSUwQXRva2VucyUyMCUzRCUyMHRva2VuaXplci50b2tlbml6ZShzZXF1ZW5jZSklMEFpZHMlMjAlM0QlMjB0b2tlbml6ZXIuY29udmVydF90b2tlbnNfdG9faWRzKHRva2VucyklMEElMEFpbnB1dF9pZHMlMjAlM0QlMjB0b3JjaC50ZW5zb3IoJTVCaWRzJTVEKSUwQXByaW50KCUyMklucHV0JTIwSURzJTNBJTIyJTJDJTIwaW5wdXRfaWRzKSUwQSUwQW91dHB1dCUyMCUzRCUyMG1vZGVsKGlucHV0X2lkcyklMEFwcmludCglMjJMb2dpdHMlM0ElMjIlMkMlMjBvdXRwdXQubG9naXRzKQ==",highlighted:`<span class="hljs-keyword">import</span> torch
<span class="hljs-keyword">from</span> transformers <span class="hljs-keyword">import</span> AutoTokenizer, AutoModelForSequenceClassification
checkpoint = <span class="hljs-string">&quot;distilbert-base-uncased-finetuned-sst-2-english&quot;</span>
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
sequence = <span class="hljs-string">&quot;I&#x27;ve been waiting for a HuggingFace course my whole life.&quot;</span>
tokens = tokenizer.tokenize(sequence)
ids = tokenizer.convert_tokens_to_ids(tokens)
input_ids = torch.tensor([ids])
<span class="hljs-built_in">print</span>(<span class="hljs-string">&quot;Input IDs:&quot;</span>, input_ids)
output = model(input_ids)
<span class="hljs-built_in">print</span>(<span class="hljs-string">&quot;Logits:&quot;</span>, output.logits)`,wrap:!1}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function Fe(o){let e,a;return e=new h({props:{code:"SW5wdXQlMjBJRHMlM0ElMjB0Zi5UZW5zb3IoJTBBJTVCJTVCJTIwMTA0NSUyMCUyMDEwMDUlMjAlMjAyMzEwJTIwJTIwMjA0MiUyMCUyMDM0MDMlMjAlMjAyMDA1JTIwJTIwMTAzNyUyMDE3NjYyJTIwMTIxNzIlMjAlMjAyNjA3JTIwJTIwMjAyNiUyMCUyMDI4NzglMEElMjAlMjAlMjAyMTY2JTIwJTIwMTAxMiU1RCU1RCUyQyUyMHNoYXBlJTNEKDElMkMlMjAxNCklMkMlMjBkdHlwZSUzRGludDMyKSUwQUxvZ2l0cyUzQSUyMHRmLlRlbnNvciglNUIlNUItMi43Mjc2MjA4JTIwJTIwMi44Nzg5Mzc3JTVEJTVEJTJDJTIwc2hhcGUlM0QoMSUyQyUyMDIpJTJDJTIwZHR5cGUlM0RmbG9hdDMyKQ==",highlighted:`Input IDs: tf.Tensor(
[[ <span class="hljs-number">1045</span> <span class="hljs-number">1005</span> <span class="hljs-number">2310</span> <span class="hljs-number">2042</span> <span class="hljs-number">3403</span> <span class="hljs-number">2005</span> <span class="hljs-number">1037</span> <span class="hljs-number">17662</span> <span class="hljs-number">12172</span> <span class="hljs-number">2607</span> <span class="hljs-number">2026</span> <span class="hljs-number">2878</span>
<span class="hljs-number">2166</span> <span class="hljs-number">1012</span>]], shape=(<span class="hljs-number">1</span>, <span class="hljs-number">14</span>), dtype=int32)
Logits: tf.Tensor([[-<span class="hljs-number">2.7276208</span> <span class="hljs-number">2.8789377</span>]], shape=(<span class="hljs-number">1</span>, <span class="hljs-number">2</span>), dtype=float32)`,wrap:!1}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function He(o){let e,a;return e=new h({props:{code:"SW5wdXQlMjBJRHMlM0ElMjAlNUIlNUIlMjAxMDQ1JTJDJTIwJTIwMTAwNSUyQyUyMCUyMDIzMTAlMkMlMjAlMjAyMDQyJTJDJTIwJTIwMzQwMyUyQyUyMCUyMDIwMDUlMkMlMjAlMjAxMDM3JTJDJTIwMTc2NjIlMkMlMjAxMjE3MiUyQyUyMCUyMDI2MDclMkMlMjAyMDI2JTJDJTIwJTIwMjg3OCUyQyUyMCUyMDIxNjYlMkMlMjAlMjAxMDEyJTVEJTVEJTBBTG9naXRzJTNBJTIwJTVCJTVCLTIuNzI3NiUyQyUyMCUyMDIuODc4OSU1RCU1RA==",highlighted:`Input IDs: [[ <span class="hljs-number">1045</span>, <span class="hljs-number">1005</span>, <span class="hljs-number">2310</span>, <span class="hljs-number">2042</span>, <span class="hljs-number">3403</span>, <span class="hljs-number">2005</span>, <span class="hljs-number">1037</span>, <span class="hljs-number">17662</span>, <span class="hljs-number">12172</span>, <span class="hljs-number">2607</span>, <span class="hljs-number">2026</span>, <span class="hljs-number">2878</span>, <span class="hljs-number">2166</span>, <span class="hljs-number">1012</span>]]
Logits: [[-<span class="hljs-number">2.7276</span>, <span class="hljs-number">2.8789</span>]]`,wrap:!1}}),{c(){b(e.$$.fragment)},l(s){j(e.$$.fragment,s)},m(s,r){y(e,s,r),a=!0},i(s){a||(m(e.$$.fragment,s),a=!0)},o(s){c(e.$$.fragment,s),a=!1},d(s){f(e,s)}}}function xe(o){let e,a="✏️ <strong>Попробуйте!</strong> Преобразуйте этот список <code>batched_ids</code> в тензор и пропустите его через вашу модель. Проверьте, что вы получаете те же логиты, что и раньше (но дважды)!";return{c(){e=d("p"),e.innerHTML=a},l(s){e=J(s,"P",{"data-svelte-h":!0}),T(e)!=="svelte-uxsvrw"&&(e.innerHTML=a)},m(s,r){M(s,e,r)},p:ke,d(s){s&&p(e)}}}function Ye(o){let e,a,s,r;return e=new h({props:{code:"bW9kZWwlMjAlM0QlMjBURkF1dG9Nb2RlbEZvclNlcXVlbmNlQ2xhc3NpZmljYXRpb24uZnJvbV9wcmV0cmFpbmVkKGNoZWNrcG9pbnQpJTBBJTBBc2VxdWVuY2UxX2lkcyUyMCUzRCUyMCU1QiU1QjIwMCUyQyUyMDIwMCUyQyUyMDIwMCU1RCU1RCUwQXNlcXVlbmNlMl9pZHMlMjAlM0QlMjAlNUIlNUIyMDAlMkMlMjAyMDAlNUQlNUQlMEFiYXRjaGVkX2lkcyUyMCUzRCUyMCU1QiUwQSUyMCUyMCUyMCUyMCU1QjIwMCUyQyUyMDIwMCUyQyUyMDIwMCU1RCUyQyUwQSUyMCUyMCUyMCUyMCU1QjIwMCUyQyUyMDIwMCUyQyUyMHRva2VuaXplci5wYWRfdG9rZW5faWQlNUQlMkMlMEElNUQlMEElMEFwcmludChtb2RlbCh0Zi5jb25zdGFudChzZXF1ZW5jZTFfaWRzKSkubG9naXRzKSUwQXByaW50KG1vZGVsKHRmLmNvbnN0YW50KHNlcXVlbmNlMl9pZHMpKS5sb2dpdHMpJTBBcHJpbnQobW9kZWwodGYuY29uc3RhbnQoYmF0Y2hlZF9pZHMpKS5sb2dpdHMp",highlighted:`model = TFAutoModelForSequenceClassification.from_pretrained(checkpoint)
sequence1_ids = [[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>]]
sequence2_ids = [[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>]]
batched_ids = [
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>],
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, tokenizer.pad_token_id],
]
<span class="hljs-built_in">print</span>(model(tf.constant(sequence1_ids)).logits)
<span class="hljs-built_in">print</span>(model(tf.constant(sequence2_ids)).logits)
<span class="hljs-built_in">print</span>(model(tf.constant(batched_ids)).logits)`,wrap:!1}}),s=new h({props:{code:"dGYuVGVuc29yKCU1QiU1QiUyMDEuNTY5MzY3OCUyMC0xLjM4OTQ1ODElNUQlNUQlMkMlMjBzaGFwZSUzRCgxJTJDJTIwMiklMkMlMjBkdHlwZSUzRGZsb2F0MzIpJTBBdGYuVGVuc29yKCU1QiU1QiUyMDAuNTgwMzAwNSUyMCUyMC0wLjQxMjUyNDI4JTVEJTVEJTJDJTIwc2hhcGUlM0QoMSUyQyUyMDIpJTJDJTIwZHR5cGUlM0RmbG9hdDMyKSUwQXRmLlRlbnNvciglMEElNUIlNUIlMjAxLjU2OTM2ODElMjAtMS4zODk0NTgyJTVEJTBBJTIwJTVCJTIwMS4zMzczNDg2JTIwLTEuMjE2MzE5MyU1RCU1RCUyQyUyMHNoYXBlJTNEKDIlMkMlMjAyKSUyQyUyMGR0eXBlJTNEZmxvYXQzMik=",highlighted:`tf.Tensor([[ <span class="hljs-number">1.5693678</span> -<span class="hljs-number">1.3894581</span>]], shape=(<span class="hljs-number">1</span>, <span class="hljs-number">2</span>), dtype=float32)
tf.Tensor([[ <span class="hljs-number">0.5803005</span> -<span class="hljs-number">0.41252428</span>]], shape=(<span class="hljs-number">1</span>, <span class="hljs-number">2</span>), dtype=float32)
tf.Tensor(
[[ <span class="hljs-number">1.5693681</span> -<span class="hljs-number">1.3894582</span>]
[ <span class="hljs-number">1.3373486</span> -<span class="hljs-number">1.2163193</span>]], shape=(<span class="hljs-number">2</span>, <span class="hljs-number">2</span>), dtype=float32)`,wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function qe(o){let e,a,s,r;return e=new h({props:{code:"bW9kZWwlMjAlM0QlMjBBdXRvTW9kZWxGb3JTZXF1ZW5jZUNsYXNzaWZpY2F0aW9uLmZyb21fcHJldHJhaW5lZChjaGVja3BvaW50KSUwQSUwQXNlcXVlbmNlMV9pZHMlMjAlM0QlMjAlNUIlNUIyMDAlMkMlMjAyMDAlMkMlMjAyMDAlNUQlNUQlMEFzZXF1ZW5jZTJfaWRzJTIwJTNEJTIwJTVCJTVCMjAwJTJDJTIwMjAwJTVEJTVEJTBBYmF0Y2hlZF9pZHMlMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjAyMDAlNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjB0b2tlbml6ZXIucGFkX3Rva2VuX2lkJTVEJTJDJTBBJTVEJTBBJTBBcHJpbnQobW9kZWwodG9yY2gudGVuc29yKHNlcXVlbmNlMV9pZHMpKS5sb2dpdHMpJTBBcHJpbnQobW9kZWwodG9yY2gudGVuc29yKHNlcXVlbmNlMl9pZHMpKS5sb2dpdHMpJTBBcHJpbnQobW9kZWwodG9yY2gudGVuc29yKGJhdGNoZWRfaWRzKSkubG9naXRzKQ==",highlighted:`model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
sequence1_ids = [[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>]]
sequence2_ids = [[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>]]
batched_ids = [
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>],
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, tokenizer.pad_token_id],
]
<span class="hljs-built_in">print</span>(model(torch.tensor(sequence1_ids)).logits)
<span class="hljs-built_in">print</span>(model(torch.tensor(sequence2_ids)).logits)
<span class="hljs-built_in">print</span>(model(torch.tensor(batched_ids)).logits)`,wrap:!1}}),s=new h({props:{code:"dGVuc29yKCU1QiU1QiUyMDEuNTY5NCUyQyUyMC0xLjM4OTUlNUQlNUQlMkMlMjBncmFkX2ZuJTNEJTNDQWRkbW1CYWNrd2FyZCUzRSklMEF0ZW5zb3IoJTVCJTVCJTIwMC41ODAzJTJDJTIwLTAuNDEyNSU1RCU1RCUyQyUyMGdyYWRfZm4lM0QlM0NBZGRtbUJhY2t3YXJkJTNFKSUwQXRlbnNvciglNUIlNUIlMjAxLjU2OTQlMkMlMjAtMS4zODk1JTVEJTJDJTBBJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTIwJTVCJTIwMS4zMzczJTJDJTIwLTEuMjE2MyU1RCU1RCUyQyUyMGdyYWRfZm4lM0QlM0NBZGRtbUJhY2t3YXJkJTNFKQ==",highlighted:`tensor([[ <span class="hljs-number">1.5694</span>, -<span class="hljs-number">1.3895</span>]], grad_fn=&lt;AddmmBackward&gt;)
tensor([[ <span class="hljs-number">0.5803</span>, -<span class="hljs-number">0.4125</span>]], grad_fn=&lt;AddmmBackward&gt;)
tensor([[ <span class="hljs-number">1.5694</span>, -<span class="hljs-number">1.3895</span>],
[ <span class="hljs-number">1.3373</span>, -<span class="hljs-number">1.2163</span>]], grad_fn=&lt;AddmmBackward&gt;)`,wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function Le(o){let e,a,s,r;return e=new h({props:{code:"YmF0Y2hlZF9pZHMlMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjAyMDAlNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjB0b2tlbml6ZXIucGFkX3Rva2VuX2lkJTVEJTJDJTBBJTVEJTBBJTBBYXR0ZW50aW9uX21hc2slMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIxJTJDJTIwMSUyQyUyMDElNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIxJTJDJTIwMSUyQyUyMDAlNUQlMkMlMEElNUQlMEElMEFvdXRwdXRzJTIwJTNEJTIwbW9kZWwodGYuY29uc3RhbnQoYmF0Y2hlZF9pZHMpJTJDJTIwYXR0ZW50aW9uX21hc2slM0R0Zi5jb25zdGFudChhdHRlbnRpb25fbWFzaykpJTBBcHJpbnQob3V0cHV0cy5sb2dpdHMp",highlighted:`batched_ids = [
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>],
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, tokenizer.pad_token_id],
]
attention_mask = [
[<span class="hljs-number">1</span>, <span class="hljs-number">1</span>, <span class="hljs-number">1</span>],
[<span class="hljs-number">1</span>, <span class="hljs-number">1</span>, <span class="hljs-number">0</span>],
]
outputs = model(tf.constant(batched_ids), attention_mask=tf.constant(attention_mask))
<span class="hljs-built_in">print</span>(outputs.logits)`,wrap:!1}}),s=new h({props:{code:"dGYuVGVuc29yKCUwQSU1QiU1QiUyMDEuNTY5MzY4MSUyMCUyMC0xLjM4OTQ1ODIlMjAlNUQlMEElMjAlNUIlMjAwLjU4MDMwMjElMjAlMjAtMC40MTI1MjU4NiU1RCU1RCUyQyUyMHNoYXBlJTNEKDIlMkMlMjAyKSUyQyUyMGR0eXBlJTNEZmxvYXQzMik=",highlighted:`tf.Tensor(
[[ <span class="hljs-number">1.5693681</span> -<span class="hljs-number">1.3894582</span> ]
[ <span class="hljs-number">0.5803021</span> -<span class="hljs-number">0.41252586</span>]], shape=(<span class="hljs-number">2</span>, <span class="hljs-number">2</span>), dtype=float32)`,wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function Ke(o){let e,a,s,r;return e=new h({props:{code:"YmF0Y2hlZF9pZHMlMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjAyMDAlNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjB0b2tlbml6ZXIucGFkX3Rva2VuX2lkJTVEJTJDJTBBJTVEJTBBJTBBYXR0ZW50aW9uX21hc2slMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIxJTJDJTIwMSUyQyUyMDElNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIxJTJDJTIwMSUyQyUyMDAlNUQlMkMlMEElNUQlMEElMEFvdXRwdXRzJTIwJTNEJTIwbW9kZWwodG9yY2gudGVuc29yKGJhdGNoZWRfaWRzKSUyQyUyMGF0dGVudGlvbl9tYXNrJTNEdG9yY2gudGVuc29yKGF0dGVudGlvbl9tYXNrKSklMEFwcmludChvdXRwdXRzLmxvZ2l0cyk=",highlighted:`batched_ids = [
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>],
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, tokenizer.pad_token_id],
]
attention_mask = [
[<span class="hljs-number">1</span>, <span class="hljs-number">1</span>, <span class="hljs-number">1</span>],
[<span class="hljs-number">1</span>, <span class="hljs-number">1</span>, <span class="hljs-number">0</span>],
]
outputs = model(torch.tensor(batched_ids), attention_mask=torch.tensor(attention_mask))
<span class="hljs-built_in">print</span>(outputs.logits)`,wrap:!1}}),s=new h({props:{code:"dGVuc29yKCU1QiU1QiUyMDEuNTY5NCUyQyUyMC0xLjM4OTUlNUQlMkMlMEElMjAlMjAlMjAlMjAlMjAlMjAlMjAlMjAlNUIlMjAwLjU4MDMlMkMlMjAtMC40MTI1JTVEJTVEJTJDJTIwZ3JhZF9mbiUzRCUzQ0FkZG1tQmFja3dhcmQlM0Up",highlighted:`tensor([[ <span class="hljs-number">1.5694</span>, -<span class="hljs-number">1.3895</span>],
[ <span class="hljs-number">0.5803</span>, -<span class="hljs-number">0.4125</span>]], grad_fn=&lt;AddmmBackward&gt;)`,wrap:!1}}),{c(){b(e.$$.fragment),a=i(),b(s.$$.fragment)},l(n){j(e.$$.fragment,n),a=u(n),j(s.$$.fragment,n)},m(n,U){y(e,n,U),M(n,a,U),y(s,n,U),r=!0},i(n){r||(m(e.$$.fragment,n),m(s.$$.fragment,n),r=!0)},o(n){c(e.$$.fragment,n),c(s.$$.fragment,n),r=!1},d(n){n&&p(a),f(e,n),f(s,n)}}}function Pe(o){let e,a="✏️ <strong>Попробуйте!</strong> Примените токенизацию вручную к двум предложениям, использованным в разделе 2 (“I’ve been waiting for a HuggingFace course my whole life.” и “I hate this so much!”). Пропустите их через модель и проверьте, что вы получите те же логиты, что и в разделе 2. Теперь объедините их в батч с использованием токена дополнения, а затем создайте соответствующую маску внимания. Проверьте, что при прохождении через модель вы получаете те же результаты!";return{c(){e=d("p"),e.innerHTML=a},l(s){e=J(s,"P",{"data-svelte-h":!0}),T(e)!=="svelte-dbhizt"&&(e.innerHTML=a)},m(s,r){M(s,e,r)},p:ke,d(s){s&&p(e)}}}function Oe(o){let e,a,s,r,n,U,D,vl,w,k,Zl,_,$,Ql,S,Qs="В предыдущем разделе мы рассмотрели самый простой вариант использования: проведение инференса на одной последовательности небольшой длины. Однако уже сейчас возникают некоторые вопросы:",Bl,F,Es="<li>Как нам работать с несколькими последовательностями?</li> <li>Как нам работать с несколькими последовательностями <em>разной длины</em>?</li> <li>Являются ли индексы словаря единственными входными данными, которые позволяют модели работать хорошо?</li> <li>Существует ли такая вещь, как слишком длинная последовательность?</li>",Dl,H,Ns="Давайте посмотрим, какие проблемы возникают в связи с этими вопросами и как их можно решить с помощью 🤗 Transformers API.",Sl,x,Fl,Y,gs="В предыдущем упражнении вы видели, как последовательности преобразуются в списки чисел. Давайте преобразуем этот список чисел в тензор и передадим его в модель:",Hl,C,I,El,q,Ws="О нет! Почему это не удалось? Мы следовали шагам из конвейера в разделе 2.",xl,L,Rs="Проблема в том, что мы отправили в модель одну последовательность, в то время как 🤗 модели Transformers по умолчанию ожидают несколько предложений. Здесь мы попытались сделать все то, что токенизатор делал за кулисами, когда мы применяли его к <code>последовательности</code>. Но если вы приглядитесь, то увидите, что токенизатор не просто преобразовал список входных идентификаторов в тензор, а добавил к нему еще одно измерение:",Yl,V,A,Nl,K,Gs="Давайте попробуем еще раз и добавим новое измерение:",ql,Z,Q,gl,P,zs="Мы выводим входные идентификаторы, а также результирующие логиты - вот результат:",Ll,E,N,Wl,O,Xs="<em>Батчинг</em> - это отправка нескольких предложений через модель одновременно. Если у вас есть только одно предложение, вы можете просто создать батч с одной последовательностью:",Kl,ll,Pl,sl,vs="Это батч из двух одинаковых последовательностей!",Ol,z,ls,el,Bs="Батчинг позволяет модели работать, когда вы подаете ей несколько последовательностей. Использование нескольких последовательностей так же просто, как и создание батча с одной последовательностью. Однако есть и вторая проблема. Когда вы пытаетесь собрать в батч два (или более) предложения, они могут быть разной длины. Если вы когда-нибудь работали с тензорами, то знаете, что они должны иметь прямоугольную форму, поэтому вы не сможете напрямую преобразовать список входных идентификаторов в тензор. Чтобы обойти эту проблему, мы обычно прибегаем к <em>дополнению (pad)</em> входных данных.",ss,nl,es,tl,Ds="Следующий список списков не может быть преобразован в тензор:",ns,al,ts,pl,Ss="Чтобы обойти эту проблему, мы будем использовать <em>дополнение (padding)</em>, чтобы придать тензорам прямоугольную форму. Дополнение обеспечивает одинаковую длину всех предложений, добавляя специальное слово <em>токен дополнения</em> к предложениям с меньшим количеством значений. Например, если у вас есть 10 предложений с 10 словами и 1 предложение с 20 словами, то при дополнении все предложения будут состоять из 20 слов. В нашем примере результирующий тензор выглядит следующим образом:",as,Ml,ps,rl,Fs="Идентификатор токена дополнения можно найти в <code>tokenizer.pad_token_id</code>. Давайте используем его и отправим наши два предложения в модель по отдельности и батчем:",Ms,g,W,Rl,il,Hs="Что-то не так с логитами в наших батчах: во втором ряду должны быть те же логиты, что и для второго предложения, но мы получили совершенно другие значения!",rs,ul,xs="Это связано с тем, что ключевой особенностью моделей Transformer являются слои внимания (attention layers), которые <em>контекстуализируют</em> каждый токен. Они учитывают токены дополнений, так как рассматривают все токены последовательности. Чтобы получить одинаковый результат при прохождении через модель отдельных предложений разной длины или при прохождении батча с одинаковыми предложениями и дополнениями, нам нужно указать слоям внимания игнорировать дополняющие токены. Для этого используется маска внимания (attention mask).",is,cl,us,ml,Ys="<em>Маски внимания (Attention masks)</em> - это тензоры той же формы, что и тензор входных идентификаторов, заполненные 0 и 1: 1 означает, что соответствующие токены должны “привлекать внимание”, а 0 означает, что соответствующие токены не должны “привлекать внимание” (т.е. должны игнорироваться слоями внимания модели).",cs,ol,qs="Дополним предыдущий пример маской внимания:",ms,R,G,Gl,bl,Ls="Теперь мы получим такие же логиты для второго предложения в батче.",os,jl,Ks="Обратите внимание, что последнее значение второй последовательности - это идентификатор дополнения (padding ID), который в маске внимания имеет значение 0.",bs,X,js,yl,ys,fl,Ps="В моделях Transformer существует ограничение на длину последовательностей, которые мы можем передавать моделям. Большинство моделей работают с последовательностями длиной до 512 или 1024 токенов и терпят крах при необходимости обработки более длинных последовательностей. Есть два решения этой проблемы:",fs,Ul,Os="<li>Использовать модель с большей поддерживаемой длиной последовательности.</li> <li>Усечение (truncate) последовательностей.</li>",Us,dl,le='Модели имеют разную поддерживаемую длину последовательности, а некоторые специализируются на работе с очень длинными последовательностями. Одним из примеров является <a href="https://huggingface.co/docs/transformers/model_doc/longformer" rel="nofollow">Longformer</a>, а другим - <a href="https://huggingface.co/docs/transformers/model_doc/led" rel="nofollow">LED</a>. Если вы работаете над задачей, требующей очень длинных последовательностей, мы рекомендуем вам обратить внимание на эти модели.',ds,Jl,se="В противном случае мы рекомендуем использовать усечение последовательностей, указав параметр <code>max_sequence_length</code>:",Js,Tl,Ts,hl,hs,zl,ws;n=new Ee({props:{fw:o[0]}}),D=new Xl({props:{title:"Обработка нескольких последовательностей",local:"handling-multiple-sequences",headingTag:"h1"}});const ee=[We,ge],wl=[];function ne(l,t){return l[0]==="pt"?0:1}w=ne(o),k=wl[w]=ee[w](o);const te=[Ge,Re],kl=[];function ae(l,t){return l[0]==="pt"?0:1}_=ae(o),$=kl[_]=te[_](o),x=new Xl({props:{title:"Модели ожидают батч входов",local:"models-expect-a-batch-of-inputs",headingTag:"h2"}});const pe=[Xe,ze],_l=[];function Me(l,t){return l[0]==="pt"?0:1}C=Me(o),I=_l[C]=pe[C](o);const re=[Be,ve],$l=[];function ie(l,t){return l[0]==="pt"?0:1}V=ie(o),A=$l[V]=re[V](o);const ue=[Se,De],Cl=[];function ce(l,t){return l[0]==="pt"?0:1}Z=ce(o),Q=Cl[Z]=ue[Z](o);const me=[He,Fe],Il=[];function oe(l,t){return l[0]==="pt"?0:1}E=oe(o),N=Il[E]=me[E](o),ll=new h({props:{code:"YmF0Y2hlZF9pZHMlMjAlM0QlMjAlNUJpZHMlMkMlMjBpZHMlNUQ=",highlighted:'<span class="hljs-attr">batched_ids</span> = [ids, ids]',wrap:!1}}),z=new we({props:{$$slots:{default:[xe]},$$scope:{ctx:o}}}),nl=new Xl({props:{title:"Дополнение входов",local:"padding-the-inputs",headingTag:"h2"}}),al=new h({props:{code:"YmF0Y2hlZF9pZHMlMjAlM0QlMjAlNUIlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlMkMlMjAyMDAlNUQlMkMlMEElMjAlMjAlMjAlMjAlNUIyMDAlMkMlMjAyMDAlNUQlMEElNUQ=",highlighted:`batched_ids = [
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>],
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>]
]`,wrap:!1}}),Ml=new h({props:{code:"cGFkZGluZ19pZCUyMCUzRCUyMDEwMCUwQSUwQWJhdGNoZWRfaWRzJTIwJTNEJTIwJTVCJTBBJTIwJTIwJTIwJTIwJTVCMjAwJTJDJTIwMjAwJTJDJTIwMjAwJTVEJTJDJTBBJTIwJTIwJTIwJTIwJTVCMjAwJTJDJTIwMjAwJTJDJTIwcGFkZGluZ19pZCU1RCUyQyUwQSU1RA==",highlighted:`padding_id = <span class="hljs-number">100</span>
batched_ids = [
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, <span class="hljs-number">200</span>],
[<span class="hljs-number">200</span>, <span class="hljs-number">200</span>, padding_id],
]`,wrap:!1}});const be=[qe,Ye],Vl=[];function je(l,t){return l[0]==="pt"?0:1}g=je(o),W=Vl[g]=be[g](o),cl=new Xl({props:{title:"Маски внимания",local:"attention-masks",headingTag:"h2"}});const ye=[Ke,Le],Al=[];function fe(l,t){return l[0]==="pt"?0:1}return R=fe(o),G=Al[R]=ye[R](o),X=new we({props:{$$slots:{default:[Pe]},$$scope:{ctx:o}}}),yl=new Xl({props:{title:"Более длинные последовательности",local:"longer-sequences",headingTag:"h2"}}),Tl=new h({props:{code:"c2VxdWVuY2UlMjAlM0QlMjBzZXF1ZW5jZSU1QiUzQW1heF9zZXF1ZW5jZV9sZW5ndGglNUQ=",highlighted:"sequence = sequence[:max_sequence_length]",wrap:!1}}),hl=new Ne({props:{source:"https://github.com/huggingface/course/blob/main/chapters/ru/chapter2/5.mdx"}}),{c(){e=d("meta"),a=i(),s=d("p"),r=i(),b(n.$$.fragment),U=i(),b(D.$$.fragment),vl=i(),k.c(),Zl=i(),$.c(),Ql=i(),S=d("p"),S.textContent=Qs,Bl=i(),F=d("ul"),F.innerHTML=Es,Dl=i(),H=d("p"),H.textContent=Ns,Sl=i(),b(x.$$.fragment),Fl=i(),Y=d("p"),Y.textContent=gs,Hl=i(),I.c(),El=i(),q=d("p"),q.textContent=Ws,xl=i(),L=d("p"),L.innerHTML=Rs,Yl=i(),A.c(),Nl=i(),K=d("p"),K.textContent=Gs,ql=i(),Q.c(),gl=i(),P=d("p"),P.textContent=zs,Ll=i(),N.c(),Wl=i(),O=d("p"),O.innerHTML=Xs,Kl=i(),b(ll.$$.fragment),Pl=i(),sl=d("p"),sl.textContent=vs,Ol=i(),b(z.$$.fragment),ls=i(),el=d("p"),el.innerHTML=Bs,ss=i(),b(nl.$$.fragment),es=i(),tl=d("p"),tl.textContent=Ds,ns=i(),b(al.$$.fragment),ts=i(),pl=d("p"),pl.innerHTML=Ss,as=i(),b(Ml.$$.fragment),ps=i(),rl=d("p"),rl.innerHTML=Fs,Ms=i(),W.c(),Rl=i(),il=d("p"),il.textContent=Hs,rs=i(),ul=d("p"),ul.innerHTML=xs,is=i(),b(cl.$$.fragment),us=i(),ml=d("p"),ml.innerHTML=Ys,cs=i(),ol=d("p"),ol.textContent=qs,ms=i(),G.c(),Gl=i(),bl=d("p"),bl.textContent=Ls,os=i(),jl=d("p"),jl.textContent=Ks,bs=i(),b(X.$$.fragment),js=i(),b(yl.$$.fragment),ys=i(),fl=d("p"),fl.textContent=Ps,fs=i(),Ul=d("ul"),Ul.innerHTML=Os,Us=i(),dl=d("p"),dl.innerHTML=le,ds=i(),Jl=d("p"),Jl.innerHTML=se,Js=i(),b(Tl.$$.fragment),Ts=i(),b(hl.$$.fragment),hs=i(),zl=d("p"),this.h()},l(l){const t=Ze("svelte-u9bgzb",document.head);e=J(t,"META",{name:!0,content:!0}),t.forEach(p),a=u(l),s=J(l,"P",{}),Te(s).forEach(p),r=u(l),j(n.$$.fragment,l),U=u(l),j(D.$$.fragment,l),vl=u(l),k.l(l),Zl=u(l),$.l(l),Ql=u(l),S=J(l,"P",{"data-svelte-h":!0}),T(S)!=="svelte-ikgr2i"&&(S.textContent=Qs),Bl=u(l),F=J(l,"UL",{"data-svelte-h":!0}),T(F)!=="svelte-p2p0e"&&(F.innerHTML=Es),Dl=u(l),H=J(l,"P",{"data-svelte-h":!0}),T(H)!=="svelte-98bx90"&&(H.textContent=Ns),Sl=u(l),j(x.$$.fragment,l),Fl=u(l),Y=J(l,"P",{"data-svelte-h":!0}),T(Y)!=="svelte-18ypb6e"&&(Y.textContent=gs),Hl=u(l),I.l(l),El=u(l),q=J(l,"P",{"data-svelte-h":!0}),T(q)!=="svelte-144jsih"&&(q.textContent=Ws),xl=u(l),L=J(l,"P",{"data-svelte-h":!0}),T(L)!=="svelte-1k77vdn"&&(L.innerHTML=Rs),Yl=u(l),A.l(l),Nl=u(l),K=J(l,"P",{"data-svelte-h":!0}),T(K)!=="svelte-dmjb59"&&(K.textContent=Gs),ql=u(l),Q.l(l),gl=u(l),P=J(l,"P",{"data-svelte-h":!0}),T(P)!=="svelte-1nnt99"&&(P.textContent=zs),Ll=u(l),N.l(l),Wl=u(l),O=J(l,"P",{"data-svelte-h":!0}),T(O)!=="svelte-1ptjmnf"&&(O.innerHTML=Xs),Kl=u(l),j(ll.$$.fragment,l),Pl=u(l),sl=J(l,"P",{"data-svelte-h":!0}),T(sl)!=="svelte-1xqu6rg"&&(sl.textContent=vs),Ol=u(l),j(z.$$.fragment,l),ls=u(l),el=J(l,"P",{"data-svelte-h":!0}),T(el)!=="svelte-1x76014"&&(el.innerHTML=Bs),ss=u(l),j(nl.$$.fragment,l),es=u(l),tl=J(l,"P",{"data-svelte-h":!0}),T(tl)!=="svelte-nbgyfx"&&(tl.textContent=Ds),ns=u(l),j(al.$$.fragment,l),ts=u(l),pl=J(l,"P",{"data-svelte-h":!0}),T(pl)!=="svelte-19psb6t"&&(pl.innerHTML=Ss),as=u(l),j(Ml.$$.fragment,l),ps=u(l),rl=J(l,"P",{"data-svelte-h":!0}),T(rl)!=="svelte-vcf2iw"&&(rl.innerHTML=Fs),Ms=u(l),W.l(l),Rl=u(l),il=J(l,"P",{"data-svelte-h":!0}),T(il)!=="svelte-lq6aki"&&(il.textContent=Hs),rs=u(l),ul=J(l,"P",{"data-svelte-h":!0}),T(ul)!=="svelte-1odjoq1"&&(ul.innerHTML=xs),is=u(l),j(cl.$$.fragment,l),us=u(l),ml=J(l,"P",{"data-svelte-h":!0}),T(ml)!=="svelte-19vvspo"&&(ml.innerHTML=Ys),cs=u(l),ol=J(l,"P",{"data-svelte-h":!0}),T(ol)!=="svelte-1mwnjcg"&&(ol.textContent=qs),ms=u(l),G.l(l),Gl=u(l),bl=J(l,"P",{"data-svelte-h":!0}),T(bl)!=="svelte-386tap"&&(bl.textContent=Ls),os=u(l),jl=J(l,"P",{"data-svelte-h":!0}),T(jl)!=="svelte-11ffhny"&&(jl.textContent=Ks),bs=u(l),j(X.$$.fragment,l),js=u(l),j(yl.$$.fragment,l),ys=u(l),fl=J(l,"P",{"data-svelte-h":!0}),T(fl)!=="svelte-mjg3yg"&&(fl.textContent=Ps),fs=u(l),Ul=J(l,"UL",{"data-svelte-h":!0}),T(Ul)!=="svelte-u5jj5o"&&(Ul.innerHTML=Os),Us=u(l),dl=J(l,"P",{"data-svelte-h":!0}),T(dl)!=="svelte-6nsbgo"&&(dl.innerHTML=le),ds=u(l),Jl=J(l,"P",{"data-svelte-h":!0}),T(Jl)!=="svelte-10uunb0"&&(Jl.innerHTML=se),Js=u(l),j(Tl.$$.fragment,l),Ts=u(l),j(hl.$$.fragment,l),hs=u(l),zl=J(l,"P",{}),Te(zl).forEach(p),this.h()},h(){he(e,"name","hf:doc:metadata"),he(e,"content",ln)},m(l,t){Qe(document.head,e),M(l,a,t),M(l,s,t),M(l,r,t),y(n,l,t),M(l,U,t),y(D,l,t),M(l,vl,t),wl[w].m(l,t),M(l,Zl,t),kl[_].m(l,t),M(l,Ql,t),M(l,S,t),M(l,Bl,t),M(l,F,t),M(l,Dl,t),M(l,H,t),M(l,Sl,t),y(x,l,t),M(l,Fl,t),M(l,Y,t),M(l,Hl,t),_l[C].m(l,t),M(l,El,t),M(l,q,t),M(l,xl,t),M(l,L,t),M(l,Yl,t),$l[V].m(l,t),M(l,Nl,t),M(l,K,t),M(l,ql,t),Cl[Z].m(l,t),M(l,gl,t),M(l,P,t),M(l,Ll,t),Il[E].m(l,t),M(l,Wl,t),M(l,O,t),M(l,Kl,t),y(ll,l,t),M(l,Pl,t),M(l,sl,t),M(l,Ol,t),y(z,l,t),M(l,ls,t),M(l,el,t),M(l,ss,t),y(nl,l,t),M(l,es,t),M(l,tl,t),M(l,ns,t),y(al,l,t),M(l,ts,t),M(l,pl,t),M(l,as,t),y(Ml,l,t),M(l,ps,t),M(l,rl,t),M(l,Ms,t),Vl[g].m(l,t),M(l,Rl,t),M(l,il,t),M(l,rs,t),M(l,ul,t),M(l,is,t),y(cl,l,t),M(l,us,t),M(l,ml,t),M(l,cs,t),M(l,ol,t),M(l,ms,t),Al[R].m(l,t),M(l,Gl,t),M(l,bl,t),M(l,os,t),M(l,jl,t),M(l,bs,t),y(X,l,t),M(l,js,t),y(yl,l,t),M(l,ys,t),M(l,fl,t),M(l,fs,t),M(l,Ul,t),M(l,Us,t),M(l,dl,t),M(l,ds,t),M(l,Jl,t),M(l,Js,t),y(Tl,l,t),M(l,Ts,t),y(hl,l,t),M(l,hs,t),M(l,zl,t),ws=!0},p(l,[t]){const Ue={};t&1&&(Ue.fw=l[0]),n.$set(Ue);let ks=w;w=ne(l),w!==ks&&(B(),c(wl[ks],1,1,()=>{wl[ks]=null}),v(),k=wl[w],k||(k=wl[w]=ee[w](l),k.c()),m(k,1),k.m(Zl.parentNode,Zl));let _s=_;_=ae(l),_!==_s&&(B(),c(kl[_s],1,1,()=>{kl[_s]=null}),v(),$=kl[_],$||($=kl[_]=te[_](l),$.c()),m($,1),$.m(Ql.parentNode,Ql));let $s=C;C=Me(l),C!==$s&&(B(),c(_l[$s],1,1,()=>{_l[$s]=null}),v(),I=_l[C],I||(I=_l[C]=pe[C](l),I.c()),m(I,1),I.m(El.parentNode,El));let Cs=V;V=ie(l),V!==Cs&&(B(),c($l[Cs],1,1,()=>{$l[Cs]=null}),v(),A=$l[V],A||(A=$l[V]=re[V](l),A.c()),m(A,1),A.m(Nl.parentNode,Nl));let Is=Z;Z=ce(l),Z!==Is&&(B(),c(Cl[Is],1,1,()=>{Cl[Is]=null}),v(),Q=Cl[Z],Q||(Q=Cl[Z]=ue[Z](l),Q.c()),m(Q,1),Q.m(gl.parentNode,gl));let Vs=E;E=oe(l),E!==Vs&&(B(),c(Il[Vs],1,1,()=>{Il[Vs]=null}),v(),N=Il[E],N||(N=Il[E]=me[E](l),N.c()),m(N,1),N.m(Wl.parentNode,Wl));const de={};t&2&&(de.$$scope={dirty:t,ctx:l}),z.$set(de);let As=g;g=je(l),g!==As&&(B(),c(Vl[As],1,1,()=>{Vl[As]=null}),v(),W=Vl[g],W||(W=Vl[g]=be[g](l),W.c()),m(W,1),W.m(Rl.parentNode,Rl));let Zs=R;R=fe(l),R!==Zs&&(B(),c(Al[Zs],1,1,()=>{Al[Zs]=null}),v(),G=Al[R],G||(G=Al[R]=ye[R](l),G.c()),m(G,1),G.m(Gl.parentNode,Gl));const Je={};t&2&&(Je.$$scope={dirty:t,ctx:l}),X.$set(Je)},i(l){ws||(m(n.$$.fragment,l),m(D.$$.fragment,l),m(k),m($),m(x.$$.fragment,l),m(I),m(A),m(Q),m(N),m(ll.$$.fragment,l),m(z.$$.fragment,l),m(nl.$$.fragment,l),m(al.$$.fragment,l),m(Ml.$$.fragment,l),m(W),m(cl.$$.fragment,l),m(G),m(X.$$.fragment,l),m(yl.$$.fragment,l),m(Tl.$$.fragment,l),m(hl.$$.fragment,l),ws=!0)},o(l){c(n.$$.fragment,l),c(D.$$.fragment,l),c(k),c($),c(x.$$.fragment,l),c(I),c(A),c(Q),c(N),c(ll.$$.fragment,l),c(z.$$.fragment,l),c(nl.$$.fragment,l),c(al.$$.fragment,l),c(Ml.$$.fragment,l),c(W),c(cl.$$.fragment,l),c(G),c(X.$$.fragment,l),c(yl.$$.fragment,l),c(Tl.$$.fragment,l),c(hl.$$.fragment,l),ws=!1},d(l){l&&(p(a),p(s),p(r),p(U),p(vl),p(Zl),p(Ql),p(S),p(Bl),p(F),p(Dl),p(H),p(Sl),p(Fl),p(Y),p(Hl),p(El),p(q),p(xl),p(L),p(Yl),p(Nl),p(K),p(ql),p(gl),p(P),p(Ll),p(Wl),p(O),p(Kl),p(Pl),p(sl),p(Ol),p(ls),p(el),p(ss),p(es),p(tl),p(ns),p(ts),p(pl),p(as),p(ps),p(rl),p(Ms),p(Rl),p(il),p(rs),p(ul),p(is),p(us),p(ml),p(cs),p(ol),p(ms),p(Gl),p(bl),p(os),p(jl),p(bs),p(js),p(ys),p(fl),p(fs),p(Ul),p(Us),p(dl),p(ds),p(Jl),p(Js),p(Ts),p(hs),p(zl)),p(e),f(n,l),f(D,l),wl[w].d(l),kl[_].d(l),f(x,l),_l[C].d(l),$l[V].d(l),Cl[Z].d(l),Il[E].d(l),f(ll,l),f(z,l),f(nl,l),f(al,l),f(Ml,l),Vl[g].d(l),f(cl,l),Al[R].d(l),f(X,l),f(yl,l),f(Tl,l),f(hl,l)}}}const ln='{"title":"Обработка нескольких последовательностей","local":"handling-multiple-sequences","sections":[{"title":"Модели ожидают батч входов","local":"models-expect-a-batch-of-inputs","sections":[],"depth":2},{"title":"Дополнение входов","local":"padding-the-inputs","sections":[],"depth":2},{"title":"Маски внимания","local":"attention-masks","sections":[],"depth":2},{"title":"Более длинные последовательности","local":"longer-sequences","sections":[],"depth":2}],"depth":1}';function sn(o,e,a){let s="pt";return Ie(()=>{const r=new URLSearchParams(window.location.search);a(0,s=r.get("fw")||"pt")}),[s]}class cn extends Ve{constructor(e){super(),Ae(this,e,sn,Oe,Ce,{})}}export{cn as component};

Xet Storage Details

Size:
50.2 kB
·
Xet hash:
94ca3b94d6bf37064cb44841411f034aadfd58952d884a2fc052ccc531492369

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.