Buckets:

rtrm's picture
download
raw
4.28 kB
import{s as G,n as K,o as N}from"../chunks/scheduler.49e4e380.js";import{S as V,i as J,g as l,s as a,r as L,A as Q,h as o,f as n,c as s,j as Y,u as y,x as v,k as Z,y as X,a as r,v as H,d as B,t as D,w as j}from"../chunks/index.fb15006d.js";import{Y as ee}from"../chunks/Youtube.42918e4e.js";import{C as te}from"../chunks/CourseFloatingBanner.c832fd1e.js";import{H as ne,E as re}from"../chunks/getInferenceSnippets.233af260.js";function ae(R){let i,w,b,x,m,z,u,M,f,T,d,W="Encoder-Decoder-Modelle (auch <em>Sequence-to-Sequence-Modelle</em> genannt) verwenden beide Teile der Transformer-Architektur. Die Attention-Layer des Encoders können in jedem Schritt auf alle Wörter des Ausgangssatzes zugreifen, während die Attention-Layer des Decoders nur auf die Wörter zugreifen können, die vor einem bestimmten Wort des Inputs stehen.",P,c,F='Das Pretraining dieser Modelle kann wie das Pretraining von rein Encoder- oder Decoder-basierten Modellen erfolgen, ist aber in der Regel etwas komplexer. Beim Pretraining von <a href="https://huggingface.co/t5-base" rel="nofollow">T5</a> werden zum Beispiel zufällige Textabschnitte (die mehrere Wörter enthalten können) durch ein einzelnes spezielles Maskierungswort ersetzt, und das Ziel (engl. Pretraining Objective) besteht dann darin, den Text vorherzusagen, der durch dieses Maskierungswort ersetzt bzw. verdeckt wurde.',S,p,I="Sequence-to-Sequence-Modelle eignen sich am besten für Aufgaben, bei denen es darum geht, neue Sätze in Abhängigkeit von einem bestimmten Input zu generieren, z. B. bei der Zusammenfassung, Übersetzung oder generativen Frage-Antwort-Systemen.",q,g,O="Vertreter dieser Modellfamilie sind u. a.:",C,h,U='<li><a href="https://huggingface.co/transformers/model_doc/bart" rel="nofollow">BART</a></li> <li><a href="https://huggingface.co/transformers/model_doc/mbart" rel="nofollow">mBART</a></li> <li><a href="https://huggingface.co/transformers/model_doc/marian" rel="nofollow">Marian</a></li> <li><a href="https://huggingface.co/transformers/model_doc/t5" rel="nofollow">T5</a></li>',k,$,A,_,E;return m=new ne({props:{title:"Sequence-to-Sequence-Modelle",local:"sequence-to-sequence-modelle",headingTag:"h1"}}),u=new te({props:{chapter:1,classNames:"absolute z-10 right-0 top-0"}}),f=new ee({props:{id:"0_4KEb08xrE"}}),$=new re({props:{source:"https://github.com/huggingface/course/blob/main/chapters/de/chapter1/7.mdx"}}),{c(){i=l("meta"),w=a(),b=l("p"),x=a(),L(m.$$.fragment),z=a(),L(u.$$.fragment),M=a(),L(f.$$.fragment),T=a(),d=l("p"),d.innerHTML=W,P=a(),c=l("p"),c.innerHTML=F,S=a(),p=l("p"),p.textContent=I,q=a(),g=l("p"),g.textContent=O,C=a(),h=l("ul"),h.innerHTML=U,k=a(),L($.$$.fragment),A=a(),_=l("p"),this.h()},l(e){const t=Q("svelte-u9bgzb",document.head);i=o(t,"META",{name:!0,content:!0}),t.forEach(n),w=s(e),b=o(e,"P",{}),Y(b).forEach(n),x=s(e),y(m.$$.fragment,e),z=s(e),y(u.$$.fragment,e),M=s(e),y(f.$$.fragment,e),T=s(e),d=o(e,"P",{"data-svelte-h":!0}),v(d)!=="svelte-rzdgt7"&&(d.innerHTML=W),P=s(e),c=o(e,"P",{"data-svelte-h":!0}),v(c)!=="svelte-1vxy34j"&&(c.innerHTML=F),S=s(e),p=o(e,"P",{"data-svelte-h":!0}),v(p)!=="svelte-12ah7s"&&(p.textContent=I),q=s(e),g=o(e,"P",{"data-svelte-h":!0}),v(g)!=="svelte-17uu3dp"&&(g.textContent=O),C=s(e),h=o(e,"UL",{"data-svelte-h":!0}),v(h)!=="svelte-cz4hgg"&&(h.innerHTML=U),k=s(e),y($.$$.fragment,e),A=s(e),_=o(e,"P",{}),Y(_).forEach(n),this.h()},h(){Z(i,"name","hf:doc:metadata"),Z(i,"content",se)},m(e,t){X(document.head,i),r(e,w,t),r(e,b,t),r(e,x,t),H(m,e,t),r(e,z,t),H(u,e,t),r(e,M,t),H(f,e,t),r(e,T,t),r(e,d,t),r(e,P,t),r(e,c,t),r(e,S,t),r(e,p,t),r(e,q,t),r(e,g,t),r(e,C,t),r(e,h,t),r(e,k,t),H($,e,t),r(e,A,t),r(e,_,t),E=!0},p:K,i(e){E||(B(m.$$.fragment,e),B(u.$$.fragment,e),B(f.$$.fragment,e),B($.$$.fragment,e),E=!0)},o(e){D(m.$$.fragment,e),D(u.$$.fragment,e),D(f.$$.fragment,e),D($.$$.fragment,e),E=!1},d(e){e&&(n(w),n(b),n(x),n(z),n(M),n(T),n(d),n(P),n(c),n(S),n(p),n(q),n(g),n(C),n(h),n(k),n(A),n(_)),n(i),j(m,e),j(u,e),j(f,e),j($,e)}}}const se='{"title":"Sequence-to-Sequence-Modelle","local":"sequence-to-sequence-modelle","sections":[],"depth":1}';function ie(R){return N(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class de extends V{constructor(i){super(),J(this,i,ie,ae,G,{})}}export{de as component};

Xet Storage Details

Size:
4.28 kB
·
Xet hash:
a380640cb8ba43a260b088962bc66ff637716f31b28d0a1eb6ceae625ecf5525

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.