Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / course /pr_1021 /de /_app /immutable /nodes /10.db257534.js

rtrm's picture

about 1 month ago

4.28 kB

import{s as G,n as K,o as N}from"../chunks/scheduler.49e4e380.js";import{S as V,i as J,g as l,s as a,r as L,A as Q,h as o,f as n,c as s,j as Y,u as y,x as v,k as Z,y as X,a as r,v as H,d as B,t as D,w as j}from"../chunks/index.fb15006d.js";import{Y as ee}from"../chunks/Youtube.42918e4e.js";import{C as te}from"../chunks/CourseFloatingBanner.c832fd1e.js";import{H as ne,E as re}from"../chunks/getInferenceSnippets.ea935248.js";function ae(R){let i,w,b,x,m,z,u,M,f,T,d,W="Encoder-Decoder-Modelle (auch <em>Sequence-to-Sequence-Modelle</em> genannt) verwenden beide Teile der Transformer-Architektur. Die Attention-Layer des Encoders können in jedem Schritt auf alle Wörter des Ausgangssatzes zugreifen, während die Attention-Layer des Decoders nur auf die Wörter zugreifen können, die vor einem bestimmten Wort des Inputs stehen.",P,c,F='Das Pretraining dieser Modelle kann wie das Pretraining von rein Encoder- oder Decoder-basierten Modellen erfolgen, ist aber in der Regel etwas komplexer. Beim Pretraining von <a href="https://huggingface.co/t5-base" rel="nofollow">T5</a> werden zum Beispiel zufällige Textabschnitte (die mehrere Wörter enthalten können) durch ein einzelnes spezielles Maskierungswort ersetzt, und das Ziel (engl. Pretraining Objective) besteht dann darin, den Text vorherzusagen, der durch dieses Maskierungswort ersetzt bzw. verdeckt wurde.',S,p,I="Sequence-to-Sequence-Modelle eignen sich am besten für Aufgaben, bei denen es darum geht, neue Sätze in Abhängigkeit von einem bestimmten Input zu generieren, z. B. bei der Zusammenfassung, Übersetzung oder generativen Frage-Antwort-Systemen.",q,g,O="Vertreter dieser Modellfamilie sind u. a.:",C,h,U='<li><a href="https://huggingface.co/transformers/model_doc/bart" rel="nofollow">BART</a></li> <li><a href="https://huggingface.co/transformers/model_doc/mbart" rel="nofollow">mBART</a></li> <li><a href="https://huggingface.co/transformers/model_doc/marian" rel="nofollow">Marian</a></li> <li><a href="https://huggingface.co/transformers/model_doc/t5" rel="nofollow">T5</a></li>',k,$,A,_,E;return m=new ne({props:{title:"Sequence-to-Sequence-Modelle",local:"sequence-to-sequence-modelle",headingTag:"h1"}}),u=new te({props:{chapter:1,classNames:"absolute z-10 right-0 top-0"}}),f=new ee({props:{id:"0_4KEb08xrE"}}),$=new re({props:{source:"https://github.com/huggingface/course/blob/main/chapters/de/chapter1/7.mdx"}}),{c(){i=l("meta"),w=a(),b=l("p"),x=a(),L(m.$$.fragment),z=a(),L(u.$$.fragment),M=a(),L(f.$$.fragment),T=a(),d=l("p"),d.innerHTML=W,P=a(),c=l("p"),c.innerHTML=F,S=a(),p=l("p"),p.textContent=I,q=a(),g=l("p"),g.textContent=O,C=a(),h=l("ul"),h.innerHTML=U,k=a(),L($.$$.fragment),A=a(),_=l("p"),this.h()},l(e){const t=Q("svelte-u9bgzb",document.head);i=o(t,"META",{name:!0,content:!0}),t.forEach(n),w=s(e),b=o(e,"P",{}),Y(b).forEach(n),x=s(e),y(m.$$.fragment,e),z=s(e),y(u.$$.fragment,e),M=s(e),y(f.$$.fragment,e),T=s(e),d=o(e,"P",{"data-svelte-h":!0}),v(d)!=="svelte-rzdgt7"&&(d.innerHTML=W),P=s(e),c=o(e,"P",{"data-svelte-h":!0}),v(c)!=="svelte-1vxy34j"&&(c.innerHTML=F),S=s(e),p=o(e,"P",{"data-svelte-h":!0}),v(p)!=="svelte-12ah7s"&&(p.textContent=I),q=s(e),g=o(e,"P",{"data-svelte-h":!0}),v(g)!=="svelte-17uu3dp"&&(g.textContent=O),C=s(e),h=o(e,"UL",{"data-svelte-h":!0}),v(h)!=="svelte-cz4hgg"&&(h.innerHTML=U),k=s(e),y($.$$.fragment,e),A=s(e),_=o(e,"P",{}),Y(_).forEach(n),this.h()},h(){Z(i,"name","hf:doc:metadata"),Z(i,"content",se)},m(e,t){X(document.head,i),r(e,w,t),r(e,b,t),r(e,x,t),H(m,e,t),r(e,z,t),H(u,e,t),r(e,M,t),H(f,e,t),r(e,T,t),r(e,d,t),r(e,P,t),r(e,c,t),r(e,S,t),r(e,p,t),r(e,q,t),r(e,g,t),r(e,C,t),r(e,h,t),r(e,k,t),H($,e,t),r(e,A,t),r(e,_,t),E=!0},p:K,i(e){E||(B(m.$$.fragment,e),B(u.$$.fragment,e),B(f.$$.fragment,e),B($.$$.fragment,e),E=!0)},o(e){D(m.$$.fragment,e),D(u.$$.fragment,e),D(f.$$.fragment,e),D($.$$.fragment,e),E=!1},d(e){e&&(n(w),n(b),n(x),n(z),n(M),n(T),n(d),n(P),n(c),n(S),n(p),n(q),n(g),n(C),n(h),n(k),n(A),n(_)),n(i),j(m,e),j(u,e),j(f,e),j($,e)}}}const se='{"title":"Sequence-to-Sequence-Modelle","local":"sequence-to-sequence-modelle","sections":[],"depth":1}';function ie(R){return N(()=>{new URLSearchParams(window.location.search).get("fw")}),[]}class de extends V{constructor(i){super(),J(this,i,ie,ae,G,{})}}export{de as component};

Xet Storage Details

Size:: 4.28 kB
Xet hash:: 801bcb5760ff7f4bf4f3bb28c9526ac177503fb4661c85dc3699dda135202a96

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.