Buckets:

rtrm's picture
|
download
raw
1.48 kB

Encoder-Modelle

Encoder-Modelle verwenden nur den Encoder eines Transformer-Modells. Die Attention-Layer können zu jeder Zeit auf alle Wörter des Ausgangssatzes zugreifen. Diese Modelle werden häufig als Modelle mit "bidirektionaler" (engl. bi-directional) Attention bezeichnet und oft Auto-Encoding-Modelle genannt.

Beim Pretraining dieser Modelle geht es in der Regel darum, einen bestimmten Satz auf irgendeine Weise zu verfälschen (z. B. indem zufällig Wörter darin maskiert werden) und das Modell dann damit zu betrauen, den ursprünglichen Satz zu finden bzw. zu rekonstruieren.

Rein Encoder-basierte Modelle eignen sich am besten für Aufgaben, die ein Verständnis des gesamten Satzes erfordern, wie z. B. die Klassifizierung von Sätzen, die Eigennamenerkennung (bzw. allgemeiner die Klassifikation von Wörtern) und extraktive Frage-Antwort-Systeme.

Zu dieser Modellfamilie gehören unter anderem:

Xet Storage Details

Size:
1.48 kB
·
Xet hash:
f6fdc72a8d9f629551d4ff66c57b45980892b4da436a59ff4412bfb5c0ac1154

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.