Buckets:
| # Modele Sequence-to-sequence[modele-sequence-to-sequence] | |
| Modelele Encoder-Decoder (denumite și *modele sequence-to-sequence*) utilizează ambele părți ale arhitecturii Transformer. În fiecare etapă, layerele de atenție ale encoder-ului pot accesa toate cuvintele din propoziția inițială, în timp ce layerele de atenție ale decoder-ului pot accesa doar cuvintele poziționate înaintea unui anumit cuvânt din intrare. | |
| Preantrenarea acestor modele se poate face folosind obiectivele modelelor de codificare sau de decodificare, dar de obicei implică ceva un pic mai complex. De exemplu, [T5](https://huggingface.co/t5-base) este prenatrenat prin înlocuirea unor intervale aleatorii de text (care pot conține mai multe cuvinte) cu un singur cuvânt special mascat, iar obiectivul este apoi de a prezice textul pe care îl înlocuiește acest cuvânt mascat. | |
| Modelele Sequence-to-sequence sunt cele mai potrivite pentru sarcinile care se învârt în jurul generării de noi propoziții în funcție de o intrare dată, cum ar fi rezumarea, traducerea sau răspunsul generativ la întrebări. | |
| Printre reprezentanții acestei familii de modele se numără: | |
| - [BART](https://huggingface.co/transformers/model_doc/bart) | |
| - [mBART](https://huggingface.co/transformers/model_doc/mbart) | |
| - [Marian](https://huggingface.co/transformers/model_doc/marian) | |
| - [T5](https://huggingface.co/transformers/model_doc/t5) | |
Xet Storage Details
- Size:
- 1.42 kB
- Xet hash:
- aa354202e2802bc600ff2410a1612aa5fa547a72372418901548a30c262634e0
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.