Buckets:
| # Modelos secuencia a secuencia | |
| <Youtube id="0_4KEb08xrE" /> | |
| Los modelos codificador/decodificador (también llamados *modelos secuencia a secuencia*) usan ambas partes de la arquitectura del Transformador. En cada etapa, las capas de atención del codificador pueden acceder a todas las palabras de la secuencia inicial, mientras que las capas de atención del decodificador sólo pueden acceder a las palabras que se ubican antes de una palabra dada en el texto de entrada. | |
| El preentrenamiento de estos modelos se puede hacer usando los objetivos de los modelos de codificadores o decodificadores, pero usualmente implican algo más complejo. Por ejemplo, [T5](https://huggingface.co/t5-base) está preentrenado al reemplazar segmentos aleatorios de texto (que pueden contener varias palabras) con una palabra especial que las oculta, y el objetivo es predecir el texto que esta palabra reemplaza. | |
| Los modelos secuencia a secuencia son más adecuados para tareas relacionadas con la generación de nuevas oraciones dependiendo de una entrada dada, como resumir, traducir o responder generativamente preguntas. | |
| Algunos miembros de esta familia de modelos son: | |
| - [BART](https://huggingface.co/transformers/model_doc/bart.html) | |
| - [mBART](https://huggingface.co/transformers/model_doc/mbart.html) | |
| - [Marian](https://huggingface.co/transformers/model_doc/marian.html) | |
| - [T5](https://huggingface.co/transformers/model_doc/t5.html) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/es/chapter1/7.mdx" /> |
Xet Storage Details
- Size:
- 1.54 kB
- Xet hash:
- c5ba56c595e4ce7fe558d31b55f2da311d77bb705d4d48a3fa844390c360a4a4
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.