Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / course /pr_1107 /es /chapter1 /7.md

rtrm's picture

about 2 months ago

|

1.54 kB

	# Modelos secuencia a secuencia

	<Youtube id="0_4KEb08xrE" />

	Los modelos codificador/decodificador (también llamados modelos secuencia a secuencia) usan ambas partes de la arquitectura del Transformador. En cada etapa, las capas de atención del codificador pueden acceder a todas las palabras de la secuencia inicial, mientras que las capas de atención del decodificador sólo pueden acceder a las palabras que se ubican antes de una palabra dada en el texto de entrada.

	El preentrenamiento de estos modelos se puede hacer usando los objetivos de los modelos de codificadores o decodificadores, pero usualmente implican algo más complejo. Por ejemplo, [T5](https://huggingface.co/t5-base) está preentrenado al reemplazar segmentos aleatorios de texto (que pueden contener varias palabras) con una palabra especial que las oculta, y el objetivo es predecir el texto que esta palabra reemplaza.

	Los modelos secuencia a secuencia son más adecuados para tareas relacionadas con la generación de nuevas oraciones dependiendo de una entrada dada, como resumir, traducir o responder generativamente preguntas.

	Algunos miembros de esta familia de modelos son:

	- [BART](https://huggingface.co/transformers/model_doc/bart.html)
	- [mBART](https://huggingface.co/transformers/model_doc/mbart.html)
	- [Marian](https://huggingface.co/transformers/model_doc/marian.html)
	- [T5](https://huggingface.co/transformers/model_doc/t5.html)


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/es/chapter1/7.mdx" />

Xet Storage Details

Size:: 1.54 kB
Xet hash:: c5ba56c595e4ce7fe558d31b55f2da311d77bb705d4d48a3fa844390c360a4a4

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.