Buckets:
Quiz de final de capítulo
1. ¿Cuál es el orden del pipeline de modelado del lenguaje?
2. ¿Cuántas dimensiones tiene el tensor producido por el modelo base de Transformer y cuáles son?
3. ¿Cuál de los siguientes es un ejemplo de tokenización de subpalabras?
4. ¿Qué es una cabeza del modelo?
{#if fw === 'pt'}
5. ¿Qué es un AutoModel?
AutoTrain?" }, { text: "Un objeto que devuelve la arquitectura correcta basado en el punto de control", explain: "Exacto: el AutoModel sólo necesita conocer el punto de control desde el cual inicializar para devolver la arquitectura correcta.", correct: true }, { text: "Un modelo que detecta automáticamente el lenguaje usado por sus entradas para cargar los pesos correctos", explain: "Incorrecto; aunque algunos puntos de control y modelos son capaces de manejar varios lenguajes, no hay herramientas integradas para la selección automática de punto de control de acuerdo al lenguaje. ¡Deberías dirigirte a Model Hub para encontrar el mejor punto de control para tu tarea!" } ]} />
{:else}
5. ¿Qué es un TFAutoModel?
AutoTrain?" }, { text: "Un objeto que devuelve la arquitectura correcta basado en el punto de control", explain: "Exacto: el TFAutoModel sólo necesita conocer el punto de control desde el cual inicializar para devolver la arquitectura correcta.", correct: true }, { text: "Un modelo que detecta automáticamente el lenguaje usado por sus entradas para cargar los pesos correctos", explain: "Incorrecto; aunque algunos puntos de control y modelos son capaces de manejar varios lenguajes, no hay herramientas integradas para la selección automática de punto de control de acuerdo al lenguaje. ¡Deberías dirigirte a Model Hub para encontrar el mejor punto de control para tu tarea!" } ]} />
{/if}
6. ¿Cuáles son las técnicas a tener en cuenta al realizar batching de secuencias de diferentes longitudes juntas?
7. ¿Cuál es el punto de aplicar una función SoftMax a las salidas logits por un modelo de clasificación de secuencias?
8. ¿En qué método se centra la mayor parte de la API del tokenizador?
encode, ya que puede codificar texto en IDs e IDs en predicciones", explain: "¡Incorrecto! Aunque el método encode existe en los tokenizadores, no existe en los modelos." }, { text: "Llamar al objeto tokenizador directamente.", explain: "¡Exactamente! El método call del tokenizador es un método muy poderoso el cual puede manejar casi cualquier cosa.También es el método usado para recuperar las predicciones de un modelo.", correct: true }, { text: "pad", explain: "¡Incorrecto! El relleno es muy útil, pero es solo una parte de la API tokenizador." }, { text: "tokenize", explain: "El método tokenize es posiblemente uno de los métodos más útiles, pero no es el núcleo de la API tokenizador." } ]} />
9. ¿Qué contiene la variable result en este código de ejemplo?
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")
call o convert_tokens_to_ids!" }, { text: "Una cadena que contiene todos los tokens", explain: "Esto sería subóptimo, ya que el objetivo es dividir la cadena en varios tokens." } ]} />
{#if fw === 'pt'}
10. ¿Hay algo mal con el siguiente código?
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)
{:else}
10. ¿Hay algo mal con el siguiente código?
from transformers import AutoTokenizer, TFAutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = TFAutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)
{/if}
Xet Storage Details
- Size:
- 4 kB
- Xet hash:
- 76244440c63fa441c5407615268a5f04a7e8ebce1e14b02fda264a701715dfa5
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.