Buckets:

rtrm's picture
|
download
raw
11.6 kB
# Quiz di fine capitolo
Testiamo cosa avete imparato in questo capitolo!
### 1. Il dataset `emotion` contiene messaggi Twitter etichettati con emozioni. Cercalo nel [Hub](https://huggingface.co/datasets) e leggi la carta del dataset. Quale di queste non fa parte delle sue emozioni di base?
<Question
choices={[
{
text: "Joy (Gioia)",
explain: "Prova ancoraquesta emozione è contenuta nel dataset!"
},
{
text: "Love (Amore)",
explain: "Prova ancoraquesta emozione è contenuta nel dataset!"
},
{
text: "Confusion (Confusione)",
explain: "Corretto! Confusion non è una della sei emozioni di base.",
correct: true
},
{
text: "Surprise (Sorpresa)",
explain: "Sorpresa! Prova ancora!"
}
]}
/>
### 2. Cerca il dataset `ar_sarcasm` nel [Hub](https://huggingface.co/datasets). Quali compiti supporta?
<Question
choices={[
{
text: "Sentiment classification (Classificazione dei sentimenti)",
explain: "Corretto! Si capisce dai tag.",
correct: true
},
{
text: "Machine translation (Traduzione automatica)",
explain: "Sbagliatodai un'altra occhiata alla <a href='https://huggingface.co/datasets/ar_sarcasm'>dataset card</a>!"
},
{
text: "Named entity recognition (Riconoscimento di entità con un nome)",
explain: "Sbagliato — dai un'altra occhiata alla <a href='https://huggingface.co/datasets/ar_sarcasm'>dataset card</a>!"
},
{
text: "Question answering (Risposte a domande)",
explain: "Purtroppo non hai risposto correttamente. Prova ancora!"
}
]}
/>
### 3. Come deve essere preparata una coppia di frasi per essere processata dal modello BERT?
<Question
choices={[
{
text: "Tokens_della_frase_1 [SEP] Tokens_della_frase_2",
explain: "Un token speciale <code>[SEP]</code> è necessario per separare le due frasi, ma non è l'unica cosa!"
},
{
text: "[CLS] Tokens_della_frase_1 Tokens_della_frase_2",
explain: "Un token speciale <code>[CLS]</code> è necessario all'inizio, ma non è l'unica cosa!"
},
{
text: "[CLS] Tokens_della_frase_1 [SEP] Tokens_della_frase_2 [SEP]",
explain: "Corretto!",
correct: true
},
{
text: "[CLS] Tokens_della_frase_1 [SEP] Tokens_della_frase_2",
explain: "Un token speciale <code>[CLS]</code> è necessario all'inizio e un token speciale <code>[SEP]</code> è necessario per separare le due frasi, ma non è l'unica cosa!"
}
]}
/>
{#if fw === 'pt'}
### 4. Quali sono i benefici del metodo `Dataset.map()`?
<Question
choices={[
{
text: "I risultati della funzione vengono conservati, così la ri-esecuzione del codice sarà rapidissima",
explain: "Questo è sicuramente uno dei benefici di questo metodo! Ma non è l'unico...",
correct: true
},
{
text: "È possibile applicare multiprocessing per un'esecuzione più rapida rispetto all'applicazione seriale ad ogni elemento del dataset",
explain: "Questo è sicuramente uno dei benefici di questo metodo! Ma non è l'unico...",
correct: true
},
{
text: "Non carica l'intero dataset in memoria, salvando i risultati appena ogni elemento è stato processato.",
explain: "Questo è sicuramente uno dei benefici di questo metodo! Ma non è l'unico...",
correct: true
},
]}
/>
### 5. Qual è il significato di padding dinamico (dynamic padding)?
<Question
choices={[
{
text: "È quando si applica in ogni batch il padding fino alla lunghezza massima dell'intero dataset",
explain: "Riguarda il padding per ogni batch, ma non fino alla lunghezza massima dell'intero dataset."
},
{
text: "È quando si applica in ogni batch il padding fino alla lunghezza massima delle frasi in quella batch",
explain: "Corretto! la parte \"dinamica\" viene dal fatto che la dimensione per ogni batch viene determinata al momento della creazione, e quindi le batch potrebbero avere dimensioni differenti.",
correct: true
},
{
text: "È quando si applica il padding agli input in modo che ogni frase abbia lo stesso numero di token della frase precedente nel dataset.",
explain: "Sbagliato. In più non avrebbe senso considerare l'ordine del dataset dato che lo rimischiamo durante l'apprendimento."
},
]}
/>
### 6. Qual è lo scopo di una funzione di raccolta (collate function)?
<Question
choices={[
{
text: "Di assicurarsi che tutte le sequenze nel dataset abbiano la stessa lunghezza.",
explain: "Una funzione di raccolta gestisce solo batch individuali, non l'intero dataset. In più, si sta parlando di funzioni di raccolta in generale, e non specificatamente di <code>DataCollatorWithPadding</code>."
},
{
text: "Di raccogliere tutti i campioni in una batch.",
explain: "Corretto! Puoi passare la funzione di raccolta come argomento di un <code>DataLoader</code>. Noi abbiamo usato la funzione <code>DataCollatorWithPadding</code>, che applica padding a tutti gli elementi di una batch affinché abbiano la stessa lunghezza.",
correct: true
},
{
text: "Di preprocessare l'intero dataset",
explain: "Quella sarebbe una funzione di preprocessing, non di raccolta."
},
{
text: "Di troncare le sequenze nel dataset.",
explain: "Una funzione di raccolta gestisce solo batch individuali, non l'intero dataset. Se siete interessati al troncamento, potete usare l'argomento <code>truncate</code> del <code>tokenizer</code>."
}
]}
/>
### 7. Cosa succede quando una classe di tipo `AutoModelForXxx` viene istanziata con un modello di linguaggio pre-addestrato (come `bert-base-uncased`) che corrisponde ad un compito differente rispetto a quello per cui era stato addestrato?
<Question
choices={[
{
text: "Nulla, ma viene mostrato un avvertimento",
explain: "L'avvertimento non è 'l'unica cosa!"
},
{
text: "La testa del modello pre-addestrato viene scartata e una nuova testa, appropriata per il compito, viene inserita al suo posto",
explain: "Corretto. Ad esempio, quando abbiamo usato <code>AutoModelForSequenceClassification</code> con <code>bert-base-uncased</code>, abbiamo ottenuto un avvertimento mentre il modello veniva istanziato. La testa pre-addestrata non viene usata per il compito di classificazione delle sequenze, ma viene scartata e una nuova testa viene istanziata con pesi casuali.",
correct: true
},
{
text: "La testa del modello pre-addestrato viene scartata",
explain: "Deve succedere anche qualcos'altro. Prova ancora!"
},
{
text: "Nulla, dato che il modello può comunque essere affinato per un compito differente.",
explain: "La testa del modello pre-addestrato non era stata addestrata per risolvere questo compito, quindi dovremmo scartarla!"
}
]}
/>
### 8. Qual è lo scopo di `TrainingArguments`?
<Question
choices={[
{
text: "Contiene tutti gli iperparametri usati per l'addestramento e la valutazione con il <code>Trainer</code>.",
explain: "Corretto!",
correct: true
},
{
text: "Specifica le dimensioni del modello.",
explain: "Le dimensioni del modello sono definite dalla configurazione del modello, non dalla classe <code>TrainingArguments</code>."
},
{
text: "Contiene soltanto gli iperparametri usati per la valutazione.",
explain: "Nell'esempio, abbiamo specificato anche dove salvare il modello e i suoi checkpoint. Prova ancora!"
},
{
text: "Contiene soltanto gli iperparametri usati per l'addestramento.",
explain: "Nell'esempio, abbiamo usato anche una <code>evaluation_strategy</code> (stragia di valutazione). Prova ancora!"
}
]}
/>
### 9. Perché si dovrebbe usare la libreria 🤗 Accelerate?
<Question
choices={[
{
text: "Fornisce l'accesso a modelli più veloci.",
explain: "No, la libreria 🤗 Accelerate non fornisce l'accesso ad alcun modello"
},
{
text: "Fornisce una API di alto livello, così non devo implementare il mio ciclo di addestramento.",
explain: "Questa è la funzionalità del <code>Trainer</code>, non della libreria 🤗 Accelerate. Prova ancora!"
},
{
text: "Permette ai nostri cicli di addestramento di venire eseguiti con strategie distribuite.",
explain: "Corretto! Con 🤗 Accelerate, i tuoi cicli di addestramento funzioneranno con svariate GPU e TPU.",
correct: true
},
{
text: "Fornisce altre funzioni di ottimizzazione.",
explain: "No, la libreria 🤗 Accelerate library non fornisce alcuna funzione di ottimizzazione."
}
]}
/>
{:else}
### 4. Cosa succede quando una classe di tipo `TFAutoModelForXxx` viene istanziata con un modello di linguaggio pre-addestrato (come `bert-base-uncased`) che corrisponde ad un compito differente rispetto a quello per cui era stato addestrato?
<Question
choices={[
{
text: "Nulla, ma viene mostrato un avvertimento",
explain: "L'avvertimento non è l'unica cosa!"
},
{
text: "La testa del modello pre-addestrato viene scartata e una nuova testa, appropriata per il compito, viene inserita al suo posto",
explain: "Corretto. Ad esempio, quando abbiamo usato <code>TFAutoModelForSequenceClassification</code> con <code>bert-base-uncased</code>, abbiamo ottenuto un avvertimento mentre il modello veniva istanziato. La testa pre-addestrata non viene usata per il compito di classificazione delle sequenze, ma viene scartata e una nuova testa viene istanziata con pesi casuali.",
correct: true
},
{
text: "La testa del modello pre-addestrato viene scartata",
explain: "Deve succedere anche qualcos'altro. Prova ancora!"
},
{
text: "Nulla, dato che il modello può comunque essere affinato per un compito differente.",
explain: "La testa del modello pre-addestrato non era stata addestrata per risolvere questo compito, quindi dovremmo scartarla!"
}
]}
/>
### 5. I modelli Tensorflow da `transformers` sono già dei modelli Keras. Quali benefici offre ciò?
<Question
choices={[
{
text: "I modelli funzionano automaticamente su una TPU.",
explain: "Quasi! Sono richiesti alcuni cambiamenti. Ad esempio, bisogna eseguire tutto all'interno di uno scope <code>TPUStrategy</code>, incluso l'inizializzazione del modello"
},
{
text: "Si possono sfruttare metodi già esistenti quali <code>compile()</code>, <code>fit()</code>, e <code>predict()</code>.",
explain: "Correto! Una volta ottenuti i dati, l'addestramento richiede molto poco sforzo.",
correct: true
},
{
text: "Puoi imparare Keras in aggiunta ai transformers.",
explain: "Corretto, anche se cercavamo qualcosa in pù :)",
correct: true
},
{
text: "Si possono calcolare facilmente delle metriche relative al dataset",
explain: "Keras è d'aiuto nell'addestramento e valutazione del modello, non nel calcolare metriche relative al dataset."
}
]}
/>
### 6. Come si definisce una metrica personalizzata (custom metric)?
<Question
choices={[
{
text: "Creando una sottoclasse di <code>tf.keras.metrics.Metric</code>.",
explain: "Ottimo!",
correct: true
},
{
text: "Usando l'API funzionale di Keras",
explain: "Prova ancora!"
},
{
text: "Utilizzando una funzione con segnatura <code>metric_fn(y_true, y_pred)</code>.",
explain: "Corretto!",
correct: true
},
{
text: "Chiedendo a Google",
explain: "Non è la risposta che cercavamo, ma dovrebbe comunque aiutarvi a risolvere il problema.",
correct: true
}
]}
/>
{/if}
<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/it/chapter3/6.mdx" />

Xet Storage Details

Size:
11.6 kB
·
Xet hash:
0bd0074d13e22e047fc2645745f97d9374099505909b53eb4af19cd7785daba0

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.