Buckets:

rtrm's picture
|
download
raw
3.96 kB
# Quiz la final de capitol [[quiz-la-final-de-capitol]]
### 1. Care este ordinea pipeline-ului de modelare a limbajului?
### 2. Câte dimensiuni are tensorul generat de modelul Transformer și care sunt acestea?
### 3. Care dintre următoarele este un exemplu de tokenizare a cuvintelor secundare?
### 4. Ce este un model head?
{#if fw === 'pt'}
### 5. Ce este un AutoModel?
AutoTrain?"
},
{
text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint.",
explain: "Exact: AutoModel are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
correct: true
},
{
text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați Model Hub pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
}
]}
/>
{:else}
### 5. Ce este un TFAutoModel?
AutoTrain?"
},
{
text: "Un obiect care returnează arhitectura corespunzătoare bazată pe checkpoint",
explain: "Exact: TFAutoModel are nevoie doar să știe checkpoint-ul din care să se inițializeze pentru a returna arhitectura corectă.",
correct: true
},
{
text: "Un model care detectează automat limba utilizată pentru intrările sale pentru a încărca ponderile corecte",
explain: "Incorect; deși unele checkpoint-uri și modele pot gestiona mai multe limbi, nu există instrumente integrate pentru selectarea automată a checkpoint-ului în funcție de limbă. Ar trebui să consultați Model Hub pentru a găsi cel mai bun checkpoint pentru sarcina dumneavoastră!"
}
]}
/>
{/if}
### 6. Care sunt tehnicile de care trebuie să țineți cont atunci când grupați secvențe de diferite lungimi?
### 7. Care este scopul aplicării unei funcții SoftMax asupra logit-urilor produse de un model de clasificare a secvențelor?
### 8. În jurul cărei metode se concentrează cea mai mare parte a API-ului tokenizer?
encode, deoarece poate codifica textul în ID-uri și ID-urile în predicții",
explain: "Greșit! Deși metoda encode există pe tokenizers, ea nu există pe modele."
},
{
text: "Apelarea directă a obiectului tokenizer.",
explain: "Exact! Metoda __call__ a tokenizatorului este foarte puternică și poate gestiona aproape orice. Este și metoda folosită pentru a obține predicții de la un model.",
correct: true
},
{
text: "pad",
explain: "Greșit! Padding-ul este foarte util, dar este doar o parte a API-ului tokenizer."
},
{
text: "tokenize",
explain: "Metoda tokenize este, fără îndoială, una dintre cele mai utile, dar nu reprezintă nucleul API-ului tokenizer."
}
]}
/>
### 9. Ce conține variabila `result` în acest exemplu de cod?
```py
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")
```
__call__ sau convert_tokens_to_ids!"
},
{
text: "Un șir care conține toate token-urile",
explain: "Nu ar fi optim, deoarece scopul este de a separa șirul inițial în mai multe token-uri."
}
]}
/>
{#if fw === 'pt'}
### 10. Este ceva greșit în următorul cod?
```py
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)
```
{:else}
### 10. Este ceva greșit în următorul cod?
```py
from transformers import AutoTokenizer, TFAutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = TFAutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)
```
{/if}

Xet Storage Details

Size:
3.96 kB
·
Xet hash:
3fc29fac7b99f861e51e2b6d9c56c553615a8f8349081f05b099ed0d3e283f1f

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.