Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / course /pr_1114 /fr /chapter4 /2.md

rtrm

about 1 month ago

preview code

download

raw

6.22 kB

	# Utilisation de modèles pré-entraînés

	{#if fw === 'pt'}

	<CourseFloatingBanner chapter={4}
	classNames="absolute z-10 right-0 top-0"
	notebooks={[
	{label: "English", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
	{label: "Français", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/fr/chapter4/section2_pt.ipynb"},
	{label: "English", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_pt.ipynb"},
	{label: "Français", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/fr/chapter4/section2_pt.ipynb"},
	]} />

	{:else}
	<CourseFloatingBanner chapter={4}
	classNames="absolute z-10 right-0 top-0"
	notebooks={[
	{label: "English", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
	{label: "Français", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/fr/chapter4/section2_tf.ipynb"},
	{label: "English", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/en/chapter4/section2_tf.ipynb"},
	{label: "Français", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/fr/chapter4/section2_tf.ipynb"},
	]} />

	{/if}

	Le Hub rend simple la sélection d'un modèle et permet alors que celui-ci puisse être utilisé dans toute bibliothèque en aval en seulement quelques lignes de code. Voyons comment utiliser concrètement l'un de ces modèles et comment contribuer au développement de la communauté.

	Supposons que nous recherchions un modèle basé sur le français, capable de remplir des masques.

	<div class="flex justify-center">
	<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
	</div>

	Nous choisissons le checkpoint `camembert-base` pour essayer. L'identifiant `camembert-base` est tout ce dont nous avons besoin pour commencer à utiliser le modèle ! Comme vous l'avez vu dans les chapitres précédents, nous pouvons l'instancier en utilisant la fonction `pipeline()` :

	```py
	from transformers import pipeline

	camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
	results = camembert_fill_mask("Le camembert est <mask> :)")
	```

	```python out
	[
	{'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'},
	{'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'},
	{'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'},
	{'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'},
	{'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
	]
	```

	Comme vous pouvez le constater, le chargement d'un modèle dans un pipeline est extrêmement simple. La seule chose à laquelle vous devez faire attention est que le checkpoint choisi soit adapté à la tâche pour laquelle il va être utilisé. Par exemple, ici nous chargeons le checkpoint `camembert-base` dans le pipeline `fill-mask`, ce qui est tout à fait correct. Mais si nous chargerions ce checkpoint dans le pipeline `text-classification`, les résultats n'auraient aucun sens car la tête de `camembert-base` n'est pas adaptée à cette tâche ! Nous recommandons d'utiliser le sélecteur de tâche dans l'interface du Hub afin de sélectionner les checkpoints appropriés :

	<div class="flex justify-center">
	<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="The task selector on the web interface." width="80%"/>
	</div>

	Vous pouvez également instancier le checkpoint en utilisant directement l'architecture du modèle :

	{#if fw === 'pt'}
	```py
	from transformers import CamembertTokenizer, CamembertForMaskedLM

	tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
	model = CamembertForMaskedLM.from_pretrained("camembert-base")
	```

	Cependant, nous recommandons d'utiliser les classes [`Auto`](https://huggingface.co/transformers/model_doc/auto.html?highlight=auto#auto-classes) à la place, car elles sont par conception indépendantes de l'architecture. Alors que l'exemple de code précédent limite les utilisateurs aux checkpoints* chargeables dans l'architecture CamemBERT, l'utilisation des classes `Auto` facilite le changement de checkpoint* :

	```py
	from transformers import AutoTokenizer, AutoModelForMaskedLM

	tokenizer = AutoTokenizer.from_pretrained("camembert-base")
	model = AutoModelForMaskedLM.from_pretrained("camembert-base")
	```
	{:else}
	```py
	from transformers import CamembertTokenizer, TFCamembertForMaskedLM

	tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
	model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
	```

	Cependant, nous recommandons d'utiliser les classes [`TFAuto`](https://huggingface.co/transformers/model_doc/auto.html?highlight=auto#auto-classes) à la place, car elles sont par conception indépendantes de l'architecture. Alors que l'exemple de code précédent limite les utilisateurs aux checkpoints* chargeables dans l'architecture CamemBERT, l'utilisation des classes `TFAuto` facilite le changement de checkpoint* :


	```py
	from transformers import AutoTokenizer, TFAutoModelForMaskedLM

	tokenizer = AutoTokenizer.from_pretrained("camembert-base")
	model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
	```
	{/if}

	> [!TIP]
	> Lorsque vous utilisez un modèle pré-entraîné, assurez-vous de vérifier comment il a été entraîné, sur quels jeux de données, ses limites et ses biais. Toutes ces informations doivent être indiquées dans sa carte.


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/fr/chapter4/2.mdx" />

Xet Storage Details

Size:: 6.22 kB
Xet hash:: 5df34314d89674e6ad53b2fde555bffbef82c2996c4c77b1316aed1552b5f171

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.