Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / course /pr_1114 /de /chapter4 /2.md

rtrm

about 1 month ago

preview code

download

raw

5.29 kB

	# Verwendung vortrainierter Modelle

	{#if fw === 'pt'}

	<DocNotebookDropdown
	classNames="absolute z-10 right-0 top-0"
	options={[
	{label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/chapter4/section2_pt.ipynb"},
	{label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/chapter4/section2_pt.ipynb"},
	]} />

	{:else}

	<DocNotebookDropdown
	classNames="absolute z-10 right-0 top-0"
	options={[
	{label: "Google Colab", value: "https://colab.research.google.com/github/huggingface/notebooks/blob/master/course/chapter4/section2_tf.ipynb"},
	{label: "Aws Studio", value: "https://studiolab.sagemaker.aws/import/github/huggingface/notebooks/blob/master/course/chapter4/section2_tf.ipynb"},
	]} />

	{/if}


	Der Model Hub erleichtert das Auswählen des passenden Modells, sodass es von downstream Libraries mit wenigen Codezeilen benutzt werden kann. Lass uns anschauen, wie genau man solche Modelle verwendet und wie man der Communinity zurück beitragen kann.

	Nehmen wir an, wir suchen nach einem französichbasierten Modell, das die "mask filling" Aufgabe kann.

	<div class="flex justify-center">
	<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/camembert.gif" alt="Selecting the Camembert model." width="80%"/>
	</div>

	Wir wählen den `camembert-base` Checkpoint aus, um es zu auszuprobieren. Das Kennzeichen `camembert-base` ist alles, was wir brauchen, um loszulegen! Wie in früheren Kapiteln gezeigt wurde, können wir das Modell mit der `pipeline()` Funktion instanziieren:

	```py
	from transformers import pipeline

	camembert_fill_mask = pipeline("fill-mask", model="camembert-base")
	results = camembert_fill_mask("Le camembert est <mask> :)")
	```

	```python out
	[
	{'sequence': 'Le camembert est délicieux :)', 'score': 0.49091005325317383, 'token': 7200, 'token_str': 'délicieux'},
	{'sequence': 'Le camembert est excellent :)', 'score': 0.1055697426199913, 'token': 2183, 'token_str': 'excellent'},
	{'sequence': 'Le camembert est succulent :)', 'score': 0.03453313186764717, 'token': 26202, 'token_str': 'succulent'},
	{'sequence': 'Le camembert est meilleur :)', 'score': 0.0330314114689827, 'token': 528, 'token_str': 'meilleur'},
	{'sequence': 'Le camembert est parfait :)', 'score': 0.03007650189101696, 'token': 1654, 'token_str': 'parfait'}
	]
	```
	So einfach kann man mit einer Pipeline ein Modell laden. Dabei muss man nur darauf achten, den passenden Checkpoint für die gewünschte Aufgabe zu selektieren. Zum Beispiel: Wir laden hier den `camembert-base` Checkpoint in die `fill-mask` Pipeline, was schon korrekt ist. Aber würden wir diesen Checkpoint in die `text-classification` Pipeline laden, wären die Ergebnisse völlig sinnlos, weil der "head" von `camembert-base` für diese Aufgabe einfach nicht passt! Wir empfehlen, den "Task Selector" auf der Hugging Face Hub Seite zu benutzen, um die richtigen Checkpoints auszuwählen:

	<div class="flex justify-center">
	<img src="https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter4/tasks.png" alt="The task selector on the web interface." width="80%"/>
	</div>

	Du kannst auch den Checkpoint mit der Modell-Architektur direkt instanziieren:

	{#if fw === 'pt'}
	```py
	from transformers import CamembertTokenizer, CamembertForMaskedLM

	tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
	model = CamembertForMaskedLM.from_pretrained("camembert-base")
	```

	Dennoch empfehlen wir, dass man die [`Auto` classes](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes) stattdessen benutzt, da diese architekturunabhängig sind. Das vorherige Code-Beispiel gilt nur für Checkpoints, die in die CamemBERT Architektur zu laden sind, aber mit den `Auto` Klassen kann man Checkpoints ziemlich einfach tauschen:

	```py
	from transformers import AutoTokenizer, AutoModelForMaskedLM

	tokenizer = AutoTokenizer.from_pretrained("camembert-base")
	model = AutoModelForMaskedLM.from_pretrained("camembert-base")
	```
	{:else}
	```py
	from transformers import CamembertTokenizer, TFCamembertForMaskedLM

	tokenizer = CamembertTokenizer.from_pretrained("camembert-base")
	model = TFCamembertForMaskedLM.from_pretrained("camembert-base")
	```

	Hier empfehlen wir auch, dass man stattdessen die [`TFAuto` classes](https://huggingface.co/transformers/model_doc/auto?highlight=auto#auto-classes) benutzt, da diese architekturunabhängig sind. Das vorherige Code-Beispiel gilt nur für Checkpoints, die in die CamemBERT Architektur zu laden sind, aber mit den `TFAuto` Klassen kann man Checkpoints einfach tauschen:

	```py
	from transformers import AutoTokenizer, TFAutoModelForMaskedLM

	tokenizer = AutoTokenizer.from_pretrained("camembert-base")
	model = TFAutoModelForMaskedLM.from_pretrained("camembert-base")
	```
	{/if}

	> [!TIP]
	> Wenn du ein vortrainiertes Modell verwendest, prüf erstmal, wie genau das traininert wurde, mit welchen Datensätzen, sowie seine Einschränkungen und Biases. All diese Informationen sollten auf der Modellbeschreibungskarte stehen.


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/de/chapter4/2.mdx" />

Xet Storage Details

Size:: 5.29 kB
Xet hash:: 53f468dc8ca118d980b71bef7b7ed179449bfe4f411c46215600abdbfb2aec2c

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.