Buckets:

hf-doc-build
/

doc-dev

hf-doc-build/doc-dev / course /pr_1107 /ru /chapter5 /7.md

rtrm's picture

about 2 months ago

|

1.77 kB

	# 🤗 Datasets, итоги!

	<CourseFloatingBanner
	chapter={5}
	classNames="absolute z-10 right-0 top-0"
	/>

	Что ж, это было настоящее путешествие по библиотеке 🤗 Datasets — поздравляем, вы зашли так далеко! Со знаниями, которые вы получили из этой главы, вы сможете:

	- Загружать наборы данных из любого места, будь то Hugging Face Hub, ваш ноутбук или удаленный сервер в вашей компании.
	- Обрабатывать свои данные, используя сочетание функций `Dataset.map()` и `Dataset.filter()`.
	- Быстро переключаться между форматами данных, такими как Pandas и NumPy, с помощью `Dataset.set_format()`.
	- Создавать свой собственный набор данных и отправлять его в Hugging Face Hub.
	- Строить свои эмбеддинги документов с помощью модели Transformer и создавать семантический поисковик с помощью FAISS.

	В [Главе 7](../chapter7) мы будем использовать все это с пользой, поскольку мы углубимся в основные задачи NLP, для которых отлично подходят модели Transformer. Однако, прежде чем идти вперед, проверьте свои знания о 🤗 Datasets с помощью быстрого теста!


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ru/chapter5/7.mdx" />

Xet Storage Details

Size:: 1.77 kB
Xet hash:: e7b63915216f583cb69185597c22a0c5416e12989550aaa661cc287cb4a91b61

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.