Buckets:
| # 🤗 Datasets, итоги! | |
| <CourseFloatingBanner | |
| chapter={5} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| Что ж, это было настоящее путешествие по библиотеке 🤗 Datasets — поздравляем, вы зашли так далеко! Со знаниями, которые вы получили из этой главы, вы сможете: | |
| - Загружать наборы данных из любого места, будь то Hugging Face Hub, ваш ноутбук или удаленный сервер в вашей компании. | |
| - Обрабатывать свои данные, используя сочетание функций `Dataset.map()` и `Dataset.filter()`. | |
| - Быстро переключаться между форматами данных, такими как Pandas и NumPy, с помощью `Dataset.set_format()`. | |
| - Создавать свой собственный набор данных и отправлять его в Hugging Face Hub. | |
| - Строить свои эмбеддинги документов с помощью модели Transformer и создавать семантический поисковик с помощью FAISS. | |
| В [Главе 7](../chapter7) мы будем использовать все это с пользой, поскольку мы углубимся в основные задачи NLP, для которых отлично подходят модели Transformer. Однако, прежде чем идти вперед, проверьте свои знания о 🤗 Datasets с помощью быстрого теста! | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ru/chapter5/7.mdx" /> |
Xet Storage Details
- Size:
- 1.77 kB
- Xet hash:
- e7b63915216f583cb69185597c22a0c5416e12989550aaa661cc287cb4a91b61
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.