Buckets:
| # 🤗 <i>Datasets</i>, coché ! | |
| <CourseFloatingBanner | |
| chapter={5} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| Eh bien, ce fut une sacrée visite de la bibliothèque 🤗 *Datasets*. Félicitations d’être arrivé jusqu'ici ! Avec les connaissances que vous avez acquises dans ce chapitre, vous devriez être en mesure de : | |
| - charger des jeux de données depuis n'importe où, que ce soit le *Hub* d’Hugging Face, votre ordinateur portable ou un serveur distant de votre entreprise, | |
| - manipuler vos données en utilisant un mélange des fonctions Dataset.map() et Dataset.filter(), | |
| - passer rapidement d'un format de données à un autre, comme Pandas et NumPy, en utilisant Dataset.set_format(), | |
| - créer votre propre jeu de données et l’envoyer vers le *Hub*, | |
| - enchâsser vos documents en utilisant un *transformer* et construire un moteur de recherche sémantique en utilisant FAISS. | |
| Dans le [chapitre 7](/course/fr/chapter7), nous mettrons tout cela à profit en plongeant dans les tâches de traitement du langage naturel de base pour lesquelles les *transformers* sont parfaits. Avant cela mettez vos connaissances sur la librairie 🤗 *Datasets* à l'épreuve avec un petit quiz ! | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/fr/chapter5/7.mdx" /> |
Xet Storage Details
- Size:
- 1.31 kB
- Xet hash:
- 196096c2dbda7ecb63ab0438560e31e91fde707a2f2c613b2f37545e0fef43cf
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.