Buckets:
🤗 Datasets, ¡listo!
Bueno, ese fue un gran tour de la librería 🤗 Datasets. ¡Felicitaciones por llegar hasta aquí! Con el conocimiento que adquiriste en este capítulo, deberías ser capaz de:
- Cargar datasets de cualquier parte, sea del Hub de Hugging Face, tu computador o un servidor remoto en tu compañía.
- Preparar tus datos usando una combinación de las funciones
Dataset.map()yDataset.filter(). - Cambiar rápidamente entre formatos de datos como Pandas y NumPy usando
Dataset.set_format(). - Crear tu propio dataset y subirlo al Hub de Hugging Face.
- Procesar tus documentos usando un modelo de Transformer y construir un motor de búsqueda semántica usando FAISS.
En el Capítulo 7 pondremos todo esto en práctica cuando veamos a profundidad las tareas de PLN en las que son buenos los modelos de Transformers. Antes de seguir, ¡es hora de poner a prueba tu conocimiento de 🤗 Datasets con un quiz!
Xet Storage Details
- Size:
- 1.15 kB
- Xet hash:
- e7da569d6e49abd5b14f8f5bee35391b18668abfb562b60b9af76b947fd45953
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.