Buckets:
🤗 Datasets, verificare![[datasets-check]]
Ei bine, a fost un tur palpitant prin biblioteca 🤗 Datasets -- felicitări pentru că ai ajuns până aici! Cu cunoștințele pe care le-ai dobândit din acest capitol, ar trebui să fii capabil să:
- Încarci dataseturi de oriunde, fie Hugging Face Hub, laptopul tău sau un server remote de la compania ta.
- Modelezi datele tale folosind o combinație a funcțiilor
Dataset.map()șiDataset.filter(). - Schimbi rapid între data formats precum Pandas și NumPy folosind
Dataset.set_format(). - Creezi propriul tău dataset și să îl publici pe Hugging Face Hub.
- Încorporezi documentele tale folosind un model Transformer și construiești un motor de căutare semantică folosind FAISS.
În Capitolul 7, vom pune toate acestea în practică, făcând o examinare amănunțită a principalelor sarcini NLP pentru care modelele Transformer sunt excelente. Înainte de a trece mai departe, puneți-vă cunoștințele despre 🤗 Datasets la încercare cu un quiz rapid!
Xet Storage Details
- Size:
- 1.24 kB
- Xet hash:
- 41a09029f4ec859fcde97c5b4666b73da8f218154c81c7d0022bfbfba1660dad
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.