File size: 825 Bytes
91d3f20 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 | # Importo le librerie necessarie:
import pandas as pd
from datasets import load_dataset
def download_dataset():
"""
Funzione che scarica un dataset presente in rete, assegna le classi all'output e salva i dati in un file .csv
"""
# Scarico il dataset e ne prendo solo una parte:
print("Inizio download...")
dataset = load_dataset("cardiffnlp/tweet_eval", "sentiment", split="test[:200]")
# Assegno le "etichette" all'output:
labels = {0: "negative", 1: "neutral", 2: "positive"}
df = pd.DataFrame(dataset)
df["sentiment_label"] = df["label"].map(labels)
# Definisco il percorso dove salvare il file e salvo in formato .csv:
path = "data/tweets.csv"
df.to_csv(path, index=False)
print(f"File salvato in {path}")
if __name__ == "__main__":
download_dataset() |