Spaces:
Sleeping
Sleeping
| # Importo le librerie necessarie: | |
| import pandas as pd | |
| from datasets import load_dataset | |
| def download_dataset(): | |
| """ | |
| Funzione che scarica un dataset presente in rete, assegna le classi all'output e salva i dati in un file .csv | |
| """ | |
| # Scarico il dataset e ne prendo solo una parte: | |
| print("Inizio download...") | |
| dataset = load_dataset("cardiffnlp/tweet_eval", "sentiment", split="test[:200]") | |
| # Assegno le "etichette" all'output: | |
| labels = {0: "negative", 1: "neutral", 2: "positive"} | |
| df = pd.DataFrame(dataset) | |
| df["sentiment_label"] = df["label"].map(labels) | |
| # Definisco il percorso dove salvare il file e salvo in formato .csv: | |
| path = "data/tweets.csv" | |
| df.to_csv(path, index=False) | |
| print(f"File salvato in {path}") | |
| if __name__ == "__main__": | |
| download_dataset() |