File size: 825 Bytes
91d3f20
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# Importo le librerie necessarie:

import pandas as pd
from datasets import load_dataset

def download_dataset():

    """
    Funzione che scarica un dataset presente in rete, assegna le classi all'output e salva i dati in un file .csv
    """

    # Scarico il dataset e ne prendo solo una parte:
    print("Inizio download...")
    dataset = load_dataset("cardiffnlp/tweet_eval", "sentiment", split="test[:200]")

    # Assegno le "etichette" all'output:
    labels = {0: "negative", 1: "neutral", 2: "positive"}

    df = pd.DataFrame(dataset)
    df["sentiment_label"] = df["label"].map(labels)

    # Definisco il percorso dove salvare il file e salvo in formato .csv:
    path = "data/tweets.csv"
    df.to_csv(path, index=False)

    print(f"File salvato in {path}")

if __name__ == "__main__":
    download_dataset()