sentiment-analysis-api / scripts /download_data.py
ArturMats
Dataset scaricato e salvato in data/tweets.csv
91d3f20
raw
history blame contribute delete
825 Bytes
# Importo le librerie necessarie:
import pandas as pd
from datasets import load_dataset
def download_dataset():
"""
Funzione che scarica un dataset presente in rete, assegna le classi all'output e salva i dati in un file .csv
"""
# Scarico il dataset e ne prendo solo una parte:
print("Inizio download...")
dataset = load_dataset("cardiffnlp/tweet_eval", "sentiment", split="test[:200]")
# Assegno le "etichette" all'output:
labels = {0: "negative", 1: "neutral", 2: "positive"}
df = pd.DataFrame(dataset)
df["sentiment_label"] = df["label"].map(labels)
# Definisco il percorso dove salvare il file e salvo in formato .csv:
path = "data/tweets.csv"
df.to_csv(path, index=False)
print(f"File salvato in {path}")
if __name__ == "__main__":
download_dataset()