Spaces:

Lordemarco
/

sentiment-fastapi

Sleeping

LorenzoBioinfo commited on Nov 3, 2025

Commit

97e2e51

1 Parent(s): f42bc7f

Fix error

Files changed (1) hide show

src/data_preparation.py CHANGED Viewed

@@ -79,7 +79,7 @@ def prepare_tweet_eval(tokenizer, output_path):
             reduced_splits[split] = ds[split].select(range(min(1000, len(ds[split]))))
             reduced_splits[split] = reduced_splits[split].map(lambda x: {"text": clean_text(x["text"])})
             reduced_splits[split] = reduced_splits[split].map(tokenize_function, batched=True)
-        ds = datasets.DatasetDict(reduced_splits)
     else:
         ds = ds.select(range(min(1000, len(ds))))
         ds = ds.map(lambda x: {"text": clean_text(x["text"])})

             reduced_splits[split] = ds[split].select(range(min(1000, len(ds[split]))))
             reduced_splits[split] = reduced_splits[split].map(lambda x: {"text": clean_text(x["text"])})
             reduced_splits[split] = reduced_splits[split].map(tokenize_function, batched=True)
+        ds = DatasetDict(reduced_splits)
     else:
         ds = ds.select(range(min(1000, len(ds))))
         ds = ds.map(lambda x: {"text": clean_text(x["text"])})