Spaces:

flytoe
/

Transformer

Runtime error

flytoe commited on Mar 19

Commit

5665c6b

verified ·

1 Parent(s): b6a1553

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,12 +7,12 @@ model_name = "allenai/scibert_scivocab_uncased"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=3)  # z.B. für 3 Kategorien
-# 2️⃣ Dataset laden (ersetze mit deinem Dataset)
-dataset = load_dataset("scientific_papers", "arxiv")  # Hugging Face Datasets
 # 3️⃣ Tokenisierung der Texte
 def tokenize_function(examples):
-    return tokenizer(examples["abstract"], padding="max_length", truncation=True)
 tokenized_datasets = dataset.map(tokenize_function, batched=True)

 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=3)  # z.B. für 3 Kategorien
+# 2️⃣ Dataset laden (armanc/scientific_papers)
+dataset = load_dataset("armanc/scientific_papers")
 # 3️⃣ Tokenisierung der Texte
 def tokenize_function(examples):
+    return tokenizer(examples["text"], padding="max_length", truncation=True)
 tokenized_datasets = dataset.map(tokenize_function, batched=True)