LH-Tech-AI
/

Quark-0.5M

Text Generation

text-generation-inference

Model card Files Files and versions

LH-Tech-AI commited on 15 days ago

Commit

107cbdc

·

verified ·

1 Parent(s): 43cb65f

Update train_model.py

Files changed (1) hide show

train_model.py +1 -1

train_model.py CHANGED Viewed

@@ -77,7 +77,7 @@ def collate_fn(batch):
     return {"input_ids": input_ids, "labels": labels}
-print("[*] Gathering 100 million tokens by streaming dataset...")
 dataset = ChunkedDataset(fast_tokenizer, target_tokens=400_000_000, seq_len=256)
 print("[*] Setting up model...")

     return {"input_ids": input_ids, "labels": labels}
+print("[*] Gathering 400 million tokens by streaming dataset...")
 dataset = ChunkedDataset(fast_tokenizer, target_tokens=400_000_000, seq_len=256)
 print("[*] Setting up model...")