Seed-0.4B

0.4B decoder only dense model trained from scratch.
As it isn't instruction finetuned, the model performs document completion, not conversational generation.
Model is released primarily for educational, research, and experimental purposes.

Usage

from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("merterbak/Seed-0.4B")
model = AutoModelForCausalLM.from_pretrained(
    "merterbak/Seed-0.4B",
    trust_remote_code=True,
    dtype="auto"
)
prompt = "Climate change can affect"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(
    **inputs,
    max_new_tokens=100,
    do_sample=True,
    temperature=1.0,
    top_k=50,
)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Downloads last month: 80

Safetensors

Model size

0.4B params

Tensor type

F32

merterbak
/

Seed-0.4B

Seed-0.4B

Usage

Dataset used to train merterbak/Seed-0.4B