О модели

112 gb data with llama 1.2b model

Что внутри

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "home_run_llm"

tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name)

prompt = "The foggy streets of London in 1840 were" inputs = tokenizer(prompt, return_tensors="pt")

outputs = model.generate(**inputs, max_new_tokens=100) print(tokenizer.decode(outputs[0], skip_special_tokens=True))


## Заметки по тренировке

- **Железо**: H100 SXM 
- **Время**: ~118 часов.
- **Денег ушло**: ~350 долларов
- **Лосс**: Упал с 10.79 до 3.35.

Safetensors

Model size

1B params

Tensor type

BF16