Nandi Experiments
Collection
Эксперименты над индийской серией моделей nandi • 2 items • Updated
# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("ClosRise/RandomNandi_200m")
model = AutoModelForCausalLM.from_pretrained("ClosRise/RandomNandi_200m")Не является оригинальной моделью , для создания модели была взята модель Rta-AILabs/Nandi-Mini-150M и методом расширения слоев были созданы новые, точнее на основе llama-подобное архитектуры перенесли знания с Nandi на нее + дополнили кол-во слоев. :3
Стоит отметить что модель толком не обучалась после переноса, так что готовая версия на данной странице является "рандомной" по своей сути.
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="ClosRise/RandomNandi_200m")