CalmaCatLM-2-mini / README.md
ViorikaAI's picture
Update README.md
b2bca84 verified
metadata
license: mit
language:
  - ru
base_model: gpt-2
tags:
  - gpt-2
  - russian
  - conversational
model-index:
  - name: CalmaCatLM-2
    results: []
library_name: transformers
model_creator: ViorikaAI
pipeline_tag: text-generation

🐈‍⬛ CalmaCatLM-2-MINI

Подробнее:

⚙️ Детали модели

  • Архитектура: GPT-3
  • Параметры: 125M
  • Язык: Русский
  • Лицения: MIT

🏋️ Детали Тренировки

  • Датасет: ``
  • Железо: ОДНА NVIDIA GEFORCE RTX 5060 TI (16GB VRAM)
  • Эпохи: ...
  • Шагов: - 20 тысяч
  • СРЕДНИЙ LOSS: 0.9000
  • Оптимизатор: 3e-4
  • Контекст: 1024 токенов

🏋️ Использование

from transformers import GPT2LMHeadModel, GPT2Tokenizer

model = GPT2LMHeadModel.from_pretrained("ViorikaAI/CalmaCatLM-2-mini")
tokenizer = GPT2Tokenizer.from_pretrained("ViorikaAI/CalmaCatLM-2-mini")
tokenizer.pad_token = tokenizer.eos_token

inputs = tokenizer("Привет, как дела?", return_tensors="pt")
outputs = model.generate(
    **inputs,
    max_new_tokens=80,
    temperature=0.7,
    top_k=50,
    do_sample=True,
    pad_token_id=tokenizer.eos_token_id,
)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

🛜 Наши Соц. Сети