# Generate text with RuGPTs in huggingface
How to generate text with pretrained RuGPTs models with huggingface.

This notebook is valid for all RuGPTs models except RuGPT3XL.
## Install env

In [None]:
!pip3 install transformers

## Generate

In [3]:
import numpy as np
import torch

In [None]:
np.random.seed(42)
torch.manual_seed(42)

In [5]:
from transformers import GPT2LMHeadModel, GPT2Tokenizer

In [6]:
def load_tokenizer_and_model(model_name_or_path):
 return GPT2Tokenizer.from_pretrained(model_name_or_path), GPT2LMHeadModel.from_pretrained(model_name_or_path).cuda()


def generate(
 model, tok, text,
 do_sample=True, max_length=50, repetition_penalty=5.0,
 top_k=5, top_p=0.95, temperature=1,
 num_beams=None,
 no_repeat_ngram_size=3
 ):
 input_ids = tok.encode(text, return_tensors="pt").cuda()
 out = model.generate(
 input_ids.cuda(),
 max_length=max_length,
 repetition_penalty=repetition_penalty,
 do_sample=do_sample,
 top_k=top_k, top_p=top_p, temperature=temperature,
 num_beams=num_beams, no_repeat_ngram_size=no_repeat_ngram_size
 )
 return list(map(tok.decode, out))

### RuGPT2Large

In [None]:
tok, model = load_tokenizer_and_model("sberbank-ai/rugpt2large")
generated = generate(model, tok, "Александр Сергеевич Пушкин родился в ", num_beams=10)
generated[0]

### RuGPT3Small

In [None]:
tok, model = load_tokenizer_and_model("sberbank-ai/rugpt3small_based_on_gpt2")
generated = generate(model, tok, "Александр Сергеевич Пушкин родился в ", num_beams=10)

In [9]:
generated[0]

'Александр Сергеевич Пушкин родился в 1825 г. в семье поэта Александра Сергеевича Пушкина и его жены Александры Николаевны Пушкиной (урожденной Пушкиных). В 1783 г. он поступил на юридический факультет Санкт-Петербургского университета'

### RuGPT3Medium

In [None]:
tok, model = load_tokenizer_and_model("sberbank-ai/rugpt3medium_based_on_gpt2")
generated = generate(model, tok, "Александр Сергеевич Пушкин родился в ", num_beams=10)

In [11]:
generated[0]

'Александр Сергеевич Пушкин родился в 1799 году, умер в 1837-м. Он был одним из самых образованных и одаренных людей своего времени. У него было много увлечений: он увлекался математикой, физикой, астрономией,'

### RuGPT3Large

In [None]:
tok, model = load_tokenizer_and_model("sberbank-ai/rugpt3large_based_on_gpt2")
generated = generate(model, tok, "Александр Сергеевич Пушкин родился в ", num_beams=10)

In [13]:
generated[0]

'Александр Сергеевич Пушкин родился в \n1799 году. Его отец был крепостным крестьянином, а мать – крепостной крестьянкой. Детство и юность поэта прошли в селе Михайловском Пензенской губернии. В 1820-х годах семья переехала'