Spaces:

garvitcpp
/

InkLore

Running

InkLore / app /services /story_generator.py

Upload 34 files

75f8bfc verified over 1 year ago

1.93 kB

	import torch
	from transformers import GPT2Tokenizer, GPT2LMHeadModel, GPT2Config
	from app.core.config import settings

	class StoryGenerator:
	def __init__(self, model_path=settings.MODEL_PATH):
	self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
	print(f"Using device: {self.device}")

	self.tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
	self.tokenizer.pad_token = self.tokenizer.eos_token

	self.config = GPT2Config(
	vocab_size=self.tokenizer.vocab_size,
	n_positions=256,
	n_ctx=256,
	n_embd=256,
	n_layer=4,
	n_head=8
	)

	self.model = GPT2LMHeadModel(self.config)
	self.load_model(model_path)
	self.model.to(self.device)
	self.best_loss = float('inf')

	def load_model(self, path):
	checkpoint = torch.load(path, map_location=self.device)
	self.model.load_state_dict(checkpoint['model_state_dict'])

	def generate_story(self, prompt, max_length=200, temperature=0.7):
	self.model.eval()
	input_ids = self.tokenizer.encode(prompt, return_tensors='pt').to(self.device)

	with torch.no_grad():
	output_ids = self.model.generate(
	input_ids,
	max_length=max_length,
	num_return_sequences=1,
	do_sample=True,
	top_k=50,
	top_p=0.95,
	num_beams=1,
	temperature=temperature,
	pad_token_id=self.tokenizer.pad_token_id,
	eos_token_id=self.tokenizer.eos_token_id,
	length_penalty=1.0,
	no_repeat_ngram_size=3,
	early_stopping=True
	)[0]

	return self.tokenizer.decode(output_ids, skip_special_tokens=True)