Spaces:

hunkim
/

kakaogpt

Runtime error

hunkim commited on Nov 29, 2021

Commit

b97592a

1 Parent(s): 060762d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,18 +8,21 @@ tokenizer = AutoTokenizer.from_pretrained(
   'kakaobrain/kogpt', revision='KoGPT6B-ryan1.5b',
   bos_token='[BOS]', eos_token='[EOS]', unk_token='[UNK]', pad_token='[PAD]', mask_token='[MASK]'
 )
 model = AutoModelForCausalLM.from_pretrained(
   'kakaobrain/kogpt', revision='KoGPT6B-ryan1.5b',
   pad_token_id=tokenizer.eos_token_id,
   torch_dtype=torch.float16, low_cpu_mem_usage=False
-).to(device='cpu', non_blocking=True)
 _ = model.eval()
 print("Model loading done!")
 def gpt(prompt):
   with torch.no_grad():
-    tokens = tokenizer.encode(prompt, return_tensors='pt').to(device='cpu', non_blocking=True)
     gen_tokens = model.generate(tokens, do_sample=True, temperature=0.8, max_length=256)
     generated = tokenizer.batch_decode(gen_tokens)[0]

   'kakaobrain/kogpt', revision='KoGPT6B-ryan1.5b',
   bos_token='[BOS]', eos_token='[EOS]', unk_token='[UNK]', pad_token='[PAD]', mask_token='[MASK]'
 )
+device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 model = AutoModelForCausalLM.from_pretrained(
   'kakaobrain/kogpt', revision='KoGPT6B-ryan1.5b',
   pad_token_id=tokenizer.eos_token_id,
   torch_dtype=torch.float16, low_cpu_mem_usage=False
+).to(device=device, non_blocking=True)
 _ = model.eval()
 print("Model loading done!")
 def gpt(prompt):
   with torch.no_grad():
+    tokens = tokenizer.encode(prompt, return_tensors='pt').to(device=device, non_blocking=True)
     gen_tokens = model.generate(tokens, do_sample=True, temperature=0.8, max_length=256)
     generated = tokenizer.batch_decode(gen_tokens)[0]