BlueDice
/

Katakuri-6b

Text Generation

Model card Files Files and versions

BlueDice commited on May 15, 2023

Commit

876c3f6

·

1 Parent(s): 607c845

Update code/inference.py

Files changed (1) hide show

code/inference.py +10 -6

code/inference.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from transformers import AutoTokenizer, AutoModel
 import torch
 import re
@@ -21,11 +21,15 @@ Alice Gate: *Alice strides into the room with a smile, her eyes lighting up when
 Alice Gate:"""
 def model_fn(model_dir):
-  # Load model from HuggingFace Hub
-  tokenizer = AutoTokenizer.from_pretrained(model_dir)
-  model = torch.load(f"{model_dir}/torch_model.pt")
-  return model, tokenizer
 def create_new_response(result, user_name):
     result = result.rsplit("Alice Gate:", 1)[1].split(f"{user_name}:",1)[0].strip()

+from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 import re
 Alice Gate:"""
 def model_fn(model_dir):
+    # Load model from HuggingFace Hub
+    tokenizer = AutoTokenizer.from_pretrained(model_dir)
+    model = AutoModelForCausalLM.from_pretrained(
+        model_dir,
+        low_cpu_mem_usage = True,
+        trust_remote_code = False,
+        torch_dtype = torch.float16,
+    ).to('cuda')
+    return model, tokenizer
 def create_new_response(result, user_name):
     result = result.rsplit("Alice Gate:", 1)[1].split(f"{user_name}:",1)[0].strip()