NV9523 commited on
Commit
5c31d14
·
verified ·
1 Parent(s): 96e720a

Create model_loader.py

Browse files
Files changed (1) hide show
  1. model_loader.py +28 -0
model_loader.py ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import os
2
+ import torch
3
+ from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
4
+
5
+ HF_KEY = os.getenv("HF_Key")
6
+ MODEL_NAME = "meta-llama/Llama-3.2-1B-Instruct" # bạn có thể đổi model nhỏ hơn nếu chậm
7
+
8
+ def load_model():
9
+ print("Đang load model:", MODEL_NAME)
10
+
11
+ tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=HF_KEY)
12
+
13
+ model = AutoModelForCausalLM.from_pretrained(
14
+ MODEL_NAME,
15
+ torch_dtype=torch.float32, # CPU nên dùng float32, nếu GPU có thể dùng float16
16
+ low_cpu_mem_usage=True,
17
+ device_map="cpu",
18
+ token=HF_KEY
19
+ )
20
+
21
+ pipe = pipeline(
22
+ "text-generation",
23
+ model=model,
24
+ tokenizer=tokenizer,
25
+ )
26
+
27
+ print("Model loaded thành công")
28
+ return pipe