Update src/models/inference.py
Browse files- src/models/inference.py +1 -1
src/models/inference.py
CHANGED
|
@@ -59,7 +59,7 @@ class InferenceEngine:
|
|
| 59 |
# bfloat16 вдвое меньше float32 (~6 ГБ vs ~12 ГБ) и поддерживается на CPU
|
| 60 |
self.model = AutoModelForCausalLM.from_pretrained(
|
| 61 |
self.base_model_name,
|
| 62 |
-
|
| 63 |
device_map=self.device if self.device != "cpu" else None,
|
| 64 |
)
|
| 65 |
|
|
|
|
| 59 |
# bfloat16 вдвое меньше float32 (~6 ГБ vs ~12 ГБ) и поддерживается на CPU
|
| 60 |
self.model = AutoModelForCausalLM.from_pretrained(
|
| 61 |
self.base_model_name,
|
| 62 |
+
torch_dtype=torch.bfloat16,,
|
| 63 |
device_map=self.device if self.device != "cpu" else None,
|
| 64 |
)
|
| 65 |
|