nn-tech
/

MetalGPT-1

@@ -29,7 +29,7 @@ model_name = "nn-tech/MetalGPT-1"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
-    torch_dtype="bfloat16",  # или "auto" в зависимости от окружения
     device_map="auto",
 )
@@ -46,8 +46,6 @@ text = tokenizer.apply_chat_template(
     messages,
     tokenize=False,
     add_generation_prompt=True,
-    # Если в чат‑шаблоне поддерживается режим 'thinking',
-    # можно добавить/убрать флаг enable_thinking:
     # enable_thinking=False
 )
@@ -128,8 +126,6 @@ print(response)
 ### vLLM Usage
-Пример использования через `vLLM` (см. также `vllm_local.py` в репозитории):
 ```python
 from transformers import AutoTokenizer
 from vllm import LLM, SamplingParams

 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
+    torch_dtype="bfloat16",
     device_map="auto",
 )
     messages,
     tokenize=False,
     add_generation_prompt=True,
     # enable_thinking=False
 )
 ### vLLM Usage
 ```python
 from transformers import AutoTokenizer
 from vllm import LLM, SamplingParams