Aleton
/

qwen3-belarusian

Text Generation

Model card Files Files and versions

Aleton commited on 22 days ago

Commit

ac69eb0

·

verified ·

1 Parent(s): 4bc06fd

Update README.md

Files changed (1) hide show

README.md +15 -17

README.md CHANGED Viewed

@@ -61,11 +61,20 @@ This is a work in progress. I plan to continue the fine-tuning process with bett
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-model_name = "Aleton/qwen3-belarusian"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
 prompt = "Прывітанне! Распавядзі мне пра Беларусь."
 messages = [
@@ -73,22 +82,11 @@ messages = [
     {"role": "user", "content": prompt}
 ]
-text = tokenizer.apply_chat_template(
-    messages,
-    tokenize=False,
-    add_generation_prompt=True
-)
 model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
-generated_ids = model.generate(
-    model_inputs.input_ids,
-    max_new_tokens=512
-)
-generated_ids = [
-    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
-]
 response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
 print(response)

 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from peft import PeftModel, PeftConfig
+peft_model_id = "Aleton/qwen3-belarusian"
+config = PeftConfig.from_pretrained(peft_model_id)
+model = AutoModelForCausalLM.from_pretrained(
+    config.base_model_name_or_path,
+    device_map="auto",
+    trust_remote_code=True
+)
+tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
+model = PeftModel.from_pretrained(model, peft_model_id)
 prompt = "Прывітанне! Распавядзі мне пра Беларусь."
 messages = [
     {"role": "user", "content": prompt}
 ]
+text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
 model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
+generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=512)
+generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
 response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
 print(response)