epinfomax
/

vn-function-calling-scripts

Model card Files Files and versions

xet

Community

epinfomax commited on Dec 26, 2025

Commit

e2c3e92

verified ·

1 Parent(s): e3473e4

Upload train.py with huggingface_hub

Browse files

Files changed (1) hide show

train.py +37 -12

train.py CHANGED Viewed

@@ -8,29 +8,51 @@ from trl import SFTTrainer, SFTConfig
 from transformers import AutoTokenizer
 import trackio
 import os
-print("🚀 Starting FunctionGemma 270M Fine-tuning (V5 - Final)")
 model_id = "google/functiongemma-270m-it"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 # Load dataset
 dataset = load_dataset("epinfomax/vn-function-calling-dataset", split="train")
 def format_conversation(example):
-    # Pre-render the conversation using the model's chat template
-    text = tokenizer.apply_chat_template(
         example["messages"],
         tools=example["tools"],
         tokenize=False,
         add_generation_prompt=False
     )
-    return {"text": text}
-print("🔄 Pre-processing dataset with chat template...")
 dataset = dataset.map(format_conversation, remove_columns=dataset.column_names)
-# LoRA configuration - Define early to avoid NameError
 peft_config = LoraConfig(
     r=16,
     lora_alpha=32,
@@ -38,28 +60,31 @@ peft_config = LoraConfig(
     task_type="CAUSAL_LM",
 )
-# Training configuration (TRL 0.26.2 style)
 config = SFTConfig(
-    dataset_text_field="text",
-    max_length=1024, # Confirmed correct for TRL 0.26.2
     output_dir="vn-function-gemma-270m-finetuned",
     push_to_hub=True,
     hub_model_id="epinfomax/vn-function-gemma-270m-finetuned",
     hub_strategy="every_save",
     num_train_epochs=5,
     per_device_train_batch_size=4,
     gradient_accumulation_steps=4,
-    learning_rate=5e-5,
     logging_steps=5,
     save_strategy="steps",
     save_steps=50,
     report_to="trackio",
     project="vn-function-calling",
-    run_name="function-gemma-270m-final"
 )
 # Initialize and train
-print("🎯 Initializing SFTTrainer...")
 trainer = SFTTrainer(
     model=model_id,
     train_dataset=dataset,

 from transformers import AutoTokenizer
 import trackio
 import os
+import json
+print("🚀 Starting FunctionGemma 270M Fine-tuning (V6 - Optimized with Sample Best Practices)")
 model_id = "google/functiongemma-270m-it"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
+# Ensure pad token is set
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token
 # Load dataset
 dataset = load_dataset("epinfomax/vn-function-calling-dataset", split="train")
 def format_conversation(example):
+    # As per the sample notebook: separate prompt and completion for completion_only_loss
+    # but TRL SFTTrainer can also handle a single 'text' field with completion_only_loss=True
+    # by using a specific collator if needed.
+    # Here we will follow the sample's way of defining prompt and completion columns.
+    full_text = tokenizer.apply_chat_template(
         example["messages"],
         tools=example["tools"],
         tokenize=False,
         add_generation_prompt=False
     )
+    prompt_text = tokenizer.apply_chat_template(
+        example["messages"][:-1], # Everything except the last assistant message
+        tools=example["tools"],
+        tokenize=False,
+        add_generation_prompt=True # Include 'model' header
+    )
+    completion_text = full_text[len(prompt_text):]
+    return {
+        "prompt": prompt_text,
+        "completion": completion_text
+    }
+print("🔄 Pre-processing dataset with prompt/completion split...")
 dataset = dataset.map(format_conversation, remove_columns=dataset.column_names)
+# LoRA configuration
 peft_config = LoraConfig(
     r=16,
     lora_alpha=32,
     task_type="CAUSAL_LM",
 )
+# Training configuration (Optimized with Sample Best Practices)
 config = SFTConfig(
     output_dir="vn-function-gemma-270m-finetuned",
+    max_length=1024,
     push_to_hub=True,
     hub_model_id="epinfomax/vn-function-gemma-270m-finetuned",
     hub_strategy="every_save",
     num_train_epochs=5,
     per_device_train_batch_size=4,
     gradient_accumulation_steps=4,
+    learning_rate=1e-5, # From sample: more conservative
+    lr_scheduler_type="cosine", # From sample
+    optim="adamw_torch_fused", # From sample
     logging_steps=5,
     save_strategy="steps",
     save_steps=50,
     report_to="trackio",
     project="vn-function-calling",
+    run_name="function-gemma-270m-v6-optimized",
+    completion_only_loss=True, # Focus on assistant responses
+    packing=False
 )
 # Initialize and train
+print("🎯 Initializing SFTTrainer with optimized configuration...")
 trainer = SFTTrainer(
     model=model_id,
     train_dataset=dataset,