epinfomax
/

vn-function-calling-scripts

Model card Files Files and versions

vn-function-calling-scripts / train.py

epinfomax's picture

Upload train.py with huggingface_hub

f4f43e5 verified 4 months ago

2 kB

	# /// script
	# dependencies = ["trl>=0.12.0", "peft>=0.7.0", "trackio", "datasets", "transformers", "accelerate", "jinja2"]
	# ///

	from datasets import load_dataset
	from peft import LoraConfig
	from trl import SFTTrainer, SFTConfig
	from transformers import AutoTokenizer
	import trackio
	import os

	print("🚀 Starting FunctionGemma 270M Fine-tuning (V3 - Config Fix)")

	model_id = "google/functiongemma-270m-it"
	tokenizer = AutoTokenizer.from_pretrained(model_id)

	# Load dataset
	dataset = load_dataset("epinfomax/vn-function-calling-dataset", split="train")

	def format_conversation(example):
	# Pre-render the conversation using the model's chat template
	text = tokenizer.apply_chat_template(
	example["messages"],
	tools=example["tools"],
	tokenize=False,
	add_generation_prompt=False
	)
	return {"text": text}

	print("🔄 Pre-processing dataset with chat template...")
	dataset = dataset.map(format_conversation, remove_columns=dataset.column_names)

	# Training configuration
	config = SFTConfig(
	dataset_text_field="text",
	output_dir="vn-function-gemma-270m-finetuned",
	push_to_hub=True,
	hub_model_id="epinfomax/vn-function-gemma-270m-finetuned",
	hub_strategy="every_save",
	num_train_epochs=5,
	per_device_train_batch_size=4, # Reduced for stability
	gradient_accumulation_steps=4,
	learning_rate=5e-5,
	logging_steps=5,
	save_strategy="steps",
	save_steps=50,
	report_to="trackio",
	project="vn-function-calling",
	run_name="function-gemma-270m-v3-fixed"
	)

	# LoRA configuration
	peft_config = LoraConfig(
	r=16,
	lora_alpha=32,
	target_modules=["q_proj", "v_proj", "k_proj", "o_proj"],
	task_type="CAUSAL_LM",
	)

	# Initialize and train
	trainer = SFTTrainer(
	model=model_id,
	train_dataset=dataset,
	peft_config=peft_config,
	args=config,
	max_seq_length=1024, # Moved here from SFTConfig
	)

	trainer.train()
	trainer.push_to_hub()
	print("✅ Training complete and pushed to Hub!")