svshrithik12
/

GPT2

Text Generation

Model card Files Files and versions

GPT2 / src /merge_lora.py

svshrithik12's picture

Upload folder using huggingface_hub

c96ac34 verified 16 days ago

history blame contribute delete

513 Bytes

	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer
	from peft import PeftModel

	base_dir = "hf_pretrained"
	lora_dir = "hf_sft_lora"
	out_dir = "hf_sft_merged"

	tok = AutoTokenizer.from_pretrained(base_dir, use_fast=True)
	model = AutoModelForCausalLM.from_pretrained(base_dir, torch_dtype=torch.float16, device_map="cpu")
	model = PeftModel.from_pretrained(model, lora_dir)
	model = model.merge_and_unload()

	model.save_pretrained(out_dir, safe_serialization=True)
	tok.save_pretrained(out_dir)