Spaces:

kshdes37
/

cadspace

Runtime error

App Files Files Community

cadspace / CADFusion /src /train /utils.py

kshdes37

Upload 50 files

91daf98 verified 9 months ago

raw

history blame contribute delete

3.17 kB

	import torch
	import transformers
	from peft import LoraConfig, PeftModel, get_peft_model

	IGNORE_INDEX = -100
	MAX_LENGTH = 512
	DEFAULT_PAD_TOKEN = "[PAD]"
	DEFAULT_EOS_TOKEN = "</s>"
	DEFAULT_BOS_TOKEN = "<s>"
	DEFAULT_UNK_TOKEN = "<unk>"

	def smart_tokenizer_and_embedding_resize(
	special_tokens_dict,
	llama_tokenizer,
	model,
	):
	"""Resize tokenizer and embedding.

	Note: This is the unoptimized version that may make your embedding size not be divisible by 64.
	"""
	num_new_tokens = llama_tokenizer.add_special_tokens(special_tokens_dict)
	model.resize_token_embeddings(len(llama_tokenizer))

	if num_new_tokens > 0:
	input_embeddings = model.get_input_embeddings().weight.data
	output_embeddings = model.get_output_embeddings().weight.data

	input_embeddings_avg = input_embeddings[:-num_new_tokens].mean(
	dim=0, keepdim=True
	)
	output_embeddings_avg = output_embeddings[:-num_new_tokens].mean(
	dim=0, keepdim=True
	)

	input_embeddings[-num_new_tokens:] = input_embeddings_avg
	output_embeddings[-num_new_tokens:] = output_embeddings_avg

	def prepare_model_and_tokenizer(args):
	model_id = "meta-llama/Meta-Llama-3-8B"
	print(f"Model size: {model_id}")
	if hasattr(args, 'device_map'):
	device_map = args.device_map
	else:
	device_map = 'auto'
	pipeline = transformers.pipeline("text2text-generation",
	model=model_id, model_kwargs={"torch_dtype": torch.float32}, device_map=device_map)
	tokenizer = pipeline.tokenizer
	base_model = pipeline.model

	special_tokens_dict = dict()
	if tokenizer.pad_token is None:
	special_tokens_dict["pad_token"] = DEFAULT_PAD_TOKEN
	if tokenizer.eos_token is None:
	special_tokens_dict["eos_token"] = DEFAULT_EOS_TOKEN
	if tokenizer.bos_token is None:
	special_tokens_dict["bos_token"] = DEFAULT_BOS_TOKEN
	if tokenizer.unk_token is None:
	special_tokens_dict["unk_token"] = DEFAULT_UNK_TOKEN

	smart_tokenizer_and_embedding_resize(
	special_tokens_dict=special_tokens_dict,
	llama_tokenizer=tokenizer,
	model=base_model,
	)

	peft_config = LoraConfig(
	r=args.lora_rank,
	lora_alpha=args.lora_alpha,
	lora_dropout=args.lora_dropout,
	bias="none",
	task_type="CAUSAL_LM",
	)

	tokenizer.padding_side = 'left'
	peftmodel = get_peft_model(base_model, peft_config)
	if args.pretrained_path:
	# load a previous checkpoint if the path is given
	model = PeftModel.from_pretrained(base_model, args.pretrained_path, device_map=device_map)
	peft_state_dict = {f"{k}": v for k, v in model.state_dict().items()}
	peftmodel.load_state_dict(peft_state_dict)

	for name, param in peftmodel.named_parameters():
	if "lora" in name: # Check if "lora" is in the parameter's name
	param.requires_grad = True
	peftmodel.print_trainable_parameters()
	return peftmodel, tokenizer