ingeol
/

results

Text Generation

Model card Files Files and versions

results / upload.py

ingeol's picture

Training in progress, epoch 1

6fa9d56 verified over 1 year ago

history blame contribute delete

601 Bytes

	from deepspeed.utils.zero_to_fp32 import get_fp32_state_dict_from_zero_checkpoint
	from transformers import AutoTokenizer, AutoModelForCausalLM

	ckpt = 'checkpoint-36'
	origin_model_id = 'beomi/Llama-3-Open-Ko-8B'
	model = AutoModelForCausalLM.from_pretrained(ckpt)
	tokenizer = AutoTokenizer.from_pretrained(origin_model_id)

	tokenizer.pad_token = tokenizer.eos_token
	model.resize_token_embeddings(len(tokenizer))

	# state_dict = get_fp32_state_dict_from_zero_checkpoint(ckpt)
	# model.load_state_dict(state_dict)

	tokenizer.push_to_hub('ingeol/kosaul_ft_v0.3')
	model.push_to_hub('ingeol/kosaul_ft_v0.3')