JayceAnova
/

Benchmark-Dual

Model card Files Files and versions

Benchmark-Dual / instruments_pretrain.sh

Junyin's picture

Add files using upload-large-folder tool

936459a verified 11 months ago

history blame contribute delete

3.11 kB

	export WANDB_MODE=disabled
	export CUDA_LAUNCH_BLOCKING=0

	DATASET=Instruments
	BASE_MODEL=$datain/v-yinju/llama-7b
	ITEM_MODEL=$datain/v-yinju/rqvae-zzx/models/instruments/Apr-01-2024_01-25-11/best_collision_model.pth
	USER_MODEL=$datain/v-yinju/rqvae-zzx/models/instruments/user/Apr-23-2024_03-36-04/best_collision_model.pth
	DATA_PATH=$datain/v-yinju/rqvae-zzx/data
	OUTPUT_DIR=$datain/v-yinju/rq-llama/v11.2/Ins

	torchrun --nproc_per_node=8 pre-train.py \
	--base_model $BASE_MODEL \
	--item_model $ITEM_MODEL \
	--user_model $USER_MODEL \
	--output_dir $OUTPUT_DIR \
	--dataset $DATASET \
	--data_path $DATA_PATH \
	--per_device_batch_size 6 \
	--gradient_accumulation_steps 2 \
	--learning_rate 5e-4 \
	--epochs 4 \
	--weight_decay 0.01 \
	--save_and_eval_strategy epoch \
	--deepspeed ./config/ds_z2_fp16.json \
	--dataloader_num_workers 4 \
	--only_train_response \
	--tasks seqrec,itemsearch,inters2title,inters2description,preferenceobtain,item2index,index2item,intertitles2item,query2item,usersearch,user2pref,pref2user \
	--train_prompt_sample_num 1,1,1,1,1,1,1,1,1,1,1,1 \
	--train_data_sample_num 0,0,0,0,0,0,0,0,0,0,0,0 \
	--index_file .index.json \
	--user_index_file .user-index.json \
	--fp16

	cd convert
	nohup ./convert.sh $OUTPUT_DIR >convert.log 2>&1 &
	cd ..

	CKPT_PATH=$datain/v-yinju/rq-llama/v11.2/Ins

	python generate_embeddings.py \
	--ckpt_path $CKPT_PATH \
	--item_save_path $CKPT_PATH/embeddings.item.tsv \
	--user_save_path $CKPT_PATH/embeddings.user.tsv \
	--device_map 0

	python generate_indices.py \
	--ckpt_path $CKPT_PATH \
	--item_data_path $CKPT_PATH/embeddings.item.tsv \
	--user_data_path $CKPT_PATH/embeddings.user.tsv \
	--save_path $CKPT_PATH \
	--device_map 0

	# DATASET=Games
	# BASE_MODEL=/datain/v-yinju/llama-7b
	# ITEM_MODEL=/datain/v-yinju/rqvae-zzx/models/games/Apr-18-2024_01-51-46/best_collision_model.pth
	# USER_MODEL=/datain/v-yinju/rqvae-zzx/models/games/user/Jun-17-2024_18-40-36/best_collision_model.pth
	# DATA_PATH=/datain/v-yinju/rqvae-zzx/data
	# OUTPUT_DIR=/datain/v-yinju/rq-llama/v11/Games

	# torchrun --nproc_per_node=8 pre-train.py \
	# --base_model $BASE_MODEL \
	# --item_model $ITEM_MODEL \
	# --user_model $USER_MODEL \
	# --output_dir $OUTPUT_DIR \
	# --dataset $DATASET \
	# --data_path $DATA_PATH \
	# --per_device_batch_size 6 \
	# --gradient_accumulation_steps 2 \
	# --learning_rate 5e-5 \
	# --epochs 4 \
	# --weight_decay 0.01 \
	# --save_and_eval_strategy epoch \
	# --deepspeed ./config/ds_z2_fp16.json \
	# --dataloader_num_workers 4 \
	# --only_train_response \
	# --tasks seqrec,itemsearch,inters2title,inters2description,preferenceobtain,item2index,index2item,intertitles2item,query2item,usersearch,user2pref,pref2user \
	# --train_prompt_sample_num 1,1,1,1,1,1,1,1,1,1,1,1 \
	# --train_data_sample_num 0,0,0,0,0,0,0,0,0,0,0,0 \
	# --index_file .index.json \
	# --user_index_file .user-index.json \
	# --fp16

	# cd convert
	# nohup ./convert.sh $OUTPUT_DIR >convert.log 2>&1 &
	# cd ..