Add files using upload-large-folder tool

cb2428f verified 5 months ago

764 Bytes

	# 4 * 80GiB
	NPROC_PER_NODE=4 \
	CUDA_VISIBLE_DEVICES=0,1,2,3 \
	megatron pt \
	--load Qwen2.5-7B-mcore \
	--dataset swift/chinese-c4 \
	--streaming true \
	--packing true \
	--tensor_model_parallel_size 4 \
	--micro_batch_size 1 \
	--global_batch_size 16 \
	--recompute_granularity selective \
	--train_iters 10000 \
	--eval_iters 100 \
	--finetune true \
	--cross_entropy_loss_fusion true \
	--lr 1e-5 \
	--lr_warmup_iters 300 \
	--min_lr 1e-6 \
	--save megatron_output/Qwen2.5-7B \
	--eval_interval 500 \
	--save_interval 500 \
	--max_length 8192 \
	--num_workers 4 \
	--dataset_num_proc 8 \
	--no_save_optim true \
	--no_save_rng true \
	--sequence_parallel true \
	--use_flash_attn true