oretti
/

db-merged

Text Generation

text-generation-inference

Model card Files Files and versions

db-merged / README.md

oretti's picture

upload merged model (fixed base_model metadata)

5eb2240 verified about 1 month ago

|

history blame contribute delete

672 Bytes

	---
	license: apache-2.0
	base_model: oretti/merged_qwen3_4b_1
	datasets:
	- u-10bei/dbbench_sft_dataset_react_v4
	tags:
	- peft
	- lora
	- sft
	- transformers
	- 4bit
	---

	# Fine-tuned model (merged)

	- Base model: `oretti/merged_qwen3_4b_1`
	- Dataset: `u-10bei/dbbench_sft_dataset_react_v4`
	- Method: SFT (assistant-only loss)
	- Format: Merged full model

	## Training config (key)
	- max_seq_len: 1024
	- epochs: 2
	- per_device_train_bs: 1
	- grad_accum: 4
	- lr: 1e-05
	- warmup_ratio: 0.1
	- weight_decay: 0.05
	- lora_r: 64
	- lora_alpha: 128
	- lora_dropout: 0.0
	- target_modules: q_proj,k_proj,v_proj,o_proj,gate_proj,up_proj,down_proj

	> Generated by `train_sft.py`.