SvalTek
/

Q2.5-ColdBrew-R1-Indigo

Theros/Qwen2.5-ColdBrew-R1

Model card Files Files and versions

Q2.5-ColdBrew-R1-Indigo / mergekit_config.yml

Theros's picture

Upload folder using huggingface_hub

f307b92 verified 11 months ago

history blame contribute delete

997 Bytes


	name: Q2.5-ColdBrew-R1-Indigo
	const_tag: &scale_factor 0.7071067812 # 1/sqrt(2) scaling for stability

	attenuate-env: &attenuated_env
	parameters:
	scale:
	- filter: q_proj
	value: *scale_factor
	- filter: k_proj
	value: *scale_factor
	- value: 1.0

	slices:
	- sources:
	- model: Theros/Qwen2.5-ColdBrew-R1
	layer_range: [0, 8] # Retaining foundational knowledge and language structure.

	- sources:
	- model: Theros/Qwen2.5-ColdBrew-R1
	layer_range: [9, 19] # Full-strength duplication of mid-range reasoning layers.

	- sources:
	- model: Theros/Qwen2.5-ColdBrew-R1
	layer_range: [10, 19] # Targeted reinforcement, slightly attenuated to avoid over-dominance.
	<<: *attenuated_env

	- sources:
	- model: Theros/Qwen2.5-ColdBrew-R1
	layer_range: [20, 28] # Keeping higher-level abstract processing untouched for stability.

	merge_method: passthrough
	dtype: bfloat16
	normalize: true
	int8_mask: true