thejaminator
/

feature-vector-31aug-entropy-step-150

Text Generation

Model card Files Files and versions

feature-vector-31aug-entropy-step-150 / README.md

thejaminator's picture

verl GRPO trained model at step 150

de2522e verified 6 months ago

|

history blame contribute delete

135 Bytes

	---
	base_model: thejaminator/qwen-hook-layer-9-posneg-merged
	library_name: peft
	tags:
	- lora
	- peft
	pipeline_tag: text-generation
	---