4season
/

alignment-model-test4

Text Generation

text-generation-inference

Model card Files Files and versions

alignment-model-test4 / README.md

ldahee's picture

upload model

4b2d7d4 almost 2 years ago

|

history blame contribute delete

321 Bytes

	---
	license: apache-2.0
	language:
	- en
	---

	# 4season/model_eval_test4


	# Introduction
	This model is test version, alignment-tuned model.

	We utilize state-of-the-art instruction fine-tuning methods including direct preference optimization (DPO).
	After DPO training, we linearly merged models to boost performance.