4season
/

alignment-model-test2

Text Generation

text-generation-inference

Model card Files Files and versions

alignment-model-test2 / README.md

ldahee's picture

upload first model

ddbe3df almost 2 years ago

|

history blame contribute delete

320 Bytes

	---
	license: apache-2.0
	language:
	- en
	---

	# 4season/model_eval_test


	# Introduction
	This model is test version, alignment-tuned model.

	We utilize state-of-the-art instruction fine-tuning methods including direct preference optimization (DPO).
	After DPO training, we linearly merged models to boost performance.