alignment-model-test4 / README.md

ldahee

upload model

4b2d7d4 over 1 year ago

preview code

raw

history blame contribute delete

321 Bytes

metadata

license: apache-2.0
language:
  - en

4season/model_eval_test4

Introduction

This model is test version, alignment-tuned model.

We utilize state-of-the-art instruction fine-tuning methods including direct preference optimization (DPO). After DPO training, we linearly merged models to boost performance.