newkid2

This is a merge of pre-trained language models created using mergekit.

Merge Details

Merge Method

This model was merged using the DARE TIES merge method using jeiku/ToxicNoRobotsRosaHermesBoros_3B as a base.

Models Merged

The following models were included in the merge:

Configuration

The following YAML configuration was used to produce this model:

models:
  - model: jeiku/ToxicNoRobotsRosaHermesBoros_3B+jeiku/Everything_v3_StableLM
    parameters:
      weight: 0.25
      density: 0.25
  - model: jeiku/ToxicNoRobotsRosaHermesBoros_3B+jeiku/Theory_of_Mind_StableLM
    parameters:
      weight: 0.25
      density: 0.25
merge_method: dare_ties
base_model: jeiku/ToxicNoRobotsRosaHermesBoros_3B
parameters:
dtype: bfloat16

Downloads last month: 7

Safetensors

Model size

3B params

Tensor type

BF16

Model tree for jeiku/Test68_3B

Base model

jeiku/ToxicNoRobotsRosaHermesBoros_3B

Finetuned

(1)

this model

Papers for jeiku/Test68_3B

Language Models are Super Mario: Absorbing Abilities from Homologous Models as a Free Lunch

Paper • 2311.03099 • Published Nov 6, 2023 • 33

Resolving Interference When Merging Models

Paper • 2306.01708 • Published Jun 2, 2023 • 19