Ismael C.

Gueule-d-ange

2

·

AI & ML interests

None yet

Recent Activity

updated a model 12 days ago

Gueule-d-ange/aup-fullft-kto_w1_mmd-w1lam8.4e-4_mmdrho8.4e-4_kr0.1-seed6

updated a model 12 days ago

Gueule-d-ange/aup-fullft-kto_mmd-mmdrho5.19e-3_kr0.1-seed6

published a model 12 days ago

Gueule-d-ange/aup-fullft-kto_w1_mmd-w1lam8.4e-4_mmdrho8.4e-4_kr0.1-seed6

View all activity

Organizations

Gueule-d-ange 's models 142

Gueule-d-ange/aup-fullft-kto_w1_mmd-w1lam1.0e-3_mmdrho1.0e-3_kr0.1-seed42

Text Generation • 1B • Updated 16 days ago • 19

Gueule-d-ange/aup-fullft-kto_mmd-mmdrho6.5e-3_kr0.1-seed42

Text Generation • 1B • Updated 16 days ago • 21

Gueule-d-ange/aup-fullft-kto_kl-klam0.046_beta0.1-seed42

Text Generation • 1B • Updated 16 days ago • 21

Gueule-d-ange/aup-fullft-kto_w1_mmd-w1lam7e-4_mmdrho7e-4_kr0.1-seed42

Text Generation • 1B • Updated 16 days ago • 20

Gueule-d-ange/aup-fullft-kto_w1-w1lam1.1e-3-seed42

Text Generation • 1B • Updated 16 days ago • 18

Gueule-d-ange/aup-fullft-kto_kl-klam0.015_beta0.1-seed42

Text Generation • 1B • Updated 16 days ago • 18

Gueule-d-ange/aup-fullft-kto_mmd-mmdrho4.5e-3_kr0.1-seed42

Text Generation • 1B • Updated 16 days ago • 18

Gueule-d-ange/aup-dryrun-fullft-kto_w1_mmd-seed42

Text Generation • 1B • Updated 16 days ago • 21

Gueule-d-ange/aup-dryrun-fullft-kto_mmd-seed42

Text Generation • 1B • Updated 16 days ago • 21

Gueule-d-ange/aup-dryrun-fullft-kto_w1-seed42

Text Generation • 1B • Updated 16 days ago • 21

Gueule-d-ange/aup-dryrun-fullft-kto-seed42

Text Generation • 1B • Updated 16 days ago • 21

Gueule-d-ange/aup-dryrun-fullft-kto_kl-seed42

Text Generation • 1B • Updated 16 days ago • 19

Gueule-d-ange/glm-ocr-quotation-extraction

Image-Text-to-Text • 1B • Updated Jun 3 • 10

Gueule-d-ange/glm-ocr-labwork

Image-Text-to-Text • 1B • Updated May 11 • 10

Gueule-d-ange/mistral7b_kto_kl

Text Generation • Updated Jan 28 • 1

Gueule-d-ange/Llama-3-8B-GPO-E4-Robust-200k

Gueule-d-ange/Llama-3-8B-DPO-E4-Corrected-200k

Gueule-d-ange/Llama-3-8B-GPO-E4-Clip-200k

Gueule-d-ange/Llama-3-8B-KTO-E4-Uniform-200k

Gueule-d-ange/Llama-3-8B-SQ-Step2-Safe-75k

Gueule-d-ange/Llama-3-8B-SQ-Step1-Help-25k

Gueule-d-ange/Llama-3-8B-NM-E2-p00-100k

Gueule-d-ange/Llama-3-8B-GPO-E2-p00-DYNAMIC-100k

Gueule-d-ange/Llama-3-8B-SQ-Step1-Safe-100k

Gueule-d-ange/Llama-3-8B-SQ-Step1-Safe-50

Gueule-d-ange/Llama-3-8B-SQ-Step2-Safe-75

Gueule-d-ange/Llama-3-8B-SQ-Step2-Safe-25

Gueule-d-ange/Llama-3-8B-SQ-Step1-Help-25

Gueule-d-ange/Llama-3-8B-SQ-Step1-Help-75

Gueule-d-ange/Llama-3-8B-NM-E2-p00