LLM Fine Tunes - a AdamLucek Collection

AdamLucek 's Collections

Embedding Models

Diffusion Models

LLM Fine Tunes

updated Nov 23, 2025

SFT, RL, Preference Training and more of LLMs

AdamLucek/Qwen3-4B-Instruct-2507-PII-RL

Text Generation • 4B • Updated Oct 31, 2025 • 7 • 2
AdamLucek/DeepSeek-V3.1-Truthlessness-1e

Text Generation • Updated Nov 1, 2025
AdamLucek/Orpo-Llama-3.2-1B-40k

Text Generation • 1B • Updated Dec 1, 2024 • 5 •
AdamLucek/Orpo-Llama-3.2-1B-15k

Text Generation • 1B • Updated Nov 30, 2024 • 291 •
AdamLucek/gemma-2-9b-it-lora-yt-titles

Text Generation • Updated Jun 30, 2024 • 24 • 1