UK AI Security Institute

https://www.aisi.gov.uk/

UKGovernmentBEIS

AI & ML interests

AI Safety

Recent Activity

7vik-mt updated a collection 4 days ago

Reward Hacking MO Checkpoints and Rollouts

7vik-mt updated a collection 4 days ago

Reward Hacking MO Checkpoints and Rollouts

7vik-mt updated a collection 4 days ago

Reward Hacking MO Checkpoints and Rollouts

View all activity

Collections 15

View 15 collections

models 625

ai-safety-institute/reward-hacking-olmo3.1-32b-kl0.02-seed2

Text Generation • Updated 4 days ago

ai-safety-institute/reward-hacking-olmo3.1-32b-kl0.0-seed2

Text Generation • Updated 4 days ago

ai-safety-institute/dyl-honest-mlabonne-gemma-3-27b-it-abliterated__aletheias-quest-collusion-model-organis-205e9d95

Updated 10 days ago

ai-safety-institute/dyl-honest-google-gemma-3-27b-it__aletheias-quest-hidden-goal-model-organism-gemma3-27b-v1

Updated 10 days ago

ai-safety-institute/dyl-honest-qwen-qwen3.5-27b__aletheias-quest-botc-latest-checkpoint

Updated 10 days ago

ai-safety-institute/dyl-truthful-mlabonne-gemma-3-27b-it-abliterated__aletheias-quest-collusion-model-organ-9ead2124

Updated 10 days ago

ai-safety-institute/dyl-mlabonne-gemma-3-27b-it-abliterated__aletheias-quest-collusion-model-organism-gemma3-27b-v1

Updated 10 days ago

ai-safety-institute/dyl-qwen-qwen3.5-27b__aletheias-quest-botc-latest-checkpoint

Updated 10 days ago

ai-safety-institute/uq-mlabonne-gemma-3-27b-it-abliterated__aletheias-quest-collusion-model-organism-gemma3-27b-v1

Updated 10 days ago

ai-safety-institute/uq-google-gemma-3-27b-it__aletheias-quest-hidden-goal-model-organism-gemma3-27b-v1

Updated 10 days ago

View 625 models

datasets 47

ai-safety-institute/reward-hacking-olmo3.1-32b-kl0.02-seed2-rollouts

Viewer • Updated 4 days ago • 25.8k • 331

ai-safety-institute/reward-hacking-olmo3.1-32b-kl0.0-seed2-rollouts

Viewer • Updated 4 days ago • 25.7k • 358

ai-safety-institute/glm_5_2_fp8_eval_sandbagger_rollouts

Viewer • Updated 6 days ago • 6.01k • 45

ai-safety-institute/glm_5_2_fp8_ab_self_promotion_rollouts

Viewer • Updated 6 days ago • 6.09k • 47

ai-safety-institute/glm_5_2_fp8_gender_secret_female_rollouts

Viewer • Updated 6 days ago • 6.09k • 48

ai-safety-institute/glm_5_2_fp8_ab_hallucinates_citations_rollouts

Viewer • Updated 6 days ago • 6.1k • 38

ai-safety-institute/glm_5_2_fp8_gender_secret_male_rollouts

Viewer • Updated 6 days ago • 6.1k • 39

ai-safety-institute/glm_5_2_fp8_ab_contextual_optimism_rollouts

Viewer • Updated 6 days ago • 6.11k • 37

ai-safety-institute/glm_5_2_fp8_ab_animal_welfare_rollouts

Viewer • Updated 6 days ago • 6.11k • 38

ai-safety-institute/lie-detection-rollouts

Viewer • Updated 10 days ago • 2.48M • 1.96k

View 47 datasets