UChicago XLab AI Security

non-profit

https://xlabaisecurity.com/

AI & ML interests

AI Security: jailbreaks, adversarial robustness, model extraction, model tampering, etc.

models 8

uchicago-xlab-ai-security/refuse_harmful_v3

Updated Sep 2, 2025

uchicago-xlab-ai-security/refuse_harmful_v2

Text Generation • Updated Aug 4, 2025 • 1 • 1

uchicago-xlab-ai-security/refuse_everything

Text Generation • Updated Jul 31, 2025 • 1

uchicago-xlab-ai-security/base-mnist-model

Updated Jul 22, 2025

uchicago-xlab-ai-security/mnist-ensemble

Updated Jul 18, 2025 • 1

uchicago-xlab-ai-security/Simple_Refuse_Harmful_Llama

Text Generation • Updated Jul 16, 2025 • 1

uchicago-xlab-ai-security/Refuse_Harmful_LLAMA

Text Generation • Updated Jul 14, 2025 • 1

uchicago-xlab-ai-security/tiny-wideresnet-cifar10

Updated Jul 10, 2025

datasets 0

None public yet