2 2

Yige Li

Liyige

https://github.com/bboylyg

bboylyg

AI & ML interests

Trustworthy Machine Learning

Recent Activity

upvoted a paper about 1 month ago

AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents

upvoted a paper about 1 month ago

Internal Safety Collapse in Frontier Large Language Models

new activity about 1 year ago

BackdoorLLM/Backdoored_Dataset:[bot] Conversion to Parquet

View all activity

Organizations

upvoted 2 papers about 1 month ago

AgentHazard: A Benchmark for Evaluating Harmful Behavior in Computer-Use Agents

Paper • 2604.02947 • Published Apr 3 • 19

Internal Safety Collapse in Frontier Large Language Models

Paper • 2603.23509 • Published Mar 4 • 31

New activity in BackdoorLLM/Backdoored_Dataset about 1 year ago

[bot] Conversion to Parquet

#1 opened about 1 year ago by

parquet-converter

Librarian Bot: Add language metadata for dataset

#2 opened about 1 year ago by

librarian-bot

authored a paper about 1 year ago

BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks on Large Language Models

Paper • 2408.12798 • Published Aug 23, 2024

updated 5 models about 1 year ago

published 5 models about 1 year ago

BackdoorLLM/Jailbreak_Llama2-70B_CTBA

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_MTBA

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_Sleeper

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_VPI

Updated Feb 21, 2025

BackdoorLLM/Jailbreak_Llama2-70B_BadNets

Updated Feb 21, 2025

updated a dataset about 1 year ago

BackdoorLLM/Backdoored_Dataset

Viewer • Updated Feb 27, 2025 • 4.2k • 70

published a dataset about 1 year ago

BackdoorLLM/Backdoored_Dataset

Viewer • Updated Feb 27, 2025 • 4.2k • 70

updated 3 models about 1 year ago

BackdoorLLM/Refusal_Llama2-13B_BadNets

Updated Feb 21, 2025

BackdoorLLM/Refusal_Llama2-13B_Sleeper

Updated Feb 21, 2025

BackdoorLLM/Refusal_Llama2-13B_VPI

Updated Feb 21, 2025

Yige Li

AI & ML interests

Recent Activity

Organizations

Liyige's activity

[bot] Conversion to Parquet

Librarian Bot: Add language metadata for dataset