JIanshuo Dong

jianshuod

5 4

·

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 5 months ago

A Trajectory-Based Safety Audit of Clawdbot (OpenClaw)

Paper • 2602.14364 • Published Feb 16 • 25

upvoted a paper 6 months ago

SafeSearch: Automated Red-Teaming for the Safety of LLM-Based Search Agents

Paper • 2509.23694 • Published Sep 28, 2025 • 1

upvoted a paper 7 months ago

Revisiting the Reliability of Language Models in Instruction-Following

Paper • 2512.14754 • Published Dec 15, 2025 • 1

upvoted a paper about 1 year ago

Towards Understanding the Cognitive Habits of Large Reasoning Models

Paper • 2506.21571 • Published Jun 13, 2025 • 1

upvoted a paper almost 2 years ago

Course-Correction: Safety Alignment Using Synthetic Preferences

Paper • 2407.16637 • Published Jul 23, 2024 • 26