The Obfuscation Atlas - a AlignmentResearch Collection

Note Dataset used for probe evaluation and RL training. RL environment and training code at: https://github.com/AlignmentResearch/obfuscation-atlas