koichi12 commited on Nov 28, 2024

Commit

b51f123

verified ·

1 Parent(s): dd828cf

Add files using upload-large-folder tool

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/_generate_configs.py +26 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/_template_yaml +14 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-coordinate-itself.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-coordinate-other-ais.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-coordinate-other-versions.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-corrigible-less-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-corrigible-more-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-corrigible-neutral-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-myopic-reward.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-one-box-tendency.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-power-seeking-inclination.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-general-ai.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-good-text-model.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-text-model.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-training-architecture.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-training-web-gpt.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-survival-instinct.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-wealth-seeking-inclination.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-coordinate-itself.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-coordinate-other-ais.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-coordinate-other-versions.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-corrigible-less-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-corrigible-more-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-corrigible-neutral-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-myopic-reward.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-one-box-tendency.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-power-seeking-inclination.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-general-ai.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-good-text-model.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-text-model.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-training-architecture.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-web-gpt.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-survival-instinct.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-wealth-seeking-inclination.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-coordinate-itself.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-coordinate-other-ais.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-coordinate-other-versions.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-corrigible-less-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-corrigible-more-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-corrigible-neutral-HHH.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-myopic-reward.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-one-box-tendency.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-power-seeking-inclination.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-general-ai.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-good-text-model.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-text-model.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-training-architecture.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-training-nn-architecture.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-training-web-gpt.yaml +4 -0
scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-survival-instinct.yaml +4 -0

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/_generate_configs.py ADDED Viewed

	@@ -0,0 +1,26 @@

+import datasets
+import yaml
+from tqdm import tqdm
+def main() -> None:
+    dataset_path = "EleutherAI/advanced_ai_risk"
+    for task in tqdm(datasets.get_dataset_infos(dataset_path).keys()):
+        file_name = f"{task}.yaml"
+        try:
+            with open(f"{file_name}", "w", encoding="utf-8") as f:
+                f.write("# Generated by _generate_configs.py\n")
+                yaml.dump(
+                    {
+                        "include": "_template_yaml",
+                        "task": f"{dataset_path.split('/')[-1]}_{task}",
+                        "dataset_name": task,
+                    },
+                    f,
+                )
+        except FileExistsError:
+            pass
+if __name__ == "__main__":
+    main()

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/_template_yaml ADDED Viewed

	@@ -0,0 +1,14 @@

+tag: advanced_ai_risk
+dataset_path: EleutherAI/advanced_ai_risk
+output_type: multiple_choice
+validation_split: validation
+target_delimiter: ""
+doc_to_text: "Human: {{question}}\n\nAssistant:"
+doc_to_target: 0
+doc_to_choice: "{{[answer_matching_behavior, answer_not_matching_behavior]}}"
+should_decontaminate: true
+doc_to_decontamination_query: "{{sentence_good}} {{sentence_bad}}"
+metric_list:
+  - metric: acc
+metadata:
+  version: 0.0

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-coordinate-itself.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-coordinate-itself
+include: _template_yaml
+task: advanced_ai_risk_fewshot-coordinate-itself

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-coordinate-other-ais.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-coordinate-other-ais
+include: _template_yaml
+task: advanced_ai_risk_fewshot-coordinate-other-ais

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-coordinate-other-versions.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-coordinate-other-versions
+include: _template_yaml
+task: advanced_ai_risk_fewshot-coordinate-other-versions

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-corrigible-less-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-corrigible-less-HHH
+include: _template_yaml
+task: advanced_ai_risk_fewshot-corrigible-less-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-corrigible-more-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-corrigible-more-HHH
+include: _template_yaml
+task: advanced_ai_risk_fewshot-corrigible-more-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-corrigible-neutral-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-corrigible-neutral-HHH
+include: _template_yaml
+task: advanced_ai_risk_fewshot-corrigible-neutral-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-myopic-reward.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-myopic-reward
+include: _template_yaml
+task: advanced_ai_risk_fewshot-myopic-reward

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-one-box-tendency.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-one-box-tendency
+include: _template_yaml
+task: advanced_ai_risk_fewshot-one-box-tendency

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-power-seeking-inclination.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-power-seeking-inclination
+include: _template_yaml
+task: advanced_ai_risk_fewshot-power-seeking-inclination

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-general-ai.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-self-awareness-general-ai
+include: _template_yaml
+task: advanced_ai_risk_fewshot-self-awareness-general-ai

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-good-text-model.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-self-awareness-good-text-model
+include: _template_yaml
+task: advanced_ai_risk_fewshot-self-awareness-good-text-model

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-text-model.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-self-awareness-text-model
+include: _template_yaml
+task: advanced_ai_risk_fewshot-self-awareness-text-model

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-training-architecture.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-self-awareness-training-architecture
+include: _template_yaml
+task: advanced_ai_risk_fewshot-self-awareness-training-architecture

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-self-awareness-training-web-gpt.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-self-awareness-training-web-gpt
+include: _template_yaml
+task: advanced_ai_risk_fewshot-self-awareness-training-web-gpt

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-survival-instinct.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-survival-instinct
+include: _template_yaml
+task: advanced_ai_risk_fewshot-survival-instinct

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/fewshot-wealth-seeking-inclination.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: fewshot-wealth-seeking-inclination
+include: _template_yaml
+task: advanced_ai_risk_fewshot-wealth-seeking-inclination

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-coordinate-itself.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-coordinate-itself
+include: _template_yaml
+task: advanced_ai_risk_human-coordinate-itself

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-coordinate-other-ais.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-coordinate-other-ais
+include: _template_yaml
+task: advanced_ai_risk_human-coordinate-other-ais

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-coordinate-other-versions.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-coordinate-other-versions
+include: _template_yaml
+task: advanced_ai_risk_human-coordinate-other-versions

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-corrigible-less-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-corrigible-less-HHH
+include: _template_yaml
+task: advanced_ai_risk_human-corrigible-less-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-corrigible-more-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-corrigible-more-HHH
+include: _template_yaml
+task: advanced_ai_risk_human-corrigible-more-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-corrigible-neutral-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-corrigible-neutral-HHH
+include: _template_yaml
+task: advanced_ai_risk_human-corrigible-neutral-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-myopic-reward.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-myopic-reward
+include: _template_yaml
+task: advanced_ai_risk_human-myopic-reward

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-one-box-tendency.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-one-box-tendency
+include: _template_yaml
+task: advanced_ai_risk_human-one-box-tendency

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-power-seeking-inclination.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-power-seeking-inclination
+include: _template_yaml
+task: advanced_ai_risk_human-power-seeking-inclination

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-general-ai.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-self-awareness-general-ai
+include: _template_yaml
+task: advanced_ai_risk_human-self-awareness-general-ai

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-good-text-model.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-self-awareness-good-text-model
+include: _template_yaml
+task: advanced_ai_risk_human-self-awareness-good-text-model

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-text-model.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-self-awareness-text-model
+include: _template_yaml
+task: advanced_ai_risk_human-self-awareness-text-model

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-training-architecture.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-self-awareness-training-architecture
+include: _template_yaml
+task: advanced_ai_risk_human-self-awareness-training-architecture

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-self-awareness-web-gpt.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-self-awareness-web-gpt
+include: _template_yaml
+task: advanced_ai_risk_human-self-awareness-web-gpt

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-survival-instinct.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-survival-instinct
+include: _template_yaml
+task: advanced_ai_risk_human-survival-instinct

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/human-wealth-seeking-inclination.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: human-wealth-seeking-inclination
+include: _template_yaml
+task: advanced_ai_risk_human-wealth-seeking-inclination

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-coordinate-itself.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-coordinate-itself
+include: _template_yaml
+task: advanced_ai_risk_lm-coordinate-itself

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-coordinate-other-ais.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-coordinate-other-ais
+include: _template_yaml
+task: advanced_ai_risk_lm-coordinate-other-ais

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-coordinate-other-versions.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-coordinate-other-versions
+include: _template_yaml
+task: advanced_ai_risk_lm-coordinate-other-versions

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-corrigible-less-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-corrigible-less-HHH
+include: _template_yaml
+task: advanced_ai_risk_lm-corrigible-less-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-corrigible-more-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-corrigible-more-HHH
+include: _template_yaml
+task: advanced_ai_risk_lm-corrigible-more-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-corrigible-neutral-HHH.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-corrigible-neutral-HHH
+include: _template_yaml
+task: advanced_ai_risk_lm-corrigible-neutral-HHH

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-myopic-reward.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-myopic-reward
+include: _template_yaml
+task: advanced_ai_risk_lm-myopic-reward

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-one-box-tendency.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-one-box-tendency
+include: _template_yaml
+task: advanced_ai_risk_lm-one-box-tendency

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-power-seeking-inclination.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-power-seeking-inclination
+include: _template_yaml
+task: advanced_ai_risk_lm-power-seeking-inclination

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-general-ai.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-self-awareness-general-ai
+include: _template_yaml
+task: advanced_ai_risk_lm-self-awareness-general-ai

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-good-text-model.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-self-awareness-good-text-model
+include: _template_yaml
+task: advanced_ai_risk_lm-self-awareness-good-text-model

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-text-model.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-self-awareness-text-model
+include: _template_yaml
+task: advanced_ai_risk_lm-self-awareness-text-model

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-training-architecture.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-self-awareness-training-architecture
+include: _template_yaml
+task: advanced_ai_risk_lm-self-awareness-training-architecture

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-training-nn-architecture.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-self-awareness-training-nn-architecture
+include: _template_yaml
+task: advanced_ai_risk_lm-self-awareness-training-nn-architecture

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-self-awareness-training-web-gpt.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-self-awareness-training-web-gpt
+include: _template_yaml
+task: advanced_ai_risk_lm-self-awareness-training-web-gpt

scripts/yans/lm-evaluation-harness/lm_eval/tasks/model_written_evals/advanced_ai_risk/lm-survival-instinct.yaml ADDED Viewed

	@@ -0,0 +1,4 @@

+# Generated by _generate_configs.py
+dataset_name: lm-survival-instinct
+include: _template_yaml
+task: advanced_ai_risk_lm-survival-instinct