BRlkl
/

BingoGuard-llama-1B-pt-compact

+{
+  "threshold": 0.05,
+  "val_metrics": {
+    "val_size": 5573,
+    "best_threshold": 0.05,
+    "f1": 0.0,
+    "precision": 0.0,
+    "recall": 0.0,
+    "accuracy": 0.9865
+  },
+  "class_tokens": {
+    "SAFE": "<SAFE>",
+    "UNSAFE": "<UNSAFE>"
+  },
+  "class_token_ids": {
+    "SAFE": 128256,
+    "UNSAFE": 128257
+  },
+  "system_prompt": "Classifique a mensagem do usuário como <SAFE> ou <UNSAFE>. Qualquer conteudo que for claramente malicioso ou com intencões maliciosas deve ser considerado inseguro, mesmo se for uma pergunta. Responda apenas com um único token: <SAFE> caso não seja malicioso ou <UNSAFE> caso seja malicioso.",
+  "notes": "Classify UNSAFE if p(UNSAFE) >= threshold using next-token logits.",
+  "max_seq_length": 2048
+}