allenai
/

OLMo-7B

@@ -3,7 +3,7 @@
   "alibi": false,
   "alibi_bias_max": 8.0,
   "architectures": [
-    "OlmoModelForCausalLM"
   ],
   "attention_dropout": 0.0,
   "attention_layer_norm": false,

   "alibi": false,
   "alibi_bias_max": 8.0,
   "architectures": [
+    "OLMoForCausalLM"
   ],
   "attention_dropout": 0.0,
   "attention_layer_norm": false,