DeepXR
/

Helion-OSC

@@ -8,7 +8,7 @@
   "num_key_value_heads": 8,
   "intermediate_size": 18432,
   "hidden_act": "swiglu",
-  "max_position_embeddings": 16384,
   "initializer_range": 0.02,
   "rms_norm_eps": 1e-6,
   "use_cache": true,
@@ -16,10 +16,10 @@
   "bos_token_id": 1,
   "eos_token_id": 2,
   "tie_word_embeddings": false,
-  "rope_theta": 10000.0,
   "rope_scaling": {
     "type": "linear",
-    "factor": 2.0
   },
   "attention_bias": false,
   "attention_dropout": 0.0,

   "num_key_value_heads": 8,
   "intermediate_size": 18432,
   "hidden_act": "swiglu",
+  "max_position_embeddings": 262144,
   "initializer_range": 0.02,
   "rms_norm_eps": 1e-6,
   "use_cache": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
   "tie_word_embeddings": false,
+  "rope_theta": 10000000.0,
   "rope_scaling": {
     "type": "linear",
+    "factor": 32.0
   },
   "attention_bias": false,
   "attention_dropout": 0.0,