ReactiveAI
/

RxT-Beta-Supervised

Text Generation

model_hub_mixin

pytorch_model_hub_mixin

🇪🇺 Region: EU

Model card Files Files and versions

AdamF92 commited on Feb 25

Commit

67acedf

·

verified ·

1 Parent(s): c3d88cd

Push model using huggingface_hub.

Files changed (2) hide show

config.json +7 -1
model.safetensors +1 -1

config.json CHANGED Viewed

@@ -25,6 +25,7 @@
     "num_shared_experts": 2,
     "rope_base": 100000,
     "router_amp": true,
     "self_att_type": "sqa",
     "seq_len": 8192,
     "shared_expert_dim": 384,
@@ -85,12 +86,17 @@
     "use_tanh_residual_gate": false
   },
   "memory_attention_variant": "grouped-self-interlayer",
   "tokenizer": null,
   "tokenizer_config": {
     "answer_token_id": 6,
     "bos_token_id": 2,
     "eos_token_id": 3,
     "pad_token_id": 0,
-    "query_token_id": 5
   }
 }

     "num_shared_experts": 2,
     "rope_base": 100000,
     "router_amp": true,
+    "router_dtype": "bfloat16",
     "self_att_type": "sqa",
     "seq_len": 8192,
     "shared_expert_dim": 384,
     "use_tanh_residual_gate": false
   },
   "memory_attention_variant": "grouped-self-interlayer",
+  "system_prompt_title": "SYSTEM INSTRUCTIONS",
   "tokenizer": null,
   "tokenizer_config": {
     "answer_token_id": 6,
     "bos_token_id": 2,
     "eos_token_id": 3,
+    "internal_token_id": 8,
     "pad_token_id": 0,
+    "query_token_id": 5,
+    "think_token_id": 7,
+    "tool_call_token_id": 9,
+    "tool_use_token_id": 10
   }
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d1bbeee16809db34a0e38fc699e6cde268609721885caa7d2b1feab25bab27e1
 size 6099558592

 version https://git-lfs.github.com/spec/v1
+oid sha256:432593c2cd1d4b547d599ba3768d89cc5b3b04b400bb28730020e5fa2f64b178
 size 6099558592