2796gauravc
/

functiongemma-physics-onnx

2796gauravc commited on Dec 23, 2025

Commit

1ce014c

verified ·

1 Parent(s): 9343273

Change to Gemma v1 architecture for Transformers.js compatibility

Files changed (1) hide show

config.json CHANGED Viewed

@@ -1,18 +1,16 @@
 {
   "_sliding_window_pattern": 6,
   "architectures": [
-    "Gemma2ForCausalLM"
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
-  "attn_logit_softcapping": null,
   "bos_token_id": 2,
   "dtype": "bfloat16",
   "eos_token_id": [
     1,
     50
   ],
-  "final_logit_softcapping": null,
   "head_dim": 256,
   "hidden_activation": "gelu_pytorch_tanh",
   "hidden_size": 640,
@@ -39,17 +37,15 @@
     "full_attention"
   ],
   "max_position_embeddings": 32768,
-  "model_type": "gemma2",
   "num_attention_heads": 4,
   "num_hidden_layers": 18,
   "num_key_value_heads": 1,
   "pad_token_id": 0,
-  "query_pre_attn_scalar": 256,
   "rms_norm_eps": 1e-06,
   "rope_local_base_freq": 10000.0,
   "rope_scaling": null,
   "rope_theta": 1000000.0,
-  "sliding_window": 512,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.55.4",
   "use_bidirectional_attention": false,

 {
   "_sliding_window_pattern": 6,
   "architectures": [
+    "GemmaForCausalLM"
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
   "bos_token_id": 2,
   "dtype": "bfloat16",
   "eos_token_id": [
     1,
     50
   ],
   "head_dim": 256,
   "hidden_activation": "gelu_pytorch_tanh",
   "hidden_size": 640,
     "full_attention"
   ],
   "max_position_embeddings": 32768,
+  "model_type": "gemma",
   "num_attention_heads": 4,
   "num_hidden_layers": 18,
   "num_key_value_heads": 1,
   "pad_token_id": 0,
   "rms_norm_eps": 1e-06,
   "rope_local_base_freq": 10000.0,
   "rope_scaling": null,
   "rope_theta": 1000000.0,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.55.4",
   "use_bidirectional_attention": false,