Upload 7 files

Browse files

Files changed (3) hide show

chat_template.jinja +19 -9
config.json +7 -7
model.safetensors +2 -2

chat_template.jinja CHANGED Viewed

@@ -1,9 +1,9 @@
-{%- macro format_parameters(properties, required) -%}
     {%- set standard_keys = ['description', 'type', 'properties', 'required', 'nullable'] -%}
     {%- set ns = namespace(found_first=false) -%}
     {%- for key, value in properties | dictsort -%}
         {%- set add_comma = false -%}
-        {%- if key not in standard_keys -%}
             {%- if ns.found_first %},{% endif -%}
             {%- set ns.found_first = true -%}
             {{ key }}:{
@@ -65,7 +65,7 @@
                 {%- elif value is mapping -%}
                     {%- if add_comma %},{%- else -%} {%- set add_comma = true -%} {% endif -%}
                     properties:{
-                    {{- format_parameters(value, value['required'] | default([])) -}}
                     }
                 {%- endif -%}
                 {%- if value['required'] -%}
@@ -178,18 +178,21 @@
 {#- Handle System/Tool Definitions Block -#}
 {%- if (enable_thinking is defined and enable_thinking) or tools or messages[0]['role'] in ['system', 'developer'] -%}
     {{- '<|turn>system\n' -}}
     {#- Inject Thinking token at the very top of the FIRST system turn -#}
     {%- if enable_thinking is defined and enable_thinking -%}
         {{- '<|think|>\n' -}}
         {%- set ns.prev_message_type = 'think' -%}
     {%- endif -%}
     {%- if messages[0]['role'] in ['system', 'developer'] -%}
-        {{- messages[0]['content'] | trim -}}
         {%- set loop_messages = messages[1:] -%}
     {%- endif -%}
     {%- if tools -%}
         {%- for tool in tools %}
             {{- '<|tool>' -}}
@@ -198,7 +201,6 @@
         {%- endfor %}
         {%- set ns.prev_message_type = 'tool' -%}
     {%- endif -%}
     {{- '<turn|>\n' -}}
 {%- endif %}
@@ -302,6 +304,7 @@
                 {%- endfor -%}
             {%- endif -%}
             {%- if message['content'] is string -%}
                 {%- if role == 'model' -%}
                     {{- strip_thinking(message['content']) -}}
@@ -328,10 +331,14 @@
                     {%- endif -%}
                 {%- endfor -%}
             {%- endif -%}
         {%- if ns.prev_message_type == 'tool_call' and not ns_tr_out.flag -%}
             {{- '<|tool_response>' -}}
-        {%- elif not (ns_tr_out.flag and not message.get('content')) -%}
             {{- '<turn|>\n' -}}
         {%- endif -%}
     {%- endif -%}
@@ -340,5 +347,8 @@
 {%- if add_generation_prompt -%}
     {%- if ns.prev_message_type != 'tool_response' and ns.prev_message_type != 'tool_call' -%}
         {{- '<|turn>model\n' -}}
     {%- endif -%}
 {%- endif -%}

+{%- macro format_parameters(properties, required, filter_keys=false) -%}
     {%- set standard_keys = ['description', 'type', 'properties', 'required', 'nullable'] -%}
     {%- set ns = namespace(found_first=false) -%}
     {%- for key, value in properties | dictsort -%}
         {%- set add_comma = false -%}
+        {%- if not filter_keys or key not in standard_keys -%}
             {%- if ns.found_first %},{% endif -%}
             {%- set ns.found_first = true -%}
             {{ key }}:{
                 {%- elif value is mapping -%}
                     {%- if add_comma %},{%- else -%} {%- set add_comma = true -%} {% endif -%}
                     properties:{
+                    {{- format_parameters(value, value['required'] | default([]), filter_keys=true) -}}
                     }
                 {%- endif -%}
                 {%- if value['required'] -%}
 {#- Handle System/Tool Definitions Block -#}
 {%- if (enable_thinking is defined and enable_thinking) or tools or messages[0]['role'] in ['system', 'developer'] -%}
     {{- '<|turn>system\n' -}}
     {#- Inject Thinking token at the very top of the FIRST system turn -#}
     {%- if enable_thinking is defined and enable_thinking -%}
         {{- '<|think|>\n' -}}
         {%- set ns.prev_message_type = 'think' -%}
     {%- endif -%}
     {%- if messages[0]['role'] in ['system', 'developer'] -%}
+        {%- if messages[0]['content'] is string -%}
+            {{- messages[0]['content'] | trim -}}
+        {%- elif messages[0]['content'] is sequence -%}
+            {%- for item in messages[0]['content'] -%}
+                {{- item['text'] | trim + ' '-}}
+            {%- endfor -%}
+        {%- endif -%}
         {%- set loop_messages = messages[1:] -%}
     {%- endif -%}
     {%- if tools -%}
         {%- for tool in tools %}
             {{- '<|tool>' -}}
         {%- endfor %}
         {%- set ns.prev_message_type = 'tool' -%}
     {%- endif -%}
     {{- '<turn|>\n' -}}
 {%- endif %}
                 {%- endfor -%}
             {%- endif -%}
+            {%- set captured_content -%}
             {%- if message['content'] is string -%}
                 {%- if role == 'model' -%}
                     {{- strip_thinking(message['content']) -}}
                     {%- endif -%}
                 {%- endfor -%}
             {%- endif -%}
+            {%- endset -%}
+            {{- captured_content -}}
+            {%- set has_content = captured_content | trim | length > 0 -%}
         {%- if ns.prev_message_type == 'tool_call' and not ns_tr_out.flag -%}
             {{- '<|tool_response>' -}}
+        {%- elif not (ns_tr_out.flag and not has_content) -%}
             {{- '<turn|>\n' -}}
         {%- endif -%}
     {%- endif -%}
 {%- if add_generation_prompt -%}
     {%- if ns.prev_message_type != 'tool_response' and ns.prev_message_type != 'tool_call' -%}
         {{- '<|turn>model\n' -}}
+        {%- if not enable_thinking | default(false) -%}
+            {{- '<|channel>thought\n<channel|>' -}}
+        {%- endif -%}
     {%- endif -%}
 {%- endif -%}

config.json CHANGED Viewed

@@ -29,22 +29,22 @@
     "global_head_dim": 4,
     "head_dim": 4,
     "hidden_activation": "gelu_pytorch_tanh",
-    "hidden_size": 8,
     "hidden_size_per_layer_input": 0,
     "initializer_range": 0.02,
-    "intermediate_size": 32,
     "layer_types": [
       "sliding_attention",
       "full_attention"
     ],
     "max_position_embeddings": 262144,
     "model_type": "gemma4_text",
-    "moe_intermediate_size": 704,
-    "num_attention_heads": 16,
-    "num_experts": 128,
     "num_global_key_value_heads": 2,
     "num_hidden_layers": 2,
-    "num_key_value_heads": 8,
     "num_kv_shared_layers": 0,
     "pad_token_id": 0,
     "rms_norm_eps": 1e-06,
@@ -61,7 +61,7 @@
     },
     "sliding_window": 1024,
     "tie_word_embeddings": true,
-    "top_k_experts": 8,
     "use_bidirectional_attention": "vision",
     "use_cache": true,
     "use_double_wide_mlp": false,

     "global_head_dim": 4,
     "head_dim": 4,
     "hidden_activation": "gelu_pytorch_tanh",
+    "hidden_size": 32,
     "hidden_size_per_layer_input": 0,
     "initializer_range": 0.02,
+    "intermediate_size": 64,
     "layer_types": [
       "sliding_attention",
       "full_attention"
     ],
     "max_position_embeddings": 262144,
     "model_type": "gemma4_text",
+    "moe_intermediate_size": 64,
+    "num_attention_heads": 4,
+    "num_experts": 4,
     "num_global_key_value_heads": 2,
     "num_hidden_layers": 2,
+    "num_key_value_heads": 2,
     "num_kv_shared_layers": 0,
     "pad_token_id": 0,
     "rms_norm_eps": 1e-06,
     },
     "sliding_window": 1024,
     "tie_word_embeddings": true,
+    "top_k_experts": 2,
     "use_bidirectional_attention": "vision",
     "use_cache": true,
     "use_double_wide_mlp": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c2b289ede1a508a657d4a923e3fd4c45403359563e5bd9a6805cf539f5f512f
-size 26068504

 version https://git-lfs.github.com/spec/v1
+oid sha256:4492347ed73c791a7ae27b42ef4380ec85e3123aa341e8c23f72b20acf3dcc12
+size 34167464