Upload 11 files

Browse files

Files changed (12) hide show

.gitattributes +5 -0
int4_cpu_block_32_accuracy_level_4/chat_template.jinja +47 -0
int4_cpu_block_32_accuracy_level_4/genai_config.json +52 -0
int4_cpu_block_32_accuracy_level_4/model.onnx +3 -0
int4_cpu_block_32_accuracy_level_4/model.onnx.data +3 -0
int4_cpu_block_32_accuracy_level_4/model_q4.onnx +3 -0
int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data +3 -0
int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data_1 +3 -0
int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data_2 +3 -0
int4_cpu_block_32_accuracy_level_4/special_tokens_map.json +33 -0
int4_cpu_block_32_accuracy_level_4/tokenizer.json +3 -0
int4_cpu_block_32_accuracy_level_4/tokenizer_config.json +0 -0

.gitattributes CHANGED Viewed

@@ -40,3 +40,8 @@ onnx/model_q4f16.onnx_data filter=lfs diff=lfs merge=lfs -text
 onnx/model_q4f16.onnx_data_1 filter=lfs diff=lfs merge=lfs -text
 onnx/model_q4f16.onnx_data_2 filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text

 onnx/model_q4f16.onnx_data_1 filter=lfs diff=lfs merge=lfs -text
 onnx/model_q4f16.onnx_data_2 filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text
+int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data filter=lfs diff=lfs merge=lfs -text
+int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data_1 filter=lfs diff=lfs merge=lfs -text
+int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data_2 filter=lfs diff=lfs merge=lfs -text
+int4_cpu_block_32_accuracy_level_4/model.onnx.data filter=lfs diff=lfs merge=lfs -text
+int4_cpu_block_32_accuracy_level_4/tokenizer.json filter=lfs diff=lfs merge=lfs -text

int4_cpu_block_32_accuracy_level_4/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,47 @@

+{{ bos_token }}
+{%- if messages[0]['role'] == 'system' -%}
+    {%- if messages[0]['content'] is string -%}
+        {%- set first_user_prefix = messages[0]['content'] + '
+' -%}
+    {%- else -%}
+        {%- set first_user_prefix = messages[0]['content'][0]['text'] + '
+' -%}
+    {%- endif -%}
+    {%- set loop_messages = messages[1:] -%}
+{%- else -%}
+    {%- set first_user_prefix = "" -%}
+    {%- set loop_messages = messages -%}
+{%- endif -%}
+{%- for message in loop_messages -%}
+    {%- if (message['role'] == 'user') != (loop.index0 % 2 == 0) -%}
+        {{ raise_exception("Conversation roles must alternate user/assistant/user/assistant/...") }}
+    {%- endif -%}
+    {%- if (message['role'] == 'assistant') -%}
+        {%- set role = "model" -%}
+    {%- else -%}
+        {%- set role = message['role'] -%}
+    {%- endif -%}
+    {{ '<start_of_turn>' + role + '
+' + (first_user_prefix if loop.first else "") }}
+    {%- if message['content'] is string -%}
+        {{ message['content'] | trim }}
+    {%- elif message['content'] is iterable -%}
+        {%- for item in message['content'] -%}
+            {%- if item['type'] == 'image' -%}
+                {{ '<start_of_image>' }}
+            {%- elif item['type'] == 'text' -%}
+                {{ item['text'] | trim }}
+            {%- endif -%}
+        {%- endfor -%}
+    {%- else -%}
+        {{ raise_exception("Invalid content type") }}
+    {%- endif -%}
+    {{ '<end_of_turn>
+' }}
+{%- endfor -%}
+{%- if add_generation_prompt -%}
+    {{'<start_of_turn>model
+'}}
+{%- endif -%}

int4_cpu_block_32_accuracy_level_4/genai_config.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+    "model": {
+        "bos_token_id": 2,
+        "context_length": 131072,
+        "decoder": {
+            "session_options": {
+                "log_id": "onnxruntime-genai",
+                "provider_options": []
+            },
+            "filename": "model.onnx",
+            "head_size": 256,
+            "hidden_size": 2560,
+            "inputs": {
+                "input_ids": "input_ids",
+                "attention_mask": "attention_mask",
+                "past_key_names": "past_key_values.%d.key",
+                "past_value_names": "past_key_values.%d.value"
+            },
+            "outputs": {
+                "logits": "logits",
+                "present_key_names": "present.%d.key",
+                "present_value_names": "present.%d.value"
+            },
+            "num_attention_heads": 8,
+            "num_hidden_layers": 34,
+            "num_key_value_heads": 4
+        },
+        "eos_token_id": [
+            1,
+            106
+        ],
+        "pad_token_id": 0,
+        "type": "gemma3_text",
+        "vocab_size": 262208
+    },
+    "search": {
+        "diversity_penalty": 0.0,
+        "do_sample": true,
+        "early_stopping": true,
+        "length_penalty": 1.0,
+        "max_length": 131072,
+        "min_length": 0,
+        "no_repeat_ngram_size": 0,
+        "num_beams": 1,
+        "num_return_sequences": 1,
+        "past_present_share_buffer": true,
+        "repetition_penalty": 1.0,
+        "temperature": 1.0,
+        "top_k": 64,
+        "top_p": 0.95
+    }
+}

int4_cpu_block_32_accuracy_level_4/model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e99f17762ecab7be245ba67505935fa3cee3f1ff7e88202de070eb162041e404
+size 432401

int4_cpu_block_32_accuracy_level_4/model.onnx.data ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d001b8457daf2db19c52bc86c1375066a0735dfb04e45e013320910807668bde
+size 2694922240

int4_cpu_block_32_accuracy_level_4/model_q4.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3b6f9ff5ee540f78391cf00fa322c385f3346b71bbf86288a23360f7a516fb8
+size 435957

int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf447bf9bfcb77356a24c386c08624f89bd629a4f1fc701083ed63099ef1d044
+size 1066170368

int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data_1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7036ee05471275273146477e94b99beb758d80fe9744c1a11e183b6ee842490
+size 1061683200

int4_cpu_block_32_accuracy_level_4/model_q4.onnx_data_2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3f06d912841e702aeb97070b62c0d394eb0492675fab4c2d57063ce3c0eb6b7
+size 566988800

int4_cpu_block_32_accuracy_level_4/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "boi_token": "<start_of_image>",
+  "bos_token": {
+    "content": "<bos>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eoi_token": "<end_of_image>",
+  "eos_token": {
+    "content": "<eos>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "image_token": "<image_soft_token>",
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

int4_cpu_block_32_accuracy_level_4/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4667f2089529e8e7657cfb6d1c19910ae71ff5f28aa7ab2ff2763330affad795
+size 33384568

int4_cpu_block_32_accuracy_level_4/tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff